妙通輸入法(harvo哈佛)的內涵,譬之宮牆,牆高數仞,不得其門而入,不見宗廟之美,百官之富。本篇要藉著,對妙通檔案所作的各項統計資料的分析,讓您能窺見它的美好。
現在,我們就來看看,妙通輸入法的選字率﹑同碼字數﹑字碼數﹑各種取碼法所佔比例及未來展望等各項精彩內容。
第一節 目前harvo1.txt檔案各項分析數據
目前為滿足大家的需求,harvo1檔案內,字數已擴充至17,054個(內含115個詞彙),單純字元為16,939個。其中,出現9,567個同碼字,選字率增為56.48﹪。比例雖然稍高,但免選字數(含符號﹑語詞)仍然高達7,372個,這還是令人驚艷的一項數據。
輸入碼發生同碼的狀況,字數為兩字者,並未超過半數,所占百分率為38.07﹪。然四字以內者,所佔比例仍高達73.59﹪,而一頁就能顯示的九字以內同碼字,所佔比率為93.94﹪。同碼字數最多為20個,但只有三組。這仍是妙通輸入法本質結構,最美妙所在之處。
一﹑選字率﹑同碼字百分率之分析
表一 harvo1.txt選字率﹑與同碼字百分率統計表
(16,939漢字﹑字形與符號,同碼字數為9,567字。)
百分率甲:選字率(如3,642∕16,939=21.50﹪)
百分率乙:同碼字數百分率(如3,642∕9,567=38.07﹪)
同碼
字數 |
組 數
|
總字數
|
百分率甲﹪
|
百分率乙﹪
|
2
|
1.821
|
3,642
|
21.50
|
38.07
|
3
|
682
|
2,046
|
12.08
|
21.39
|
4
|
38
|
1,352
|
7.98
|
14.13
|
5
|
144
|
720
|
4.25
|
7.52
|
6
|
82
|
492
|
2.90
|
5.14
|
7
|
48
|
336
|
1.98
|
3.51
|
8
|
32
|
256
|
1.51
|
2.68
|
9
|
16
|
144
|
0.85
|
1.50
|
10
|
8
|
80
|
0.47
|
0.84
|
11
|
9
|
99
|
0.58
|
1.04
|
12
|
5
|
60
|
0.35
|
0.63
|
13
|
7
|
91
|
0.54
|
0.95
|
14
|
4
|
56
|
0.33
|
0.58
|
15
|
2
|
30
|
0.18
|
0.31
|
16
|
2
|
32
|
0.19
|
0.33
|
17
|
2
|
34
|
0.20
|
0.36
|
18
|
1
|
18
|
0.11
|
0.19
|
19
|
1
|
19
|
0.11
|
0.20
|
20
|
3
|
60
|
0.36
|
0.63
|
合 計
|
3,207
|
9,567
|
56.48
|
100.00
|
二﹑同碼字內涵
表二 harvo1.txt五字以上同碼字索引
表二 harvo1.txt五字以上同碼字索引
同碼
字數
|
組 數
|
每 組 代 表 字
|
5
|
144
|
諄讓甑謀竟誕諂炆炊瘡 啇旛施官宜喃醍硯矻礁
郙鵲哲鳷郝攻轅噬啣哈 逐呴咯玟耿聽珪璜瑰玖
喲惠蚊虹苀蔽見苦苤募 萼茱芢茶苟蒮踱躑踝蔚
中俯閨閑僑佫埂填堤袋 箝等箕鰻篠簽皜舖鎮帛
皓錼鈸愁先告乘白鐲狄 獨釸耨稚牯逢久腰惦杭
愀榕構楔樞杖枚槌抗掽 拌揶摳揪托拾撚注涼瀉
淀演潔漸淢港潦減漠沃 滊洛渙澱泥襟子ㄑ紋繕
縛縹線姣。
|
6
|
82
|
祖祅語謹課話焙炬煙燥 親熄魂砝碟吠遭嘴顛耶
嗯喂鷯欺珼志太杏蛄蒂 獸芰花藥思位依問籬鉉
鎬黏算穌鋪釭合德稞兌 矮鼯昏兟脯核慢悔樣榑
梜棉松抆挖振抓擔灣淡 渼沖況活澮漏縟縵縲嫩
媒嫚。
|
7
|
48
|
音咬醇醴春瑁昔更菠蝶 蔗蠍螅蛛凸晡暑時卡葉
茂墓英萸踮佰促培堵鯁 鍍錈鈺欲鋇猥稽械桂檣
拔括沆溢潭泥如娛。
|
8
|
32
|
炳煜酵哺軸黯藝蓋草蔓 薇躂過便箸籃籟鏝留悟
校懼枳橋捕操江沾浬袖 練姑。
|
9
|
16
|
啍吱唱正落茭供侶保等 鍊銖槁摃汴潮。
|
10
|
8
|
殂距傳鰓扣提汰漫。
|
11
|
11
|
薑萬蔥各慎技法濁細。
|
12
|
5
|
釦柄柚措渡。
|
13
|
7
|
噴菩日名拉漱澡。
|
14
|
4
|
蝸占值枝
|
15
|
2
|
蓮短。
|
16
|
2
|
和游。
|
17
|
2
|
嗜錯。
|
18
|
1
|
滿。
|
19
|
1
|
苗。
|
20
|
3
|
植酒油。
|
三﹑字碼數統計
表三 harvo1.txt字碼數統計表
從表列數字得知,單碼的總計38個,其中漢字只有一﹑乙兩個字而已。其餘,自然都是字形﹑字母和符號了。harvo1檔案內容,每個字平均取碼數為4.54碼。
表三 harvo1.txt字碼數統計表
字 碼 數
|
字 數
|
百 分 率﹪
|
1
|
38
|
0.22
|
2
|
295
|
1.74
|
3
|
707
|
4.17
|
4
|
5,438
|
32.10
|
5
|
10,464
|
61.77
|
合 計
|
16,939
|
100.0
|
四﹑各種取碼法字數統計
表四
harvo1.txt取碼法字數統計表
~
|
字 數
|
百分率 ﹪
|
字根取碼法
|
576
|
3.48
|
部首取碼法
|
7,508
|
45.32
|
分離取碼法
|
8,483
|
51.20
|
合 計
|
16,567
|
100.00
|
harvo1.txt的檔案內,總共收錄17,054筆,包含了數學運算符號﹑其他特殊符號﹑繪圖符號﹑日文字母﹑希臘字母等372個,詞彙115個,用到取碼法的單字(含字形)為16,567個。
第二節 妙通輸入法(harvo哈佛)的演進歷程
一﹑妙通輸入法第一代
本輸入法第一代是用二十六個字母輸入的,所建立的harvo.box檔案,共收錄6,627字(含152個容錯雙碼字)共出現2,311個同碼字,選字率為34.87﹪免選字數高達4,317字,同碼字結構分析,兩字者佔52.8﹪四字以內者所佔比率高達87.2﹪同碼字數最多為10個,但只有一組(代表字為拉)。
二﹑妙通輸入法(harvo哈佛)第二代
到了第二代,演進成只用十五個字母輸入。第二最早所建立的harvo.box檔案分為標準版和大眾版兩種版本。兩者的差別只在大眾版內容多了容錯字。
(一)第二代最早所建立的harvo.box檔案,分為標準版和大眾版兩種版本。兩者的差別只在大眾版內容多了容錯字。標準版收錄6,941字(含23個詞彙﹑180個符號。),出現2,776個同碼字,選字率約為34.60 ﹪。比例雖然稍高,但免選字數(含符號﹑語詞)竟高達4,165個,這才是令人驚訝的一項數據。一種以大眾化為導向的輸入法,能有這樣的素質,無寧說是奇蹟!
(二)後來,harvo.box檔案擴充字數,共收錄7,233字(含115個容錯字﹑367個字母與符號﹑21個詞彙)。出現2,817個同碼字,選字率略升為38.95﹪。免選字數仍高達4416字。同碼字數為兩個者依然超過半數,佔52.7﹪。四字以內者,所佔比率還是高達86.1﹪同碼字數最多為11個字,但只有4組(代表字為苗﹑拉﹑潮﹑滿等四字)。
(三) 接著,harvo.txt(以Big5編碼)檔案建立,收錄的字擴充到13,051字後,出現7,243個同碼字,選字率驟升為55.4﹪。比例雖然比原先檔案收錄7,233字時的38.9﹪高出許多,但免選字數仍有5,808個,這才是令人驚訝的一項數據。大眾版是再加上1,144個字容錯而成,選字率又上升為60﹪,但對初學者而言,多少會降低學習難度。一種以大眾化為導向的輸入法,在擴充字數為原來的將近兩倍之後,還能保有這樣的素質,無寧說是奇蹟!
(四)如今,harvo1.txt檔案,以Unicode編碼,字數擴充至17,057個,選字率反從60﹪降為56.72﹪,原先存著一再擴充字數會使選字率弱化的疑慮,悉盡釋懷!
三﹑妙通輸入法與行動電話﹑錄影機的關係
因為妙通輸入法的漢字輸入,實質上與英文打字一致,所以無需再做與數字間特別的專屬對應,直接用目前手機﹑錄影機或其他家電用品上面的英文字母與數目字的對應關係即可。妙通輸入法若得順利推展,將來應用到一般家電,必是一項大利多。
四﹑電腦鍵盤右側數字鍵的應用
如果,使用者有特殊必要只用到鍵盤右側的數字鍵輸入漢字的話,這裡有妙通輸入法各輸入鍵使用頻率統計資料,提供需要者參考。或許針對5,000字左右的常用字,用下表的對應方式自行編成harvo.txt純文字的對照檔案,再用Windows等軟體提供的通用輸入法編輯精靈,安裝使用。
表五 妙通輸入法按鍵率與數字對應表(以13,051字為基準)
輸入鍵碼
|
A
|
B
|
C
|
D
|
E
|
F
|
G
|
J
|
H
|
N
|
M
|
T
|
R
|
V
|
Y
|
按鍵率﹪
|
11.5
|
16.8
|
4.0
|
9.4
|
3.7
|
11.7
|
6.5
|
4.3
|
3.4
|
6.0
| |||||
排 名
|
三
|
一
|
八
|
四
|
九
|
二
|
五
|
七
|
十
|
六
| |||||
對應數字
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
0
|
9
|
9
|
8
|
6
|
0
|
8
|
7
|
沒有留言:
張貼留言