98版五筆字型與86版五筆字型的區別
必須指出,雖然WM9801種的老版本(86版)與其他五筆字型老版本的單個漢字與詞組編碼規則是完全壹樣的,但86版具有“抓屏造詞”與“即造即用”等功能,又可以方便地維護詞庫與碼表。所以,使用老版本的用戶應該把正在用的五筆老版本升級成WM9801中的86版。
首先,王碼可以輸入繁體字。中國的漢字千千萬萬,康熙字典收入了47000多個漢字,漢字到底有多少恐怕就是文字學家也說不清,但萬事不能沒有壹個“底”,於是就得人為地確定壹個“底”,所以就有了幾種流行的字符集,最標準的就是GB國標簡體字,***有6763個字,在我國大陸的現代生活中這6763個字已經夠用了,我國文字專家通過對7075篇現代文章的2162萬漢字的統計,壹***也只發現了漢字6300個(引用)。我們現在大量使用的多種輸入法,大都只能輸入這6763個字,當然86版的五筆字型也只能輸入這些字。
不過事情有時不那麽簡單,有些字妳可能天天碰到,但卻打不出來,這大都是因為壹些人名造成的,像“朱镕基”的“镕”,還有“馮喆”的“喆”,還有“弨”、“堃”等等,因為這些字都是GB國標以外的漢字。目前流行的絕大多數的輸入法對它們都無能為力(全拼和標準鄭碼等除外)。作為專業輸入的龍頭老大,五筆字型是基於國標簡體字而發明的,字根的設置在當時沒有考慮到繁體漢字。而五筆字型的新兄弟“98王碼”,卻在五筆字型的基礎上僅僅作了壹點修改就可以簡單地處理這些字了,甚至可以處理CJK大字符集的21003個漢字(這個字符集包含了古字和韓國、日本等國的壹些漢字),所以即使妳是個不識簡體字的同胞,也可以通過王碼輕而易舉地輸入繁體漢字了。
第二,碼元的設置更科學。五筆字型輸入的基本原理就是通過字根的“拼裝”組成漢字,98王碼則把字根稱為碼元,其意思是壹樣的。為了便於記憶,五筆字型把漢字筆劃分為五大類(所以叫五筆字型),並把有同樣或相似筆劃的字根安排在這五大區裏。但是妳會發現像“力”、“幾”等字根安排在了“豎”區內,不十分科學,而王碼則把它們安排在了“撇”區,合理多了;“×”(叉)這個字根使用頻率很高,但五筆字型把它安排在“Q”鍵上,所以在用五筆字型打字時,左手的小指會很頻繁,這是不符合鍵盤使用規律的,同時也造成了壹些重碼字。同樣,“乃”、“舟底”、“臼”、“荒底”等字根也換到了合理、容易記憶的位置上。
還有,王碼刪除了少量不十分有用的字根。像五筆字型中有壹個“戔”的字根,錢、線、箋等字都要由它組成,不過“戔”可以用“壹”和“戈”兩個現成字根簡單地組成,所以在王碼中這個字根被去掉了。
同時,王碼增加了大量的有用的字根,像“夫”,有了它使得潛、扶、年、制等字特別好打;有了“甫”,使得浦、鋪、簿、敷等字變得十分容易打;有了“甘”、“丘”、“未”、“母”、“皮”、“戊”……不用看,有了這些字根使得許多字變得更易於理解了,字根也看得更清晰了。五筆字型壹***有字根130個,王碼達到了245個,更難能可貴的是仔細研究後會發現,這些字根都是繁體字的重要組成部分,使得王碼可以輕松處理繁體字。另外,這些有用的字根的出現,使得重碼字減少,像五筆字型中出現最多的重碼字是YNKY有“贏、嬴、蠃、羸”四個字,而在98王碼中,這四個字則不重碼。98王碼的重碼字比五筆字型要少。
第三,“組”字的方法更為合理,更加考慮對文字的第壹直觀。作為壹種筆型輸入法,“組”字的方法有很多,比如壹個“養”字,筆者可以用七種方法來拆分它,每壹種都可以說出道理來,但只有壹種是正確的,所以五筆字型規定了自己的拆字的規則和習慣,不過五筆字型由於發明時間早,所以在拆字有很多不科學之處。
像離、腦等字,規範地講是“亠”和“×”的結合,並不是壹個“文”字,但五筆字型卻將它理解為“文”,嚴格地講是不科學的。
像“曳”字,學五筆字型的人都會在這個字上“走彎路”,很少有人能“看出”這是“日”和“匕”的結合,而在98王碼中,“曳”的組合方法就科學得多。
“余”這個常用字,和它配合又能組成不少字,但它的下面並不是壹個“禾”字,而是“壹”和“木”的組合。
“越”是個常用字,但是要把它理解成“土”、“止”、“右框”、“丿”總有些別扭。
“兼”字,要理解為“亦底”,沒有壹定的“水平”也看不出來。還有“醜”的下面也不是壹個“土”。“予”的下面怎麽也看不出是個“卩”底。
“延”字,是壹個幾乎每個人都容易寫錯的字,五筆字型把它理解為是“丿”和“止”,恰恰是錯的,作為小學生,這個字千萬註意不要寫錯。
漢字中的兩個常用字“像”和“象”,中間都取了“日”字碼,這本身無可厚非,要這樣理解也可以,發明人可以有這樣的“權力”。但同型字“免”、“兔”和“逸”等,中間卻取了“口”字碼,初學五筆字型的人在這裏都會“犯錯”。
再看壹些細節上的,“求”的選碼,兩種版本不壹樣,98版選的是“壹”、“水”、“點”,86版選的是“十”、“四點”、“點”,從發明人的角度看,哪壹種都可以,不過五筆字型有壹個規律,就是第壹碼和第二碼有多種選擇時,往往是“壹小二大”,比方“生”第二碼不是“土”而是“青頭”;“來”選“米”而不選“木”;“不”第二碼也是選“小”……,所以從規律上看98版更科學。
從取碼的壹致性上,86版也有問題,“萬”字有三個重碼字,如果認為這樣取碼是正確的話,那麽像“敖”之類的字理解起來就有壹定的困難,它的取碼和“萬”的思路不壹樣,初學者會走彎路。
98王碼有些簡化帶來很大方便,五筆字型的高手最容易出現的錯誤是像“即”、“退”、“既”等字,因為這幾個字分別是“VC”或“VE”,但壹旦盲打快了,很容易錯,98王碼將兩種並成了壹種,決不會出現錯誤。
五筆字型的組字取碼甚至有“錯誤”的現象出現。像“靨”字,毫無疑問,這個字的下面是壹個“面”字,在五筆字型中“面”字的取碼被規定為“廠”、“冂”、“丨丨”和“三”。如果這樣取碼的話,“靨”字的最後壹碼應該是“三”,但是這樣妳會發現“靨”字就和鍵名漢字“大”重碼,由於鍵名漢字是不能有重碼的,所以五筆字型就只好規定了“靨”的最後壹碼為“囗”(L)。
“蔻”字也常用到,筆者的壹個同事的名字就有這個字。但不知是為了避免和“莞”字重碼,還是避免和“勞動”兩字重碼,五筆字型也人為地將“蔻”的最後壹碼定在了“囗”(L)上。的確這樣做重碼字少了,但這樣人為的規定就影響了五筆字型的科學性、壹致性。如果妳有興趣鉆研壹下所有的五筆字型編碼字典,有相當壹部分都另外標出了這些字正確的取碼,包括王永民自己編寫的《王碼字典》“靨”和“蔻”也分別標明的是“DDDD”和“APFC”,但如果妳這樣打的話是打不出這兩個字的。
其實,在五筆字型裏“囗”(L)這壹碼是另有特殊意義的,筆者研究了許多版本的五筆字型,在早期版本裏,像在2.2版,為了避免重碼,很多常用字是靠“囗”碼來區分的,像“風和岡”、“去、支和雲”、“仁和仕”、“太和丈”、“半和鬥”等等;後來王永民是采用“默認第壹字,空格鍵取第二字”的方法來區分的,像4.0版和4.5版。但仍有壹些沒有改,就是“靨”、“蔻”,即使是目前十分流行的“五筆字型教材”,也都沒有指出“囗”的特殊意義和這幾個特殊字的打法,更沒有說明為什麽這樣打。當然話又說回來,即使王永民錯了也只好“將錯就錯”,妳所要做的就是記住,因為妳用正確的取碼方法反而打不出這幾個字。(筆者新註:這段從今天筆者的感受來看,有些偏頗)
其它還有像“樂”、“烏”、“輿”、“戍”、“闌”、“鳥”、“行”、“步”、“束”、“凹”、“段”、“追”、“凸”等等壹些字,這些字在五筆字型中的“組”字方法或是不十分準確;或是難以理解,不過這些在98王碼中都得到了很好的改正,使之更加完善科學,更加兼顧了對漢字的直觀理解。(筆者新註:此處筆者對原文有簡化)
更難能可貴的是王碼特別註意了筆劃順序,對於成年人來說,強調漢字的筆順好像沒什麽必要,但對於中小學生來說,養成壹個良好的筆順習慣卻很重要,中考壹定有壹道考筆順的題目,查閱工具書沒有正確的筆順也不行。五筆字型因為發明時間較早,為了組字而去硬“湊”字根,從而形成了壹些倒筆劃,所以五筆字型不十分適合小學生學習。
像“非”的筆順應該是“丨”、“三”、“丨”、“三”,五筆字型中是“三”、“丨丨”、“三”。
像“桃”的正確筆順是“木”、“兒”、“四點”,但五筆字型是以“從左至右”的取碼為原則,就彎成了“木”、“四點”、“兒”的倒筆順了。
像“瓦”字,末筆應該是“丶”。但在五筆字型中卻是“乙”。
另外,五筆字型本身的取碼順序也不壹致,像“率”是“亠”、“糸”、“四點”和“十”組合,先取了中間的“糸”,但“燕”又是“艹”、“ 兩點”、“口”、“四點”的組合,先取了旁邊的“兩點”,取碼的順序前後矛盾,沒有壹個前後壹致的統壹規範。98王碼改正了早期五筆字型為“湊”字根而引起的不必要的倒筆劃,所以98王碼“開創了將漢字輸入法大規模納入中小學教學的新局面,標誌著我國漢字輸入技術進入了壹個新的歷史階段。”(王永民原話)
第四,使“補碼”更加完善。“補碼”是五筆字型的精華所在,是減少重碼,加快漢字盲打速度的最聰明的辦法,應該說是王永民的智慧結晶。“補碼”對不足四碼的漢字以漢字的“上下”、“左右”和“組合”三種結構為原則,規定了壹些取碼方法。
但是應該說王永民在86年五筆字型發明的時候,補碼的取碼原則還不是十分完善,像“君”、“乏”等無論怎麽看“上下”結構要比“組合”結構要更合適壹點,同時也使“君”和“群”避開了重碼。
“虧”字是常用字,沒有補碼打不出來,五筆字型認為這是個“三型”字,但要把它理解為“組合”結構的“三型”字總好像有些困難。
像“我”字的末筆在五筆字型中規定為“丿”,但是同樣有壹點的“甫”的末筆又是“丶”而不是“壹”,這是因為五筆字型規定了“戈”、“成”、“戊”、“戔”等的最後壹筆為“丿”,而其它結構的字卻不作這樣的規定造成的。
同時五筆字型還規定了“刀”、“九”、“匕”、“七”、“力”、“乃”等等字的末筆為“乙”。但如果妳真這麽理解的話,同型字“刃”字的末筆又是“丶”。所以許多初學者對於補碼是大感頭痛,連教五筆的老師都認為補碼最講不清楚,甚至可以這麽說,連王永民自己都不能“自圓其說”。
這裏筆者再仔細分析壹下:比方說,“亍”字沒有補碼打不出來,而“亍”的補碼五筆字型中定為“三型”,但同樣的壹類字“亓”字,沒有補碼也打不出來,但五筆字型中卻把“亓”字定為“二型”,當然這是因為“三型”是壹個常用字“井”,可能是王永民為了避開重碼而作出的規定,那為什麽同樣道理的重碼字“君”和“群”不用同樣的規定分開呢(而98王碼把這兩個問題解決得非常巧妙)?如果大家有興趣鉆研壹下王永民自己寫的“最權威”的五筆字型專著《王碼字典》裏,關於補碼這壹章,除了幾項特殊規定外,其余寫得很“含糊”,這就使得初學者甚至是高手無所適從,“無法可依”。所以有的五筆字型的教材上甚至寫:“對於五筆字型的取碼,妳不要去考慮為什麽,妳只要去花時間記住就可以了……”
但是這壹切在王永民的“98王碼”中用了壹句話就迎刃而解,“補碼的取碼就取這個字筆劃的最後壹筆”,多麽簡單啊!可見王永民在十年中,對五筆字型的成功和不足是十分清楚的,但五筆字型的市場占有率太高了,有許多的高手,已經不允許再作調整和修改了,而這壹切的問題都只能在“98王碼”中壹並解決了。
第五,簡碼的考慮更加完美。五筆字型和王碼中有25個壹級簡碼字,就是說像“的”、“壹”、“中”、“國”、“主”、“產”、“不”、“為”、“工”等等只按壹下鍵盤就可打出。同時又有大量的二級簡碼字,就是說只按兩下鍵盤就可打出這個字。對於打字高手來說,完全掌握壹、二級簡碼是提高速度的主要手段。
86版的五筆字型中王永民是以初學者為中心,所以有些簡碼設計得不完美。像在“U”鍵上,壹級簡碼是“產”,但“UT”的二級簡碼還是“產”,這樣就使得“道”這樣壹個高頻字的二級簡碼被人“占”了,而“道”的三級簡碼又是“首”,所以“道”字要四鍵才能打出。
“已”是壹個高頻字,但在五筆字型中要四筆打出,因為在“N ”鍵上,“憶”字占了兩個,而在98王碼中“已”字只要兩擊就能打出。
“S”鍵上壹擊和“SV”兩擊都是“要”字,那麽另壹個高頻字“根”字要三筆才能打出。
“P”鍵上壹擊和“YP”兩擊都是“這”,那麽“亮”字的位置就被占了。
在“I”鍵上的是最常用的字之壹“不”(五筆字型和98王碼“不”字的取碼也不壹樣),但是它的二級簡碼“GI”還是“不”字,這樣處理使得“還”這個常用字要三鍵才能打出(98王碼在這些地方設計得就巧妙得多)。這可以說是壹種資源浪費。
98王碼在簡碼處理上的壹些細微改進也是頗具匠心的,舉壹個例子:“關”和“頭”兩個字前兩碼都是UD,作為二級簡碼是選“關”呢?還是選“頭”呢?應該說很難說出這兩個字哪壹個出現的頻率高,但是與“關”組成的詞像“關鍵”、“機關”、“關門”、“關頭”、“關心”、“關切”等等都可以用“連打”直接打出,而“頭”字可組成的“連打詞”則很少,只有像“頭腦”、“心頭”等等幾個。86版五筆字型這裏的二級簡碼選的是“關”,而98王碼選的是“頭”,雖然只是壹個字的差別,但其中的滋味是很可以體味的,王永民在98王碼中簡碼字“資源”的利用已經到了細致入微的地步。
由於86版的五筆字型的簡碼字已被人“鉆研透了”,王永民已經到了“騎虎難下”的地步,自己也無法對86版的五筆字型的簡碼字進行修改了。而“98王碼” 使王永民終於有機會對這壹切進行修正,86版的二級簡碼字有570個左右,98版的二級簡碼有620個左右,三級簡碼字就更多了,使得簡碼資源得到合理利用。
當然,高標準的看,應該說98王碼的簡碼字的有些改變反而不好,比如原來的二級簡碼“曾”現在改成了“閘”;“張”現在改成了“鄉”, “進”字在98版中是“刊”,單從筆者的使用頻率來看,“曾”和“張”、“進”都要比“閘”和“鄉”、“刊”要高。好在類似的改變非常少。也有壹些字的修改是“迫不得已”,像高頻字“列”,86版只有兩筆,但98中被“萬”占了,只好三筆打出了,
第六,連打詞更符合時代感。五筆字型要提高鍵入的速度另壹個很重要的因素就是連打詞的運用。短到“我們”、“鄧小平”等;長到“中央人民廣播電臺”、“北大西洋公約組織”等都可以只用四鍵就打出來。五筆字型自身已經替妳“安排”了壹些連打詞(大約有壹萬五千個左右)。隨著時代的發展,這些安排好的連打詞有些已經不常用了,像“克格勃”、“斯大林”、“姚依林”、“高幹”、“政審”、“左傾”、“右傾”、“探親假”、“黨的十壹屆三中全會”等,98王碼去除了這些不常用的詞,同時又增加了壹些富有時代感的詞,像“再婚”、“斡旋”、“上崗”、“簽約”、“媒體”、“社區”、“休閑”、“超市”、“投資公司”、“技術監督局”等等壹大批,使連打詞更有現代感。同時,多字連打詞大量增加,“螳螂捕蟬黃雀在後”、“聯產承包責任制”、“黨和國家領導人”、“北大西洋公約組織”、“科學技術委員會”,包括最長的壹個由十四個字組成的詞――“香港特別行政區行政長官董建華”等都可以四筆打出,如果有興趣對比壹下“五筆字型4.5版”和“98王碼”的“多”字連打詞的話,會發現“98王碼”要比“五筆字型4.5版”的多字連打詞(是指四字以上的詞組)多大約六、七倍,大大加快了漢字的輸入速度。如果妳的王碼是可以造詞的話,這個問題還不十分突出,因為妳可以自己造,但妳用的是捆綁的五筆字型,不能自己造的話,那妳是會十分痛苦的。當然98王碼有些詞也沒有,像“再見”,這可能王永民故意的,如果不是正版不能造詞的話就不行,這只有自己想辦法了。
最後,我們應該看到,五筆字型已經流行了十幾年了,而98王碼從問世到現在也只有壹年多的時間,98王碼的社會使用率在壹段時間內不可能超過五筆字型,而且學五筆字型的人還在大量增加,更多的人還是不明白五筆字型和王碼的區別。所以筆者建議,想學五筆字型但現在還不會五筆字型輸入法的人必須以學習98王碼為主;小學生只能學習98王碼;會五筆字型但學得不好的人,覺得五筆字型有點難不易掌握的人,盡快改學98王碼;而那些五筆字型輸入水平頗高,甚至是高手的人就不必再改學王碼了,因為高水平的五筆字型使用者對於字根的理解、拆字的規律、連打詞的安排都要重新學習,這樣做大約要壹個星期的時間適應,方法是把漢字中關鍵的625個字,甚至是GB6763個字用98王碼全部打壹遍,筆者就是用這種方法熟練掌握了兩種“不同的五筆字型”的,但是在改變的初期還是會感到不便,而改變後在相當長的壹段時期內不可能有原來打得那麽好,筆者用先學的98王碼有每分鐘鍵入90字的水平,但用後學的五筆字型就只能每分鐘鍵入40多個字,過了大約壹個月,就可以達到90字水平。98和86版王碼,在常用字的選碼區別比較大,像“不”、“還”、“萬”、“夫”、“其”等等;有幾個關鍵的碼元有變化對高手不容易適應,像“廣”、“幾”、“乃”、“臼”等等,要成為“雙槍將”這幾個地方要有適應能力。
同時筆者還希望,現在出產的各種手掌型電腦筆記本,像“文曲星”、“名人”、“好易通”等,在輸入法中趕快加入98王碼輸入法,因為“會98王碼而不會五筆字型的人”會越來越多,誰先占領了98王碼,誰就會進壹步領先市場。
最後,作為98王碼本身來說,也還有進壹步發展的地方,比方可以掛接分類詞庫。無論是“98王碼”還是“86五筆字型”的詞庫都是以政論性文章為主,就是說妳打報刊文章時特別順手,但在打專業文章時,大量的詞是沒有的,有些人恐怕壹輩子也不會打“新華社香港分社”這個詞,但壹個簡單的像“鼠標”這樣的詞卻打不出來;有的人壹輩子可能也不會打“王永民”這個名字,想打“魯迅”這個名字卻無能為力。雖然98王碼可以自己“造詞”,卻同時又會引起大量的重碼,自己給自己添麻煩。如果能設計出可以自由選擇掛接像金融、化工、電腦、經濟、法律、藝術等等分類詞庫的“王碼”,既可以屏蔽自己不用的詞,避免重碼影響速度,又可以滿足各類人群的需要,各取所需,各口“齊”調,大大加快漢字輸入速度,免去自己頻繁“造詞”之苦,那將是多麽“美好”的啊!