根據漢字的形態信息,賦予每個字或詞壹個代碼,稱為漢字的字形編碼,簡稱形碼。《鄭碼》是壹種形碼,編碼方法的基本原理是:
把方塊漢字看作由構字單元組合而成,基礎的構字單元是字根,最小構字單元是筆畫。
舉例:“艮、卩、魚、口”4個字根可以合成“即、鯽、唧”等 3 個字根,字根“木、曰”和筆畫“”可合成“劄、電” 2 個字
字根排列的先後順序叫根順,根順與書寫順序壹致。
按逆過程可以把漢字分解成字根和筆畫,按根順依次排列後,代入字根和筆畫的代碼,就能得出漢字的編碼。將編碼輸入計算機,通過機內碼轉換,漢字信息便存貯在計算機裏。
舉例:
鯽 --- 魚\ R 艮\ X 卩\ Y --- RXY
電 --- 曰\ K \ Z --- KZ
《鄭碼》利用字形信息編碼,確立了“筆畫-字根-整字-詞語”這樣壹個檢索序列。就是說,用幾種筆畫的筆形來率領上百個字根,用上百個字根率領上萬個漢字,用上萬個漢字率領數萬條詞語。
為了不同用戶的需求,《鄭碼輸入法》分為《普及型》和《標準型》兩種。《標準型》重碼率低,適合高速盲打輸入。它不但適用於當前通用字符集的 6763 個漢字的輸入,而且用同樣的編碼規則,在WINDOWS 98 中,還能方便地輸入大字符集的 20902 個漢字。《普及型》的編碼規則簡單易學,但不能用來輸入大字符集漢字。《普及型》可以作為《標準型》的學習階梯,因為二者字根的代碼有***性,因此用熟練後能自然過渡到《標準型》。
妳可以去鄭碼吧學習鄭碼輸入法!
★flaiy★ 回答時間 2008-05-28 12:50
檢舉
鄭碼和五筆相比五筆推出時間要早,至於說好壞嘛,各有各的優點和不足之處,鄭碼比五筆更規範壹點,但是字根明顯比五筆要多,還有用鄭碼打詞是比較痛苦的,沒有五筆自然。不過鄭碼也沒有了五筆的識別碼。
在GB的範圍內五筆的重碼比鄭碼少。在GBK及更大的範圍內鄭碼的重碼更少,因此鄭碼適合於專門輸入古文等工作的人員,而五筆更適合於普通的工作者。
鄭碼的歷史
如果要說世界上普及率最高的中文筆畫輸入法(字形碼),絕對不是五筆字型,而是鄭碼。
對大多數人來說,鄭碼是我們最熟悉同時又最陌生的輸入法。它是windows系統中唯壹預裝的壹套筆畫輸入法,除了鄭碼之外,其它的全拼雙拼、微軟拼音、智能ABC等都是拼音碼。然而我使用電腦的時間超過10年,從未見過任何壹個人會使用鄭碼的人。
從windows95開始,所有的中文windows系統(95/98/NT/2000/XP)都預裝了鄭碼。這到底是為什麽?鄭碼到底是誰發明的?為什麽微軟公司選擇的是鄭碼而不是五筆字型?鄭碼真的有什麽過人之處麽?
鄭碼到底是誰發明的?
鄭碼的發明人是我國著名文字學家、享譽海內外的《英華大詞典》主編鄭易裏教授。我家裏正好就有他編著的這本詞典,1965年版,鉛字印刷的,現在已經老舊老舊的了。所以,對他的名字我覺得很親切。
鄭碼和五筆字型的淵源
鄭易裏教授研究漢字拆分方案幾十年,1980年時候完成了世界上首個只用通用鍵盤的26個英文字母鍵將漢字代碼輸入計算機的《26鍵位漢字拆根輸入碼方案》。但是他將自己多年對字根、對漢字編碼理論和方案的研究心得和發明成果都無私地傳授給了王永民等人。王永民等人在鄭的研究基礎上完成了五筆字型的發明。可以說,如果不是他當時的無私奉獻,現在占中國統治地位的筆畫輸入法,就絕對不是五筆字型了。五筆誕生以後雖然獲得了很大的成功和榮譽,但鄭易裏仍覺得五筆對於漢字的拆分不是很合理和完善,特別是不太符合漢字的文字規範,因此繼續不斷研究改進,在他的女兒鄭瓏的幫助下,最後***同發明了更為規範和完善的中文筆畫輸入法---《字根通用碼》。也就是我們後來看到的鄭碼。
鄭碼的過人之處
《鄭碼》以單字輸入為基礎,詞語輸入為主導,用2-4個英文字母便能輸2字詞、多字詞和30個字以內的短語;在這種字詞交融輸入之下,輸入壹個漢字的平均碼長是1.8-1.9鍵之間。他備有兩個詞庫,分別收錄25000和50000條詞語。為了不同用戶的需求,鄭碼輸入法分為《普及型》和《標準型》兩種。《標準型》重碼率低,適合高速盲打輸入。
《鄭碼》的優勢是,在漢字文字規律方面符合國家語言文字規範,具有規範、易學、快速、通用的特點(當然,這個易學和快速,是相對於當時的筆畫輸入法而言的),有條件在中、小學和社會上推廣應用。鄭碼因此獲得了國家無數的獎項和榮譽。(現在看來,目前中文錄入速度最快的應該是五筆字型,已經超過每分鐘300個字。而鄭碼的最高速度大約是240字。而最簡單易學的輸入法,我想還是拼音吧:D)
但是,鄭碼具備有其它輸入法無法替代的壹個重要優勢:在不改變編碼規則和字根代碼的前提下,可以方便地給10萬漢字編碼。也就是說,學會用《鄭碼》輸入幾千個常用漢字,用同壹方法編碼,還可以輸入幾萬個中國的生僻漢字以及日本和韓國的漢字。有了鄭碼,我們可以輕易的完成中日韓三國的漢字錄入工作,可以完成《說文解字》乃至《康熙字典》這樣超大字符集漢字的錄入,這壹優勢是其他輸入法所不可比擬的。
1994 年末,三星公司受韓國政府委托,來中國大陸引進漢字輸入法,以完成韓國訓民中文系統和將超過5000萬漢字的珍貴國寶《高麗大藏經》(其實這個大藏經也是高麗王朝在北宋年間從中國引入的)電子化的工作,中文信息學會向韓國推薦了十幾種輸入法。不久三星公司派來三位專家。在中文信息學會的配合下,馬不停蹄地將這十幾個“碼”輪番考核、測試、篩選。經過嚴格測試和考核,公司高層領導最後決定,原來準備選三種“碼”(輸入法)的打算,現在決定只選壹種就可以了,那就是鄭碼。韓國三星集團的理事長總結時候說:“《鄭碼》是1995年三星最成功的技術引進。”
鄭碼和windows的淵源
《鄭碼》經過壹系列國家級的測試、鑒定、評審,都認為具有世界領先水平之後。這個經過千錘百煉的漢字編碼系統可以定型推廣了。鄭易裏建議接過他的接力棒的中易公司又瞄準了新的目標——曲線漢字庫。因為,這是除了我們無力問津的操作系統以外的中文信息處理的另壹個關鍵因素。
漢字庫是中文信息處理的最終表現,因為大家看見的不是輸入法,也不是操作系統;而是用精美的漢字打印出來的文章。電腦用漢字庫的初級階段是由各個“點”組成的漢字字形。稱為用“點”來描述漢字。它不能無級放大、縮小,要像鉛字壹樣大小分號,而且略大壹些的點陣字、筆劃邊就像鋸齒壹樣難看。當時通用的排版系統上的漢字庫是中等技術級的矢量漢字庫。即是用直線來描述漢字字形,直線部分自不必說,而曲線部分,是用許多折線來組成。這種漢字庫,稍壹放大,就會由於顯出曲線部分的折線來,產生變形而無法使用。當中易公司要進入漢字庫開發領域時,決心越過矢量漢字庫,迎頭趕上世界最先進的用曲線描敘漢字字型庫的技術。當時世界上只有美國 2—3 個公司有這種用曲線描敘西文的技術,而用曲線描述漢字要比西文龐大復雜的多。公司利用世界上已公開的曲線描述字形的很少資料,組織軟件工程師們向曲線字庫的縱深領域進攻,同時聘請國內最權威的字模專家做字形的技術總監,並和中國標準技術開發公司專門開發國家標準點陣字庫部門合作,壹場向世界最高水平,符合國際曲線標準漢字字模的戰役全面展開!
做曲線漢字字模是壹件周期長、技術水平很高、風險大、資金投入大的項目。中易公司已連續創業4年,基本上都在完善《鄭碼》而沒有什麽收入。當為尋求開發曲線漢字庫的資金,向壹些大電腦公司尋求合作時,他們卻認為符合國際標準的 20902 個漢字的曲線漢字庫的應用時機還很遙遠。現在就投入大量資金開發風險太大,怕得不償失,於是都婉言謝絕。
但是中易公司認為,在信息時代,技術的更新,不是逐步到來的,而是像三級跳跳來的。我們是中國人,不但要在漢字輸入法方面世界領先,在漢字庫的技術領域,也要領先,才不愧對發明漢字頗講書法藝術的老祖宗!
事情果然像預料的那樣,1994 年初,世界最大的美國微軟公司把剛剛誕生才幾個月的 Windows3.2 中文版就準備拋開,全力開發 32 位操作系統的 Windows 95 中文版。包括中、日、韓三國的 20902 個漢字的國際標準。美國微軟的工程師很快來北京調查,誰家有這 20902 個國際標準的漢字庫?哪個輸入法能支持(檢索)這 20902 個漢字?他們馬上找到了中易公司,他們在了解《鄭碼》能不能支持(檢索)20902個國際標準漢字時,中易公司給他們演示的卻是當時世界最大的國家6萬電腦大漢字庫的輸入(檢索)。他們看到《鄭碼》只用4鍵就能迅速準確地輸入 6 萬漢字時,驚訝之極,難以言表。即然6萬字都這麽幹凈、利索地輸入,20902 個漢字還在話下嗎。再問到誰家有這 20902 個曲線漢字庫時,中易公司輕松地將打印好的全套樣本展現在他們眼前。以後的半個月,他們曾4次派不同級別的工程師和管理專家來中易公司咨詢考查,確認壹切完備無誤後,要了樣品才滿意離去。
從這以後,隨著Windows中文版的推廣,《鄭碼》和中易字庫壹起進入了千萬中文用戶的電腦中。