根據漢字的形態信息,給每個字或詞賦予壹個代碼,稱為漢字的字形碼,簡稱形碼。鄭碼是壹種形碼,其編碼方法的基本原理是:
方形漢字被視為壹組構詞單位的組合,基本的構詞單位是根,最小的構詞單位是筆畫。
如“根、意、余、口”四個部首可以組合成“鯽魚、鯽”三個部首,“目、月”和“筆畫”可以組合成“雜、點”兩個字。
部首排列的順序稱為部首順序,與書寫順序壹致。
按照逆過程,可以將漢字分解為字根和筆畫,然後代入字根和筆畫的編碼,就可以得到漢字的編碼。將編碼輸入計算機,通過內碼轉換將漢字信息存儲在計算機中。
例如:
鯽魚-魚\ R gen \ X \ Y - RXY
電-粵\ K \ Z - KZ
馬錚利用字體信息編碼,建立了“筆畫-詞根-整字-詞”的檢索順序。也就是說,幾百個部首由幾筆引出,幾萬個漢字由幾百個部首引出,幾萬個字由幾萬個漢字引出。
為了滿足不同用戶的需求,鄭碼輸入法分為普及型和標準型兩種。“標準”重碼率低,適合高速盲打。它不僅適用於當前通用字符集中6763個漢字的輸入,而且可以在編碼規則相同的WINDOWS 98中方便地輸入20902個大字符集漢字。普及型的編碼規則簡單易學,但不能用來輸入大字符集的漢字。“普通型”可以作為“標準型”的學習階梯,因為兩個部首的代碼都是* * *,所以妳熟練使用後可以自然過渡到“標準型”。
妳可以去馬正吧學習馬正輸入法!
★flaiy★回答時間2008-05-28 12:50
向當局報告
與相比,鄭法典的出臺更早。至於是好是壞,各有利弊。鄭碼比規範壹點,但字根明顯比多,用鄭碼打字更痛苦,不自然。然而,鄭碼也失去了的識別碼。
在國標範圍內,吳彼的重碼少於正比。在及更遠的地方,鄭碼重碼較少,所以鄭碼適合專門輸入古文的人,而則更適合普通勞動者。
馬錚的歷史
如果要說世界上最流行的中文筆畫輸入法(字碼)絕對不是五筆字型,而是阿正碼。
對於大多數人來說,鄭碼是最熟悉也是最陌生的輸入法。是windows系統中唯壹預裝的筆畫輸入法。除了鄭碼,其他所有拼碼,微軟拼音,智能ABC等。都是拼音碼。但是,我用電腦10多年了,從來沒見過會用馬錚的人。
從windows95開始,所有的中文windows系統(95/98/NT/2000/XP)都是預裝的。這到底是為什麽?到底是誰發明了馬錚?微軟為什麽選擇正碼而不是字體?馬錚真的有什麽特別之處嗎?
到底是誰發明了馬錚?
馬錚的發明者是鄭伊麗教授,他是我國著名的語言文字學家,也是享譽海內外的《華英詞典》的主編。我家裏正好有他編的這本字典,1965版,鉛字印刷,現在已經舊了。所以,我對他的名字感覺很親切。
鄭碼與字體的淵源
鄭伊麗教授研究漢字拆分方案已經幾十年了。1980年,他完成了世界上第壹個只用通用鍵盤的26個英文字母鍵將漢字輸入計算機的“26鍵漢字分根輸入碼方案”。但是,他把自己多年的研究經驗和對部首、漢字編碼理論和方案的發明,無私地傳授給了王永民等人。王永民等人在鄭研究的基礎上完成了字體的發明。可以說,如果不是他當時的無私奉獻,現在在中國占主導地位的筆畫輸入法,絕對不會是五筆字型。盡管吳彼誕生後獲得了巨大的成功和榮譽,但鄭伊麗仍然覺得吳彼對漢字的拆分不是很合理和完善,特別是不符合漢字的規範,所以他繼續研究和改進。在女兒鄭龍的幫助下,* * *終於發明了壹種更加規範完善的漢字筆畫輸入法——“部首通用碼”。也就是我們後來看到的鄭碼。
馬錚的卓越
馬錚以單字輸入為基礎,以文字輸入為主。用2-4個英文字母,可以輸入2個單詞,多個單詞,30個單詞以內的短語。在這種混字輸入下,輸入壹個漢字的平均碼長在1.8-1.9鍵之間。他有兩本詞典,分別收錄了25000和50000個單詞。為了滿足不同用戶的需求,鄭碼輸入法分為“普及型”和“標準型”。“標準”重碼率低,適合高速盲打。
馬錚的優勢是在漢字方面符合國家語言文字規範,規範、易學、快捷、通用(當然這是易學、快捷,是相對於當時的筆畫輸入法而言的),可以在中小學和社會上推廣應用。馬錚贏得了許多國家獎項和榮譽。(現在看來,中文輸入速度最快的應該是吳彼字體,已經超過了每分鐘300字。鄭碼最高速度約240字。而最容易學的輸入法,我覺得是拼音:d)
但鄭碼有壹個其他輸入法無法替代的重要優勢:在不改變編碼規則和部首碼的情況下,可以輕松編碼65438+萬個漢字。換句話說,學習使用馬錚輸入成千上萬的常用漢字,並以同樣的方式編碼。還可以輸入數萬個中國生僻漢字和日韓漢字。有了鄭碼,我們可以輕松輸入中日韓漢字,還可以輸入超大字符集的漢字,比如《說文解字》、《康熙字典》,這是其他輸入法無法比擬的。
1994年底,三星受韓國政府委托,將漢字輸入法引入中國大陸,以完成朝鮮漢語培訓系統和擁有5000多萬漢字的珍貴國寶《朝鮮大藏經》的電子化工作(實際上這部大藏經也是北宋時期朝鮮王朝從中國引進的)。中國信息學會向韓國推薦了十幾種輸入法。很快三星派出了三名專家。在中國信息學會的配合下,這幾十個“代碼”依次被檢查、測試、篩選。經過嚴格的測試和考核,公司高層最終決定,原計劃選擇三種“碼”(輸入法),現在決定只選壹種,就是鄭碼。韓國三星集團董事長在總結時說:“馬正是三星在1995最成功的技術引進。”
馬正和窗戶的起源
經過壹系列的國家測試、評估和審查,馬正被認為具有世界領先水平。這樣磨練出來的漢字編碼體系才能定型和推廣。鄭伊麗建議接過他接力棒的鐘毅公司瞄準壹個新的目標——曲線漢字庫。因為這是中文信息處理中除了操作系統之外,我們無法關心的另壹個關鍵因素。
漢字庫是中文信息處理的最終表現形式,因為妳看到的既不是輸入法,也不是操作系統;這是壹篇用精美的漢字印刷的文章。計算機漢字庫的初級階段是由各種“點”組成的漢字字體。形容漢字叫“點”。不能無限放大縮小,要像鉛字壹樣分號大小,稍微大壹點的點陣字和筆畫邊緣難看得像鋸齒。當時通用排版系統上的漢字庫是中等技術水平的矢量漢字庫。也就是用壹條直線來描述漢字的字體。直線部分就不用說了,由很多折線組成。這種漢字庫,如果稍微放大,會因為曲線部分的斷線而變形,無法使用。鐘毅公司想進入漢字庫開發領域,決心超越矢量漢字庫,趕上世界上最先進的用曲線描述漢字字庫的技術。當時美國只有2-3家公司擁有用曲線描述西文的技術,用曲線描述漢字比西文復雜得多。公司利用國際上為數不多的曲線描述字體公開數據,組織軟件工程師向曲線字體深度領域攻關,聘請國內最權威的字體專家擔任字體技術總監,與中國標準技術開發公司合作開發國家標準點陣字體,從而展開了壹場達到國際最高水平,與國際曲線標準接軌的戰役!
制作曲線漢字字體是壹項周期長、技術水平高、風險大、資金投入大的工程。鐘毅公司已經連續經營了4年,基本上改善了馬正,沒有任何收入。當他們為了尋求開發曲線漢字庫的資金而向壹些大的計算機公司尋求合作時,他們認為符合國際標準的20902個漢字的曲線漢字庫的應用機會還很遙遠。現在投入大量資金開發風險太大,怕得不償失,所以大家都婉言謝絕了。
然而,鐘毅公司認為,在信息時代,技術的更新不是逐漸到來的,而是像三級跳壹樣。我們是中國人,不僅要在漢字輸入法上領先世界,還要在漢字庫技術領域領先世界,才能無愧於發明漢字、談書法藝術的老祖宗!
不出所料,1994年初,全球最大的美國微軟公司準備拋棄剛推出幾個月的中文版Windows3.2,全力開發32位操作系統Windows 95的中文版。包括中日韓20902個漢字。美國微軟公司的工程師很快就要來北京調查這20902個國際標準的漢字庫是誰的。哪種輸入法可以支持(檢索)這20902個漢字?他們立即找到了鐘毅公司。當他們得知馬正能否支持(檢索)20902個國際標準漢字時,鐘毅公司向他們展示了當時世界上6萬個計算機漢字庫的輸入(檢索)。當他們看到馬錚只用四個鍵就能快速準確地輸入6萬個漢字時,他們感到無比驚訝,這種驚訝無以言表。即使6萬個字都輸入得這麽幹凈利落,還有20902個漢字還在空中。當被問及這20902個曲線漢字庫歸誰所有時,鐘毅公司輕而易舉地向他們出示了打印好的全套樣本。在接下來的半個月裏,他們先後四次派出不同層次的工程師和管理專家到鐘毅公司進行咨詢和考察。在確認壹切完整無誤後,他們索要了樣品,才滿意地離開。
此後,隨著Windows中文版的推廣,馬正和鐘毅字體進入了數百萬中國用戶的電腦。