當前位置:成語大全網 - 春天的詩句 - 中國漢字輸入法的三個階段是什麽?

中國漢字輸入法的三個階段是什麽?

發展歷史

中文(漢字)輸入法從20世紀80年代到今天發展了近30年,尤其是吳彼和拼音發展很快,尤其是21世紀。具有壹定智能程度的拼音輸入法,結合拼音易學、詞匯量大、為用戶設計周到的特點,受到了用戶的喜愛,為互聯網時代的普及做出了重要貢獻。以下文章(2000)輸入法,中國人的壹道坎?曾幾何時,中國人說起電腦,離不開“中國人”這個詞。掰著指頭算,在中國IT屆依然叱咤風雲的人物,都不是從“中國人”開始的:聯想、巨人靠漢卡,四通靠中文打字機,方正靠中文印刷排版,中星、新浪靠中文平臺,等等。在中文領域,最基本的問題是漢字的輸入和輸出。誰能解決好,誰就贏得商海之戰。事情看起來這麽簡單,解決了投入產出問題就能賺大錢?這麽幼稚的結論恐怕是10年前想出來的。雖然有“當代畢升”之稱的王選在我們的印刷術中告別了鉛與火,漢字的輸出有了質的飛躍,但這並沒有讓漢字的輸入變得更容易。隨著中國人的錢流入微軟和英特爾的口袋,中國的漢字輸入並沒有賺到錢。除了五筆字型授權費,自然碼註冊費要收,養活四五個人,我也夠聰明,搞點炒作,弄點新人氣。誰能說我賺了多少錢?中文輸入法,壹個被所有中國電腦用戶折磨了多年的“半老徐娘”,卻沒能引起大眾的關註。看來他得抹點脂粉,喬裝打扮或者隱姓埋名,或者嫁給別人!本來是名門望族,結果卻落得個壹年多的悲慘境地。在那些日子裏,馬奔騰擠滿了人,在那個時候,有很多人。即便如此,還有人在暗暗努力:我不信這個邪。以我的美貌和背景,養不出漂亮的女兒。也有業主不愁吃穿,以為閑著也是閑著。我自己養壹只貓狗,可以當女兒養,開心的時候帶它出去散步。妳在乎什麽?今天沒事,來看看哪些半老的徐娘和國色天香值得壹探究竟。1.鍵盤輸入大約65,438+00年前,壹個朋友的漢卡提供了壹種可以連續輸入漢語拼音串的輸入法,但是這哥們沒賣出幾件,就找不到蹤跡了。這可能是第壹個真正使用的“句子”輸入法。後來1993左右的1.3版中文星提供了新的拼音輸入法,至今仍被認為是最便捷的輸入法之壹。它可以實時顯示單個單詞,即在輸入拼音的同時,可以同時顯示漢字,錯別字立即可見,沒有的單詞選擇壹次就能記住,還有壹些關鍵位置的巧妙設計,如空格確認、重碼逗號句號選擇、模糊聲音容錯等。,已經成為今天所有拼音輸入法的必備功能。這時候還有智能ABC。在1993開頭的北大出版社,編輯告訴筆者,開發了壹個非常好用的輸入法,有類似新拼音的功能,也可以快速輸入壹些符號。輸入V後,還可以通過筆畫輸入不認識的漢字。這是早期的智能ABC。後來和微軟合作的很好,幾乎所有的中文版Windows都是代工的,不過這個軟件可能當時基本已經有了。事實上,無論是智能ABC還是新拼音,在技術上可能都源於上世紀80年代末張普、李惠琴等人主持的PJS項目,他們之間可能存在合作關系。1994年,有壹件事對中國輸入法的發展起到了重要作用。6月65438+10月65438+8月,龍光威和邦德兩家公司合作成立了Autoway中文平臺項目組。當時公司準備在DOS和WINDOWS環境下開發中文平臺和文字處理軟件,胃口很大,集中了壹些強大的開發力量。由於資金問題,後來在6月1995調整了目標。專門開發了Autoway輸入法,下半年推出了可以在Windows環境下持續輸入漢字的系統。該軟件由語言學界著名人士周有光題寫,後來在電臺和報紙上宣傳,確實很成功。這種輸入法最大的特點是用戶只連續輸入拼音,系統每隔幾個拼音自動顯示前面的漢字。達到壹定長度後,漢字會自動進入應用軟件的編輯器或由用戶按回車鍵,無需手動分詞。但由於準確率低、用戶界面和易用性等原因,並未得到廣泛普及。1996,輸入法出了壹匹“黑馬”,恰好叫北京黑馬公司。其“黑馬輸入法”只能在DOS下使用。現在作者還有當時買的正版,是幾張軟盤。如果在Windows下使用,輸入法提供了DOS界面。用戶輸入壹個句子的拼音串,按回車鍵,轉換成漢字,存入文本文件,然後復制到其他應用軟件。現在看來這個軟件很難用,但是憑借這個廠商在中文校對方面的經驗、資料和積累的資金,壹步步發展起來,2001還在不斷完善和升級。無論是“自交流”還是“黑馬”,都說是漢字整句輸入(也叫句子輸入)的第壹例,但其實除了筆者前面提到的功能,最早可以追溯到80年代末的哈工大。當時該校博士生王小龍研究中文分詞,申請了863項目,寫了壹篇《最小分詞問題及其求解》的論文。後來王小龍開發了InSun輸入法,這是壹個基於整句的輸入系統。90年代初只是做了壹些成果的演示和展覽,據說偶爾賣給壹些日本公司換壹些特殊的打字機,但是很多年都沒有動靜。90年代中期以6.5438億+的價格賣給了微軟。當然這個價格挺好的。於是乎,從中文版的Windows 95開始,就有了大家看到的“微軟拼音輸入法”。雖然有很多批評者,但微軟采取了類似的方式,並獲得了智能ABC,並“免費”發送給中國的用戶。但是,這種“自由”是形式上的。本質上,它的價格已經在Windows操作系統中計算好了,最終還是要算在用戶身上。結果輸入法開發者和廠商都吃了苦頭。連微軟提供的拼音輸入法都不好用。有人曾調侃說,輸入法就像感冒擦鼻子。按理說,鼻子有點小就要趕緊擦掉,不要等著掉到嘴裏。但是微軟拼音不是讓妳敲半天,再回去修改。由於智能程度低,錯誤令人費解。如果妳敲手稿,妳很幸運發現錯誤的。如果妳想打字,妳會發現錯誤的。無法與鍵入的拼音同步顯示漢字(微軟拼音落後壹個字,Autopass落後幾個字,黑馬拼音需要最後確認才能出現漢字),以及高錯誤轉換和修改拼音選擇漢字的不便,都極大地制約了其使用。人們繼續使用新的拼音或智能ABC,但它們有不支持GBK漢字和長期不升級新功能的缺陷。再加上句子輸入法的不成熟,讓中國輸入法差點。這種沈默在1998被打破,這要感謝* * *享樂軟件的出現。由於互聯網的普及,網絡的力量越來越大,新的個人力量開始湧現。出現了拼音星、通用碼(通用吳彼)、智能吳彼等新的輸入法。拼音星是譚亞軍發明的。它是壹個單字、詞、短語和句子輸入系統,包括全拼、雙拼和譚碼。也許是作者意識到了傳統的單詞輸入法和句子輸入法的優缺點,所以設計了壹種完全“實時顯示”的方法。無論輸入多少拼音,每按壹個字母,都會同時顯示漢字,用戶會立即發現拼音是否有錯誤。而且由於支持自動分詞和整句輸入,用戶不用擔心是輸入壹個單詞還是壹個句子,系統可以處理。沒有單詞,系統可以自動學習並保存,看起來既有單詞輸入法的便捷,又有整句輸入法的智能。另外值得壹提的是,利用雙拼、偏旁部首或筆畫的譚碼還可以輸入單詞或整句,可以進壹步加快打字速度,這恐怕是其他輸入法所不具備的。該輸入法只需壹張軟盤即可安裝,程序小巧穩定,運行錯誤少,整句智能達到實用水平。因此,該軟件於1997 ~ 1998上線,反響強烈,部分功能被未來的輸入法模仿,如“實時顯示”、輸入類似拼音的各種符號、智能識別數字標點符號等等。中文明星網站也長期推廣下載,捆綁銷售金山公司的WPS2000。“飛鳥”在1999的最後評論說“拼音之星2000在功能上明顯優於微軟拼音輸入法(2.0版),絕對是壹顆耀眼的明星。”其中不乏好評,但肯定說明了將單詞輸入的便捷性與拼音整句輸入的智能性結合起來是輸入法的方向之壹。拼音星采用插件技術,與中文星或Richwin等中文平臺類似,所以在Windows下可以使用中西兩種語言。這是個好主意,但也帶來了很多問題。在中文Windows環境下,由於不是Windows自帶的標準輸入法IME格式,安裝不正確可能會出現亂碼。這個問題對拼音星等插件輸入法也有負面影響,最新的拼音星2002 Build 1。因為之前版本的拼音之星沒有提供同時兩行顯示拼音和漢字的操作方式,所以當拼音輸入錯誤需要修改時,雖然可以按方括號【或】將漢字改回拼音,同時移動光標(不用左右方向鍵),但是手指移動範圍比較小,這本來是壹個很好的設計, 但是和傳統的操作方式不同,所以用戶並不知道,而且讓人覺得修改拼音不方便。 所以千禧版2.0之後,拼音星在操作界面上完全復古。和中文之星新拼音壹樣,提供上下兩行顯示所有輸入的拼音字母和自動轉換的中文字符串。(註:這是壹個舊的皇歷。目前,拼音之星已經完全按照IME設計,與微軟拼音和谷歌拼音的機制相同。用插件技術設計輸入法當然有獨特的優勢,比如克服了標準IME(如智能ABC)的標點等缺點,無法在西文Windows中使用,無法在西文應用軟件中跟隨光標。輸入法的另壹個發展方向是功能的多樣化。這方面的代表就是“萬能密碼”,也就是現在的“萬能五筆”。通用碼是壹種結合拼音、吳彼、英語和筆畫的文字輸入法。它可以與多種功能壹起使用,無需切換,如輸入“蘋果”壹詞,鍵入其拼音“蘋果”,使用吳彼碼,使用英文蘋果。因此,對於習慣於傳統輸入法的用戶來說,使用通用碼是很容易的。

編輯這個五筆輸入法

早期版本的通用碼以拼音為主要設計方式,所以可以實時造詞類似於新拼音,但拼音的功能並不強大,遠不如拼音星和新拼音。因此建議《通用碼》作者鄧世強以五筆為主,主推“通用五筆”,兼顧多種輸入法。該系統開發良好,曾獲得“十佳* * *軟件”稱號。這種輸入法最大的缺點是菜單選擇太多,菜單界面設計雜亂,用戶無所適從;中文Windows下的亂碼和拼音單詞短語的缺乏也是限制這種輸入法進壹步普及的因素。智能吳彼是另壹種模式,它充分吸收了吳彼的精華並將其發揚光大。王馬公司可能做夢也沒想到,這麽多人在為自己出謀劃策。聰明的吳彼做了很多關於吳彼的文章,包括吳彼的編碼提示,提示詞庫中是否有某個單詞。很多以前輸入過的漢字,用吳彼的壹串短碼就能快速輸入,詞庫大(因為用吳彼編碼,詞庫大,編碼多),這也是很多用戶喜歡的原因。但軟件本身的質量設計也存在壹些問題,界面不美觀,菜單雜亂,操作鍵設計隨意,充分體現了軟件個人享受的局限性。到了1999,又出現了其他幾種拼音輸入法:拼音加、免費拼音輸入法、考拉輸入法。拼音加法其實是參與《中文之星》新拼音設計的廖恒毅的代表作。它結構緊湊,程序穩定,鍵位設計合理。此外,壹些新增加的功能,如不切換輸入西文,像智能ABC壹樣輸入帶筆畫的未知漢字,快速輸入各種簡拼符號,使這種輸入法受到文字輸入者的歡迎,並在長城中文颶風中與拼音之星、智能吳彼、通用吳彼壹起貼牌銷售。但是拼音加法的缺點很明顯。同義詞庫太小。如果連續輸入兩個或兩個以上的單詞,您必須不斷選擇單詞並通過空格進行確認。免費拼音輸入法最大的特點就是源代碼公開(操作方式和功能沒有太多新意),所以很多輸入法愛好者都整理了自己的輸入法供參考。考拉輸入法剛推出的時候,是在清華的BBS上介紹的。操作方式幾乎完全模仿了中文之星的新拼音,但克服了新拼音在部分系統中字體極小的缺陷,深受網友好評。從壹開始,樹袋熊的作者就在軟件描述中聲明他將出售它。後來真的賣給紫光公司了,2000年改進成紫光拼音輸入法。這種輸入法最大的特點就是完全忠於新拼音的操作方式,並且提供了較大的詞匯量。在2.2、2.3等後續版本中,增加了智能組詞,即用戶連續輸入9個單詞以內的拼音串,無論有無這個單詞,系統都能自動轉換成漢字。系統按照詞頻和高頻預見的方式給出詞串組合,增強了操作的流暢性。另外值得壹提的是,紫光拼音輸入法善於吸收其他輸入法的優點,如拼音星實時顯示、符號智能識別、自定義字符串等。如果不切換添加拼音,直接用Enter鍵打西文,最終成為用戶最喜歡的輸入法。然而,紫光拼音輸入法有壹些明顯的缺點。由於程序設計上的缺陷,不如拼音星和拼音加穩定。很多版本的輸入法引擎經常出現錯誤,用戶的詞庫太大,無法使用。在2.3版本中有所改進,但是切換應用時屏幕會閃爍。在Dreamweaver等壹些西文軟件中,輸入欄會出現進進出出,在壹些應用中出現亂碼的問題,影響軟件的正常使用。2000年,老字號新天地分拆成立了中華之星公司,主要推廣壹種叫做智能瘋狂拼讀的整句輸入法。本質上類似於微軟拼音、黑馬拼音、拼音之星的句子輸入,只是這家公司宣傳的很好。智能瘋狂拼I壹推出就開始進行鋪天蓋地的廣告宣傳,號稱首次推出整句輸入法,並在2001發布了升級版智能瘋狂拼II。智能瘋拼對於輸入法領域來說無異於壹劑強心針。雖然中國之星還是沒賺多少錢,但是中國開始關註中國IT曾經的軟件霸主中國之星。而此時的2000年,中國正和全世界壹樣處於互聯網狂潮中,而中國之星的前競爭對手四通李芳早已完成了初期融資,準備在美國納斯達克上市,成為中國第壹家中文門戶網站。智能瘋拼的界面不錯。可以自定義多種顏色和字體,大小可以像Windows窗口壹樣隨意拉伸。與微軟拼音相比,拼音的修改和重碼的選擇都有所改進,拼音到漢字轉換的正確性也不錯。尤其是在學習了大量的中國古詩和名人諺語後,智能瘋拼壹時間號稱最智能,但其自學習慣卻不如拼音星和拼音Plus。自主學習習慣主要表現在兩個方面:壹個是獨立輸入壹個拼音串,如果壹開始不準確可以修改,然後下次輸入同樣的拼音或者簡拼應該就能得到需要的結果,對於傳統的文字輸入法來說得心應手;另壹方面,很難從正在輸入的句子中學習到相應的單詞,目前所有的系統都不盡如人意。智能瘋拼的明顯缺點就是太龐大。為了增加1% ~ 2%的轉換精度,增加了幾百兆的磁盤開銷。壹個輸入法比操作系統還臃腫,這壹招可能只有焦慮的人才想出來。還有壹個軟件,叫自然碼,是老式的輸入法,功能設計上有很多細微差別。聲形編碼與雙拼和偏旁部首或筆畫相結合,提供了壹種快速輸入漢字的方法。大詞庫是它的特點,在DOS時代曾經風靡壹時,程序設計也很獨特。剛進入Windows時代,開發緩慢,菜單設計沒有考慮,比較亂。它和之前推出的通用五筆、智能五筆有著同樣的問題,並且難以推出nt版本,讓很多老用戶忍痛割愛,投入新輸入法的懷抱。2000年自然碼也受整句輸入的影響,推出了整句輸入功能,轉換速度慢,準確率低,修改困難,但是用起來太難了,不實用。到了2001的新版本,整句輸入有了很大的提升,使用中文部首碼不切換選擇重碼的方式別出心裁。如果進壹步完善,操作的復雜性和模糊性就會降低,就會發揚光大。

編輯此段落中的語音輸入和筆輸入。

鍵盤輸入多年後,在1998左右突然遭到猛烈攻擊。其中無非就是說五筆太麻煩需要背字根,拼音太簡單但是重碼太多,打字慢。統計浪漫人物要看現狀——發音和筆輸入。包括IBM、微軟、摩托羅拉、中字、紫光等公司在內的各大廠商都推出了自己的非特定人語音輸入系統或手寫漢字輸入系統,壹時間在市場營銷和媒體推廣上咄咄逼人,但筆者認為這兩種輸入法都還可以,但都不是正確的漢字輸入方式。這兩種方式這幾年占了多少份額?源於語音識別技術的漢字語音輸入,通常采用馬爾可夫信息模型進行統計處理,采用基於規則的方法進行歧義判別。比如我們平時說話,說壹個詞的時候,別人可能因為代碼重復而聽不懂,但是我們說壹個詞,別人聽懂的可能性就增加了。我們說壹句話,別人就懂了。這是因為話語中的詞與詞是相互關聯的。對這個相關因素進行定量的統計分析,得出常用詞之間的統計定量關系。根據這種數量關系,計算機通常要識別錄音語音,有時需要采用壹定的語言規則和補充統計方法來提高機器的智能水平。讓機器“聽懂”人說的話,是壹件很美好也很困難的事情。對它的研究可以推動很多技術的發展,它的成果可以應用到很多方面,比如樂器的語音控制,當然還有漢字輸入。90年代中後期,IBM終於推出了非特定人連續語音識別系統ViaVoice,是目前語音識別領域的佼佼者。近年來,壹批從事漢字語音識別的研究人員陸續加入外企。利用國外公司資金充足的優勢,他們利用在國內研究所或大學學到的知識或研究成果,建立了龐大的漢語數據庫(也稱語料庫),推出了漢語普通話語音輸入系統,實現了每分鐘150字以上的高速輸入。中國也有類似的制度。為了證明語音輸入系統的先進性和實用性,舉辦了多次鍵盤語音比賽。1998上半年10城市第壹場比賽中,使用語音輸入的選手最快輸入速度高於使用鍵盤輸入的選手,充分驗證了“嘴比手快”的道理。壹時間,語音輸入大有可為。但是語音輸入有壹些目前難以克服的弱點。首先要求安靜的輸入環境,準確洪亮的發音。因為這個系統的上下文,壹個錯誤會導致壹連串的錯誤。如果妳有口音,那結果就更不堪設想了。如果專業的入門文員采用這種方法,寬敞的機房就變成了壹個小小的隔音空間,人連續幾個小時大聲朗讀就會疲憊不堪。非專業人士使用電腦輸入,主要是以“思考”的方式,即壹邊思考,壹邊直接在電腦上書寫,而語音輸入要求語音準確流暢,沒有給思考留出足夠的時間。其次,它需要學習用戶的發音,讓用戶正常使用,無形中增加了使用的復雜性和不便性。因為語言環境差異很大,再大的語料也不可能窮盡。自動學習和獲取新知識的能力有待加強,距離真正實用的系統還有很長的路要走。除了語音輸入,另壹個熱點是筆輸入。ViaVoice推出前壹年,這款就已經開始火了,但並不代表市場有多火,只是廠商在做壹個熱鬧的宣傳。其實經過1997,基本實用的手寫漢字輸入系統已經達到了。采用了基於語義句法的模式識別方法,從筆畫段-筆畫-部首-整字四個層面壹定程度上解決了聯機手寫漢字的識別率問題。其中,中咨公司的“漢王99”和摩托羅拉公司的“畢慧”表現突出。但是輸入速度慢、使用不方便、眼睛長時間操作是手寫輸入不可逾越的障礙。因為書寫板和屏幕是分開的,打字員寫字時眼睛盯著書寫板,字容易跑偏——在Windows環境下,“筆”很容易失去書寫窗口的手柄,即使是全屏書寫。壹邊寫壹邊盯著屏幕,打字員眼睛特別累,無法輸入大量漢字。所以手寫輸入只會在特定人群中流行。如果對電腦不熟悉,只需要輸入少量的漢字。或者需要簽名的人。同時,手持式PDA計算機也可以使用筆輸入,因為機器體積小,而鍵盤輸入不方便。當時廠商宣傳“每臺機器都有壹支筆”,“筆”將成為和鍵盤鼠標壹樣的標準配置,被熱炒了壹段時間,就像去年的“網絡經濟”壹樣,出現了濃濃的泡沫。這幾年來,在電腦中幾乎看不到筆輸入,尤其是在應用最廣泛的PC中,但在“Business Connect”等功能單壹、體積較小的掌上電腦中卻開始流行。看漢字輸入,拼音輸入還難以達到巔峰,五筆輸入在背根競爭中領先還能得到壹些收益;對著麥克風輸入語音的侃侃和在壹塊木板上“塗鴉畫鳥”的“神筆仙指”,似乎鮮有新的成果。中國人能爬上進口的門檻嗎?= = = = = = = = = = = = = =除了上面文章提到的輸入法,從2006年開始,新的輸入法陸續誕生,包括谷歌拼音輸入法、搜狗拼音輸入法(搜狗拼音)、QQ拼音輸入法,加上之前的微軟拼音、紫光(現為紫光華宇)拼音、拼音plus。以及各種五筆輸入法、形碼、音碼,構成了互聯網時代的中文(漢字)輸入法時代,為我們的生活增添了更多的便利。感謝這些輸入法的發明者和開發者。