當前位置:成語大全網 - 新華字典 - 啥是漢字全息碼?

啥是漢字全息碼?

本發明的漢字全息碼電腦通用鍵盤輸入技術包括部首;筆畫:橫(壹)、豎(丨)、點(丶)、撇(丿)提( );筆順:從上到下、從左到右、先橫後豎、先中間後兩邊。所述的部首選用100個部首字,按照其拼音的第壹個字母標識在相應的公知電腦通用鍵盤的26個英文字母鍵上,其結構如下:英文鍵 漢語拼音的第壹個字母碼Q [犬(大犭 豕)] (示礻)W [王]?( )韋( )文(攵)E [耳(阝卩)]二( )兒兒 )R [人(?亻)]日T 扌(?手)] 亠(丄)土田Y [月(曰 )]乂又幺( )羊( )U [巫( )]I [衣( 衤)]O (去 碼功能鍵)P [爿(爿片)]丿( )A [廣]廠( )S [水( 氵)]丨( )十( )厶( )D [丁(丅 )]、( 丶)刀(刂)歹F G [弓]?6?5(?丨乚 工( )骨H [火(灬)]-(壹)禾

J [金(钅)幾(幾幾)巾彐( 彐 )己( )臼K [口]凵L [立]了力 (角)裏( )Z [竹(?6?8)]止( )爪(爫 )走( 之辶廴)足(?6?4)隹X [心(忄 )]夕(攵)習(習)小( )C [艹( 屮)]寸車( )蟲V( )[魚(魚)]雨B [蔔( )]八(丷八)勹( ?6?8 )匕冫( )貝( )白髟N [女]丶廿(? )牛( ?6?4)M [木)冖(冂 ) (門)馬(馬)目(目四)*說明:[ ]內為鍵名部首,( )內為變化、繁體。

從上表可見,在這些英文鍵盤的26個鍵名中,V沒有相應的語音拼音改作 ,O沒有相應部首字,留作功能鍵。所述的筆畫還包括彎、捺、鉤,並以橫、豎、點、撇、彎、提、捺、鉤的順序編排,其中凡帶鉤的筆畫壹律作鉤,所述的筆順還包括先撇後捺,先外後裏再封口,並以先橫後豎,先撇後捺,先外後裏,先外後裏再封口先中間後兩邊的編碼規則編排。使用上述100個部首的漢字全息編碼全部采用英文鍵盤的四位代碼輸入方法。這種漢字編碼輸入技術,簡稱全息 碼。

與以往的漢字信息檢索輸入碼相比,本發明的漢字全息碼電腦通用鍵盤輸入技術,由於優先選用了常用的100個形、音、義皆全的並具有極強的組字能力的傳統部首以及簡易的筆畫規則,既符合人們常識和習慣,易於記憶,又可使漢字信息邊界清楚,具有簡單易學,操作方便,輸入速度快,重碼率低以及推廣容易等優點。

本發明比較以往的輸入碼,只要掌握100個常識部首字的第壹個拼音字母,用相應的外文(英、俄、德、法、意、日、拉丁、國際音標等等)鍵盤配合,100個部首字第壹個拼音字母、在電腦通用鍵盤的26個英文字母鍵上標識,使全世界學習、使用漢文的人***同使用;本發明的獨創性還在於它的簡約化,壹切從簡從易,拋棄了所有人為的口訣和主觀地定角、定高低、定區位的死記硬背的繁文褥節;本發明還靈活、和諧地將字母碼與數碼結合起來,使各種用戶與機件都可通用。

本發明能廣泛用於通用小鍵盤電子計算機和各種漢語工具書,取得了電腦、辭書、資料、電信四者編碼的壹致性。

采用本發明,大約只要化半天或壹天時間就能編碼上機,並具有不需專門培訓,軟硬件成本低廉,適合於小鍵盤通用件,平均擊鍵次數少(每字平均約1.33次),重碼率低(低於千分之壹)等優點。

此外,本發明至少還可以在以下十個方面應用:1,中文電腦打字、編輯、排版;2,電報碼與電傳碼統壹於拉丁化字母,可由機器自動譯為中文;3,全國郵政編碼;4,中外文機器助譯;5,古漢語與白話文機器助譯;6,速記;7,縮寫;8,圖書編目、辭書索引用全息碼;9,速抄、縮錄;10,醫藥自我咨詢,及農林牧副漁工商財文軍政各行各業管理咨詢。

本發明使繁難的方塊漢字變成超過任何壹種西文的全息碼且發掘了漢字內在的美質,使漢字變成科學、規範、精煉、整齊、優美的集約化的編碼,從而成為東西方文明大交流的壹座宏偉的橋梁。

以下,將結合實施例對本發明作更詳細的敘述。

實施例1按100部首字漢語拼音的第壹個字母順序排列。26個字母中,V改作 使用,O沒有相應的部首字,留作功能鍵使用。100個部首字都是常用字,第壹個拼音字母為廣大用戶所熟知。基本筆畫出於唐宋以來沿習壹千多年的“永字八法”,念作:橫、豎、撇、點、捺、挑、彎、勾。凡帶鉤的壹律作勾。用8種筆畫顯然比5筆、6筆更符合漢字實際,又大大增加了區分重碼的離散度。

2,筆順的七條規則:五萬多個漢字,其形體千變萬化,但書寫的筆順只有下列七條簡單的規則。(“杞”字碼等編碼將筆順規則增加到10條以上,是不合理的。)初小文化程度的用戶,從小到老都應遵守這些規則,千百年來已成人們的習慣。無論從習慣上說,還是從視覺上說,起筆部首、續筆部首和接尾部首收筆部首、是最容易識別的。漢字中80%以上為形聲字,由形旁與聲旁兩個偏旁組成,取起筆部首、續筆部首和接尾部首、收筆部首,也就完全兼顧了左右或上下兩個偏旁,而不至於集中在壹個偏旁裏,充分發揮了加大離散度和去重碼的作用。

依筆順的7條習慣規則(先橫後豎、先撇後捺、先左後右、先上後下、先外後裏、先外後裏再封口、先中間後兩邊),將漢字分解為部首(包括筆畫);分解部首取最多筆畫者。

漢字筆順規則並舉例如下:(1)先橫後豎 “十”為“壹丨”“幹”為“壹壹丨”(2)先撇後捺 “人”為“丿 ”“大”為“壹丿 ”(3)先上後下 “兀”為壹丿乚”“區”為“壹丿丶乚”(4)先左後右 “麽”為“丿 丶”“仆”為“丿丨丨丶”(5)先外後裏 “月”為“丿?壹壹”“勺”為“丿?丶”(6)先外後裏再封口 “日”為“丨?壹壹”“四”為“丨乛丿 壹”

(7)先中間後兩邊 “小”為“亅′丶”“山”為“丨 丨”以上是為了說明筆順規則,將例字分解成筆畫,而本發明的編碼表,則是依筆順分解部首,每壹步分解以最多筆畫的部首為原則。如“鞘”字分解為“廿口十小月”,而不是“壹…壹”等等。漢字中極個別字需倒轉紙張書版寫成反文,如“或”字等,仍依實際書寫的筆順分解部首。

3,編碼實例:(1)部首字:100部首表中的部首,既是最常用的部首,又基本是獨立的常識字。我反對把部首割裂成支離破碎的“字根”或“字元”,因為除了專門的編碼員外誰都不識。部首以音歸類,分壹筆部首和組字能力較強的鍵名部首、壹般部首。這樣區分目的,是為了下面給復合字編碼時減少重碼字,使用上述100部首的漢字全息碼電腦通用鍵盤輸入技術,其編碼步驟全部采用四個代碼輸入方法。在檢索單部首字時不必區分,都以部首拼音聲母、韻母的第壹字母、起筆筆畫、續筆筆畫、末筆筆畫代碼擊鍵,正體、變體、簡體、繁體都這樣編碼,不能再分筆畫的擊O鍵。

因為壹個拼音字母之下有幾個部首字,用上述三個筆畫具有8×8×8=512的離散度,不會有重碼。例如:壹:HHOO 二:EHHO 三:SHHH::MDGO 門:MDSG 金:JPNH馬:MWGH 木:MHSN 目:MSWH在同壹拼音字母下,由於離散度大,部首基本不重碼。

(2)兩個部首的復合字:也用4個拼音字母代碼,擊鍵4次。

本發明編碼不用字型區分,與王永明發明的“五筆字型”不同。王永明將字型分為左右型、上下型、雜型,實際上漢字字型遠不止3種,還有左中右、上中下、對角、交叉、半包、全包等多種,而且有時實難區分。信息利用的價值,在於信息的確定性。對於邊界模糊的、難以區分的信息,用了反而容易出錯。故本發明的全息碼將字型區分排除在外。

兩個部首的復合字,編碼如下:××××起起收末筆 筆筆部筆部首 首部末部末筆 筆首畫首畫這樣,在兩部首代碼相同的情況下,還有8×8=64種離散度,比王永明用3種字型和5種筆畫區分的3×5=15種離散度大4倍以上,因此重碼少得多。

如起、末兩部首為鍵名部首,可特殊對待,不需加筆畫來區分,都改為O,用移動O還可以調整重碼字使之不重碼。雙部首復合字編例:冰:BTSO 江:SOGH 扛:TOGO閏:MGWO 枉:MOWO 枚:MOWN(3)三個部首復合字:4個代碼依次為:起筆部首、起筆部首末筆畫、續筆部首、收筆部首。當起筆部首為鍵名部首時,連擊O鍵,不再擊其末筆筆畫代碼。例如:種:HDKS 桂:MOTT 花:CORB祝:QDKE 賀:LPKB 妳:ROBX合:ROHK 歡:YDBR 樹:MOYC如遇極少的重碼字,可用插入O去重。0鍵去重碼的作用很大,因為用足26個字母比用25個字母增加離散度為264-254=66,351,大大減少重碼。

(4)四個以上部首的復合字:壹般取起筆部首、起筆部首末筆畫、接尾部首、收筆部首。若遇起筆部首為鍵名部首時,第二碼改為續筆部首。

本發明充分利用26個字母,總離散度為26×26×26=456,976,對區分6萬個漢字已足夠。例:民:GGHG 族:TBRQ 麒:AWEB麟:AGWS 醇:XHLH(5)詞語文獻快速碼:本發明的全息碼,離散度達到456,976,除可輸入5萬多漢字外,還可輸入40萬條詞語。輸入詞語,同樣是用4個拼音字母,擊鍵4次,這就意味著可以大提高輸入單字的速度。漢字詞語有2、3、4、5…等單字構成,40萬條詞語平均約120萬字,原來要擊鍵120萬×4=480萬次,現在只要擊鍵160萬次,平均每個方塊字輸入擊鍵為1.33次,漢字具有單字構詞能力,壹個方塊字相當於西文壹個詞匯,這就大大優於任何壹種西文詞語。

1).二個字的詞語編碼:2個字都分別取起筆部首與收筆部首(部首字改為末筆畫),為4個字母的等長碼。如詞語中有壹字為鍵名部首字,作特殊對待,後加O碼,以區別末筆畫相同部首。如:海洋:SDSY 國家:MHDB 乙炔:GGHR人民:ROGG 幸福:TSQT 辛勤:LSNL2)三個字的詞語編碼:第壹個字取首尾兩個部首,再取第二、三字的起始部首;如第壹個字為部首字,取其起始部首、末筆筆畫;如第壹個字為鍵名部首,則取其部首編碼加O。例如:地球儀:TGWR;金字塔:JODT;大世界:QNNT;不夜城:DBTT;遊樂場:SHPT。

3)四個以上字的詞語:取壹、二、三及末字起始部首。如:統壹戰線:YHBY,胸有成竹:YSAZ;成竹在胸;AZSY;中華人民***和國:KRRM;諾貝爾獎金:YBBJ;馬列主義:MDTD;馬克思列寧主義。MSTD;魯迅全集:VGRZ;二十四史:ESMK;達爾文學說:QBWY;高能物理:TSNW;萬裏長城:DLPT;萬裏長征;DLPE。

當然,專用名詞還可劃分詞類編碼,如“中華 人民 ***和 國”為“KSRS ROGG NBHK MWDH”,劃分後譯成方塊漢字同“中華人民***和國(KRRM)”。

在上述編碼輸入技術的基礎上,為了充分利用公知電腦通用鍵盤,另選用100個部首,它們以二位數字代碼代替拼音字母,安排在同壹電腦通用鍵盤英文鍵上部的0-9***10個數字鍵上,其結構如下:數字鍵 部首部分 數字鍵 部首部分 數字鍵 部首部分 數字鍵部首部分01 壹(壹) 02 丨(丿) 03 丿( ) 04 丶( 丶)05 06 丿 07 ?( ) 08 ?6?5( )09 二( ) 10 十( ) 11 廠( ) 12 丁( )13 蔔(蔔) 14 乂 15 八(丷 ) 16 人(?亻)17 勹( ) 18 兒(兒兒) 19 幾(幾 ) 20 匕21 冫(丄) 22 ( ) 23 24 凵25 厶( ) 26 又 27 了 28 刀(刂)29 力 30 三( 彡巛) 31 幹( ) 32 土33 工( ) 34 卄( 屮) 35 寸 36 扌( 手)37 口 38 山 39 巾 40 夕(久)41 廣 42 門 (門) 43 ( 彐 ) 44 屍(卩已)45 弓 46 己( ) 47 女 48 幺( )49 馬(馬) 50 小(忄 ) 51 習(習) 52 豐( )53 王 54 韋( ) 55 廿(? ) 56 木

57 犬(大犭 豕) 58 歹 59 車( ) 60 止( )61 日 62 貝(貝) 63 牛( ) 64 爪(爫 )65 月(日 ) 66 67 文(攵) 68 火(灬)69 心(忄 ) 70 爿(爿片) 71 水 ( 氵) 72 示(示衤)73 石 74 目(目四) 75 田 76 禾77 白 78 立 79 穴 80 耳(阝卩)81 西(西) 82 蟲 83 竹(?6?8) 84 臼83 86 衣( 衤) 87 羊( ?6?2) 88 走( 之辶廴)89 巫( ) 90 裏( ) 91 足(?6?4) 92 身93 言(訁) 94 面 95 隹 96 金(钅)97 魚(魚) 98 骨 99 食 (食饣) 00 髟這種輸入技術簡稱為“全息Ⅲ碼”,其編碼步驟除了部首有唯壹的編碼,毋須用起末筆畫外,其它編碼順序則似“全息Ⅰ碼”。編碼步驟則全部采用六個代碼輸入方法。

“全息Ⅱ碼”與“全息Ⅰ碼”在總體上是壹致的,都順應了群眾對部首、筆順、筆畫的常識、習慣,少利用拼音這壹信息,是完全適應不識西文和拼音字母的用戶的,但它可用於只有10個數字鍵的更小的鍵盤,也適用於用數字代碼的電報碼。它的又壹特點是離散度更大,為100×100×100=100萬,是“全息Ⅰ碼”離散度約46萬的2.2倍,可容納的字、詞更多而重碼更少。

2.編碼實例:

“全息Ⅲ碼”規則基本上同“全息Ⅰ碼”,但考慮到Ⅲ碼是兩個數字碼針對壹個部首字,不需要在同壹個拼音字中用起末筆畫來選定,故用*來填空位,重碼字亦可用*號並移動它來區分;括弧內的變體則加擊起筆筆畫、續筆筆畫。

(1)單部首字:在6位數中第壹、二位擊其編號,後連擊空格鍵填空;括弧內的變體則加擊起筆筆畫、續筆筆畫。

壹:01**** 二:09**** 三:30****:23**** 門:42****馬:49**** 木:56**** 目:74****(2)雙部首復合字:在6位數中第壹至四位擊其編號,後連擊空格鍵填空冰:2271** 江:7133** 扛:3633**閏:4253** 杠:5633** 枚:5667**(3)三個以上部首復合字:在6位數中第壹至六位編號,例種:763702 桂:56323 花:341620祝:723718 賀:293762 妳:161750合:160137 歡:261716 樹:562635民:330108 族:211657 麒:410915麟:410702 醇:812701(5)詞語文獻快速碼:(1)雙字詞:取第壹字起、末部首(如首字為部首字,則改為第二字起筆部首)、第二字末部首,例:海洋:710487 國家:230122 乙炔:086816人民:163308 幸福:321075 辛勤:781029(2)三字以上詞:取第壹個起筆部首、第二字收筆部首、末字收筆部首。例:

地球儀:370414 金字塔:960137大世界:571709 不夜城:120504遊樂場:715009統壹戰線:480104 胸有成竹:656583成竹在胸:118324 中華人民***和國:371001諾貝爾獎金:936296 馬列主義:495814馬克思列寧主義:4910143.調整部首、去重碼與功能鍵(1)調整部首:部首是可以調整的。為了統壹“全息Ⅰ碼”與“全息Ⅱ碼”,才統壹用“100部首”的名稱。“Ⅰ碼”與“Ⅱ碼”也可不統壹,“Ⅰ碼”可增減部首,甚至可用《康熙字典》的214個部首,也可用王竹溪的56個新部首,或更少的部首,但用100個左右為宜。“Ⅱ碼”可減少到100個以下,保持二位數,反之,亦可對部首字和數百個常用偏旁字編成三位數,取二個部首、偏旁字編成6位數碼,也可取三個部首、偏旁字編成9位數碼。只要查碼方便,有足夠的離散度就行。

如“三”為071,“劉”為271,那麽“瀏”為071271(六位碼)或071***271(九位碼)。其余類推。

(2)去重碼:重碼率再低,總還有個別重碼字或重碼詞。“Ⅰ碼”可用擊0鍵並移動其位置或擊1、2、3……8、9、0數字鍵去重碼。“Ⅱ碼”可用*鍵去重碼,去重碼的讓碼以詞頻為序。

(3)功能鍵:提示,改錯,分簡繁體、正字、異體、訛體,中西文夾排等,都可使用多余的鍵。

綜上所述,本發明的優點還在於易推廣、用途多。至少可以有下列幾項可供開發應用:1.中文電腦打字、編輯、排版;

2.電報碼與電傳碼統壹於拉丁字明碼,並且比西文簡約,可由機器自動譯碼為中文,可大大節約人工、費用;

3.全國郵政編碼統壹,人人可自編,且使地址的字母化略寫與郵政編碼相壹致。全國幾百個省、市、幾千個縣基本上不重碼。省、自治區、市、縣、鄉、鎮等行政區劃單位:北京:SBTX 上海:BHSD 天津:ERSG廣州:AODS 廣東:AOHX 廣西:AOXH雲南:ESSS 浙江:SDSG 江西:SGXH江蘇:SGCB 福建:QTJZ 湖北:SYSB湖南:SYSS 青海:FYSD 河南:SKSS海南:SDSS 新疆:LDGH 西藏:XHCD貴州:KBDS 寧夏:DDDX 臺灣:SKSG四川:MHPS 遼寧:LZDD 吉林:SKMM河北:SGSB 山東:SSHX 山西:SSXH安徽:DNEW 黑龍江:LHSS 內蒙古:MRCS4.中外文機器助譯。中國人學外語、外國人學漢語,主要困難不在語法,而在於記大量詞匯。全息碼使漢字、漢語詞匯化為四個拉丁字母,這就比貯存西文容易。有了全息碼,中國人與外國人只要化很少的時間學會語法、字母拼音法則、編碼方法,就能借助機器的詞匯對譯來進行對話交流。壹個人要掌握幾門外語是很容易的。翻譯專業工作者也可省去大量查辭典的功夫。

5.古漢語與白話文機器助譯。原理同上。

6.速記。用全息碼速記統壹、規範、迅速,對速記整理、翻譯也可借助機器,省去大量時間。

7.縮寫。用全息碼可用1.33個拉丁字母代替壹個方塊漢字,可大量節約篇幅時間。

8.圖書編目、辭書索引用全息碼,規範、簡便,不重碼,能消除難檢字。

9.速抄、縮錄。原理同速記、縮寫。

10.醫藥自我咨詢,及農村牧副漁工商文軍政各行各業管理咨詢。例如輸入①感冒②年齡③性別④肪膊⑤體溫⑥痰的濃與清⑦有否咳嗽等信息,即可輸出名醫名方。全息碼可作各種咨詢漢字卡。

以上10項都同本發明使繁難的方塊漢字變成超過任何壹種西文的全息碼有關。本發明發掘了漢字內在的美質,使漢字變成科學、規範、精煉、優美的集約化的編碼,從而成為東西方文明大交流的壹座宏偉的橋梁。