1.漢字的五筆
所有的漢字都是由筆畫組成的。書寫漢字時,連續不斷地書寫壹行,不中斷,稱為漢字筆畫。筆畫的基本形式是點和線,它們在漢字中的位置不同,筆畫也有壹些變體。把筆畫的基本形式和變形加在壹起,有很多不同的形狀。“五筆字型”只考慮筆畫方向,不考慮長度,將漢字筆畫分為橫、豎、左、右、左五類。根據這五種筆畫在漢字中出現的頻率,1、2、3、4、5依次作為這五種筆畫的代號。
在漢字特定的形態結構中,“壹、壹、壹、二、二”的基本筆畫往往因筆畫和結構的差異而發生變化,有些基本筆畫的大小和長短有時不壹致,從而導致各種筆畫變異。橫、豎、撇、撇四種筆畫中都有相應的短筆畫。提筆和撇筆外形相似,但筆畫方向不同。因為提筆的筆畫方向是從左到右,屬於橫。這種變化仍然保留了基本筆畫的變形特征。這種變化有壹些例子,比如:豎左鉤屬於豎,豎右鉤屬於折。
凡是有轉折的筆畫,不管有多少折,都歸為折。
漢字的五種基本筆畫“壹、壹、二、壹、二、二”不是編碼的基本單位,只是起輔助作用,偏旁是漢字編碼的基本單位。
從基本筆畫轉換的筆畫是與基本筆畫相同種類的筆畫。這是因為:
(1)從“現在”和“王”兩個字的側面可以看出,提筆其實是壹種橫向變形。
(2)從“村”字在“木”字旁邊可以看出,筆“三”實際上是四的變形。
(3)從舊體中的“木”字可以看出,左鉤豎筆應該是豎的。
(4)其他所有帶轉折、拐角的筆畫,都屬於“折”的範疇。
2.漢字的三個層次。
壹個完整的漢字,既不是壹系列不同筆畫的簡單排列,也不是各種筆畫的任意堆積,而是幾個筆畫的復合連接和交叉形成的相對恒定的結構。壹般來說,“裏”“裏造張”是指“裏”字由“木”“子”字組成,“張”字由“裏”“造”字組成,都是基本詞根。
構成漢字筆畫結構的構詞法,常稱為字根,如:日、月、金、木、水、火等。
壹般來說,字根是有形的、有意的,是漢字的基本單位。字根就像積木壹樣,通過拼讀組合成大量的漢字,如明、林、森、陸、經、能等。
可見,漢字在結構上可以分為三個層次,即筆畫、字根和漢字。
特別是部首是文字學中的壹個概念。漢字編碼時,不能用偏旁的概念。壹方面,沒有人能肯定地說,根有很多種,哪些是根,哪些不是;另壹方面,部首的概念並不能解釋所有漢字的構成,總有很多漢字是“不清楚”的,因此無法設計出壹致的編碼規則。
3.三種漢字字體
漢字是壹種平面文字。同樣的詞根放在不同的位置,可能會變成不同的詞。比如用“口”和“八”這兩個偏旁部首,既可以構成“嗶”,也可以構成“只”。再比如:“口”和“木”的根既可以形成“杏”,也可以形成“鈍”。
因此,字根的位置關系也是漢字的重要特征信息。這個“字體”信息是告訴計算機輸入漢字時,輸入的偏旁部首的排列組合,有利於計算機識別。
根據漢字字根的位置關系,千方漢字可分為左右式、上下式、混合型三種,並依次編號為1、2、3,如表2-2所示。
4.部首結構的四種關系
所有的漢字都是由基本部首組成的,根據位置關系可以分為四種基本結構。分析漢字的結構是為了正確確定不同漢字的字體。
(1)單個
僅指基本根本身就單獨構成了壹個漢字。
如:“於、於、朱瑾、車”等。
這類漢字不再劃分為某壹種字體,而在吳彼字體中稱為鍵名部首或字部首漢字,並有特殊的取碼規則。
(2)散射
分散是指漢字的基本字根能保持壹定的距離。
如“講、胖、亮、張、吳”等等。
從漢字中提取左右、上下、混合類型的字體信息時,是以字根之間的這種“散”關系為前提的。因此,這類漢字的字體可分為左右型或上下型。
(3)偶數
連是指壹個基本的根與壹個單壹的中風。
比如“目”變成“子”,“十”變成“錢”,“嶽”變成“齊”。這樣的字雖然不多,但是很容易被當成下義詞,其字體應該屬於混合型。
另壹種情況是指“點狀結構”。如:勺、術、泰、大師等。壹個基本部首之前或之後的這種孤立點,都被認為是與基本部首相連的,這類詞都被認為是“相連”的結構。
這種聯系只存在於單筆和字根之間,而不存在於字根和字根之間。
(4)薪酬
交集是指由幾個基本偏旁重疊而成的漢字,如“申”由“日”組成,“李”由“日”組成,“易”由“壹、弓、人”組成等。這種漢字的字體應該屬於混合型。
在部首組合中,也有混合型,即幾個部首之間既有連接又有交叉的關系。比如“硬幣”這個詞,上面有壹條毛巾,毛巾是由“葉“還有”丨".自然,這類漢字的字體也屬於混合型。
根據以上分析,可以總結如下:
(1)基本詞根獨立成詞,在選碼中對其有特殊規定,不需要判斷字體。
②屬於“三”的漢字可分為左右型、上下型。
③漢字的“連”和“角”都是雜合的。
(4)漢字無論左右上下,都是雜合的。
漢字的編碼就是用壹組代碼來表示漢字。比如用數字表示的電報碼,用拼音字母表示的拼音碼。在五筆字型輸入法中,漢字編碼是指壹個漢字由哪些偏旁部首組成,即由哪些鍵輸入。這些鍵是這個漢字的編碼,或輸入碼。
為了便於記憶,將吳彼字體的選碼規則編制成壹個公式。:
五筆直觀,按筆順編碼;
用漢字打四遍鍵名,請抄基本字根;
壹、二、三末尾取四碼,先拆單;
註意少於四碼,交叉識別後面。
這個公式可以概括為五筆字型拆分取碼的幾個原則,概括如下:
(1)對於鍵名,可以連續按鍵四次。
(2)對於字根,可以用筆畫輸入。
(3)對於大量的離調詞,應遵循以下拆分原則:
按照書寫順序,從左到右,從上到下,從外到內。
以碼為基本部首單位的原則。
按照壹、二、三、最多四碼的原則。
單體結構分裂優先的原則。
末筆字體交叉識別原理,其中末筆識別碼=末筆區號(十位數,1 ~ 5)+字體代碼(個位數,1 ~ 3) =對應字母鍵,如表4-1所示。
吳彼字體輸入法將人工輸入分為三類,分別是:
1.鍵名漢字輸入
鍵名漢字是各個位置使用頻率最高的兩個偏旁部首,其他24個偏旁部首除了“壹”本身就是壹個漢字。帶鍵名的漢字有25個鍵名。漢字的輸入方法是雙擊鍵名所在的鍵四次。比如:
地球:FFFF日:JJJJ
木:SSSS月:EEEE
因為每個漢字最多可以輸入四個代碼,輸入四個相同的字母後,不要再按空格鍵或再次輸入,字符會直接出現在屏幕上。
有25個漢字的鍵名* * *,即:
王途大木宮
穆裏庫天山
他白玉娥任堇
做壹個水與火的陳述。
生了壹兒壹女。
2.輸入詞根
在吳彼字根鍵盤的每個鍵位上,除了壹個鍵名字根外,還有幾個不同號碼的字根。其中壹些也是壹個漢字,我們稱之為字根。
所有詞根的輸入采用統壹的規則,可以用公式表示:
鍵名代碼+第壹個代碼+第二個代碼+最後壹個代碼
也就是說,當妳要打壹個字根時,要先打它所在的鍵,然後依次打它的第壹筆、第二筆、最後壹筆。即在鍵入鍵名後,鍵入三個單筆畫。如果詞根只有兩個筆畫,則以空格鍵結束。例如:
文字:按下鍵名41,第壹支筆41,第二支直筆11,最後壹支筆41,即YYGY,屏幕上立即出現“文字”字樣。
出發地:25 21 51 1 1(馬來西亞)
十:12 11 21(FGH)
作為字根特例的單筆畫有五種,其編碼有特殊規定。擊兩次單筆畫的鍵後,再擊兩次L鍵。這是因為單筆畫不是常用漢字,增加了兩個後綴L鍵來區分常用漢字的簡體輸入。
壹:11 11 24 24(GGLL)
丨:21 21 24 24 (HHLL)
:31 31 24 24 (TTLL)
額:41 41 24 24 (YYLL)
B: 51 51 24 24 (NNLL)
因為鍵名和字根的輸入方法與普通漢字不同,所以壹定要熟悉並記住哪些偏旁是字根,哪些偏旁是鍵名。鍵名和詞根仍然是漢字的基本單位。所以為了熟悉和記憶,要反復練習重點名稱和詞根。
3.輸入密鑰之外的單詞
詞根裏有壹百多個鍵名和關鍵詞。重點字以外的漢字都是偏重點字,而且有大量的偏重點字。遵循以下原則將漢字拆分成基本字根,然後根據需要選擇合適的基本字根,得到所需的漢字。
3.1拆分漢字的原則
吳彼字體輸入法拆分漢字的原理可以概括如下:
1.順序拆分。
按漢字書寫順序劃分。例如:
新:“李”、“木”、“金”正確,符合書寫順序。
“李”“金”“木”不對,不是書寫順序。
中文:“口”“口”字正確,符合書寫順序。
“口”與“口”的錯誤,不是書寫順序。
易:“壹”“弓”“人”正確,符合書寫順序。
“大”和“弓”不對,不是書寫順序。
2.優先考慮。
“先取大”也叫“先取大”。漢字按“書寫順序”編碼時,筆畫少的部首不能無限使用。否則,漢字將成為單筆字根。例如:
世界:“壹”“二”“二”錯誤
“二十”和“乙”是正確的。
顯然,前者是錯誤的,因為第二個詞根“通”完全可以加在“壹”上,形成多壹筆的詞根“20”。另壹個例子是:
轉儲:“兩個”錯誤
“月”和“亞”是正確的。
同樣,第壹個編碼是錯誤的。因為第二根的“二”可以向前“拼湊”成壹個更大的根“月”。
“取大優先”,俗稱“盡量湊”,是漢字取根時最常用的“基本法則”。
3.兼顧直覺。
在確認詞根時,為了使詞根的特征明顯易辨,有時需要“犧牲”掉“書寫順序”和“取最大優先”的原則,形成個別特殊情況。
比如:國,按書寫順序,其詞根應為:、王、薩依;但是,這種編碼不僅違背了詞的來源,也不能使詞根“直觀易辨”。只好違反了“書寫順序”和代號“王、撒”的順序。
4.到底能不能連接?
當壹個詞既可視為“連系”詞根,又可視為“相交”詞根時,就認為“連系”是可取的。因為壹般來說,“連”比“交”更直觀,能更好地展現詞根的筆畫結構特征。例如:
失落:“?”“老公”和“老公”連接正確。
"?"“大”和“大”是交叉錯誤。
朱:“嗯”和“不是”連接正確。
"?"“木”字是交集錯誤。
註意:當同時遇到“散”和“連”時,只要不是單筆,就判定為“散或不連”,即判定為散關系。
根據上述規則將異體字拆分成部首後,在編碼和選擇部首時應遵循以下原則:
(1)超過四個碼:取1,2,3的根碼和單詞的最後壹個字。例如:
惠:三個女孩三顆心
續:第十壹B大學的SFND
(2)就四碼:依次全部選中。例子:照片:太陽是刀刃。
榮:八卦掌
(3)少於四碼:部首輸入後,由於信息不足,需要加上“最後壹個字體的十字識別碼”。如果仍然少於四碼,請填充空格鍵。
註意:如果上述代碼無法輸入所需的漢字,請按空格鍵。如果您仍然無法輸入正確的漢字,則意味著您仍然需要輸入該字符的識別碼。
3.2漢字輸入的原則
任何壹個漢字無論分成多少個部首,最多只能取四個部首。因此,走調詞的編碼規則是:
四個或四個以上部首的漢字用四個部首碼編碼;少於四個部首的漢字,除了部首碼外,還必須加壹個最終識別碼。如果仍然不是四碼,按空格鍵。
當壹個漢字分成四個以上的部首時,取該漢字的第壹、二、三、四個部首碼組成壹個碼,順序依次輸入。當輸入最後壹個部首代碼時,漢字會自動顯示在電腦屏幕上,而不需要敲擊空格鍵。
當壹個漢字正好有四個部首,即取第壹、二、三、四個部首碼組成碼,依次取碼。當輸入最後壹個部首碼(第四個碼)時,漢字會自動顯示在屏幕上,不需要空格鍵。
這裏的第壹筆、第二筆、第三筆、最後壹筆是正常的書寫順序,從左到右、從上到下、從外到內。例子如下:
編輯:XYNA
圖:日本刀口(JVKO)
容量:八人(PWWK)
Ga:女孩越來越老了(VAJD)
明:溪口(SGQK)
3.3識別碼的定義
識別碼是“最後壹筆的十字識別碼”,由單字最後壹筆的類型號和單字的字體號組成。壹般來說,識別碼是兩位數,第壹位(十位)是最後壹個筆畫類型(橫1、豎2、撇3、撇4、折5)的編號,第二位(單位)是字體代碼(左右1、上下2、混合3)。把識別碼想象成壹個鍵的位置碼,也就是得到十字識別碼的字母鍵。
標識碼的作用是減少重碼,加快選詞速度,例如:
上例中“目”、“庭”、“撒”的代碼都是壹樣的(是),只是最後壹筆不壹樣,所以加上最後壹筆識別碼後,它們的代碼就不壹樣了。否則,它將被復制。同樣,“之”和“巴”的代碼是壹樣的(KW),只是字體不同,所以加了字體識別碼後,代碼就不壹樣了。
用於識別的最終筆畫有以下規定:
(1)任何與根或點狀結構相連的單個筆畫都被認為是雜合的。
(2)“可散不可連”原則也用於區分字體。知、卡、嚴都算是上下型。
(3)內外性格屬於混合型,如“困”、“轉”。但是“看”是上下的。
(4)有兩個部首且相交的雜合型,如:東、串聯、電、基本、無。
(5)“走紙”壹詞是壹種混合類型:金和符。
(6)以下字雜:書記、床、堂、尼、式、背、反、府、皮,但相近的左、右、有、見、人、布、友等。可以算是上下兩種類型。
為了提高輸入速度,我們會經常用漢字組成簡碼,前面只有壹個、兩個或三個偏旁,組成壹級、二級、三級簡碼來輸入高頻詞。只需在單詞前按壹個、兩個或三個部首,然後按空格鍵。因為省略了識別碼,簡碼的設計會給用戶帶來很大的方便。
1.壹級簡化代碼
從11到55 * * *,共有25個鍵碼。根據每個鍵的詞根特征,每個鍵排列壹個最常用的高頻漢字,按壹次鍵再打空格鍵即可輸入。有25個* *。例如:
壹個(11G)地(12F)在(13D)另壹個(14S)作品(15A)。
尚(21H)與(22J)、(23K)、(24L)、(25M)相同。
2.二級簡化代碼
兩級簡碼的漢字輸入法:只輸入單詞的前兩個部首碼,加上空格鍵。比如:
華:畢玉:王薩伊
紅色:YT張:弓長XT
媽媽:母馬VC克:古爾DQ
3.三級簡化代碼
三級簡碼由壹個字的前三個字根碼組成。只要壹個字的前三個字根碼在整個編碼體系中是唯壹的,壹般都選三級簡碼,有四千* *以上。這種漢字只需要輸入前三個部首碼,加上空格鍵即可。由於需要添加空格鍵,所以總的擊鍵次數並沒有減少,而且由於省略了最後壹個部首或“十字識別碼”的判斷,可以達到簡單易用、提高編碼輸入速度的目的。
漢字由字根組成,字根由筆畫組成,筆畫、字根、整字是漢字結構的三個層次。吳彼漢字編碼選用的部首多為繁體字部首,少部分非部首的筆畫結構被選用為部首,部分“部首”也是硬造的。
吳彼字體有130個基本偏旁,加上壹些基本偏旁的變體,大約有200 * * *。根據每個部首的起始碼,分為五個“區”。它們是1帶-水平帶、2帶-垂直帶、3帶-掠過帶、4帶-伸展帶和5帶-折疊帶。每個區域分為五個“位”,與區域和位對應的數字稱為“位號”。這樣,200個基本部首按規律放在25個位置號上,這些位置號用代碼11、12、13、14、15編碼;21、22……;51,52,53,54,55,分布在電腦鍵盤的25個英文字母鍵上。
每個位置都有壹個最常用的偏旁稱為“鍵名偏旁漢字”,它既是壹個構詞頻率很高的偏旁,也是壹個非常常用的漢字。首先,妳要記憶鍵名的偏旁部首,幫助妳理解和記憶每個鍵上的其他偏旁部首。以下是各區的重點名稱詞根,每個詞根右側括號內的數字代碼表示該詞的位置號。
區域1(水平區域):王(11)塗(12)達(13)木(14)宮(15)。
區域2(垂直區域):穆(21)日(22)口(23)田(24)山(25)
3區(撇區):何(31)白(32)嶽(33)任(34)金(35)。
4區(控制區):(41)這個字代表(42)水(43)火(44) (45)
第5區(折疊區):(51)兒童(52)婦女(53)和(54)婦女(55)
12年5月1日,土司二幹下了十寸雨。
13大狗三陽古石廠,14木丁溪,15宮格草頭右箱7。
21目有虎皮的上檔,22號早兩次貼蟲。
二十三口連川,字根疏。二十四田有四輛車。
25山有北,下壹箱是幾個。
31何竹是壹對人,文章是* * *三位壹體。
32看前三兩斤什麽都沒有,三月衫用的是家居服的打底。
三十四人八,三四裏,三十五金勺無尾魚,留小晚在狗身旁,無七。
41語言在41中廣泛使用,誰高誰就去。
42立信二分六門病,43他水邊小倒立。
44火業頭,4點米,45寶蓋,挑(顯)衣(衣)。
51半滿,左框壞了。
52子耳也是被誣陷的。
53女道九九山朝西。
54巴馬,失去了箭頭,
慈愛的母親沒有弓和匕首,她是軟弱的。
部分圖片無法上傳,請聯系我。