當前位置:成語大全網 - 古籍修復 - 排序法中的數字搜索法

排序法中的數字搜索法

編號方法是正文方法的壹種變體。它將漢字分解成各種筆形,用阿拉伯數字作為編碼,然後連接成壹組數字,再將漢字按數字大小順序排列。該方法的優點是忠誠度代碼位置固定,檢索速度快;缺點是不容易掌握筆畫數。編號方法很多,其中四角編號法應用最廣,其他如漢字、三角編號法等很少使用。四角編號法是根據塊狀漢字的特點發明的壹種查字方法。將代表不同編碼漢字四個角的筆畫並聯成壹個四位數字,然後將漢字按數字大小順序排列,這就是四角號碼查找法。四角數搜法具有知碼查字、不分部首、不計筆畫、不知讀音的特點。但是它的編號規則比較繁瑣,筆畫數的識別也相當困難。

四角號碼最初是由王提出的,稱為“四角號碼字符檢索法”。於1928編入《四角號碼學生詞典》。1964年,被修改並更名為“四角號碼查找法”,又稱“新四角號碼法”。目前,壹些參考書或采用新方法,或采用舊方法編排正文或輔助索引。如《四角號碼新詞典》和《現代漢語詞典》的正文、《中國系列綜合誌》第三卷即副標題標題索引和副標題作者索引按新方法編排;《辭源》輔助索引按老辦法排列。

四角編號法將漢字筆畫分為10種,分別用0到9作為編碼。公式是:

橫1豎2 3分,叉4插5盒6;

7角,8角,8角,9角小,點以下有水平變化。

取數字時,按漢字的左上角和右上角;左下角和右下角的順序是把它們的筆形碼並聯成壹組,就是這個字的四角數。為了便於排列,同號的字要取第五個角作為“附角”號,寫在數字下面,以示區別。比如京字的編號是27112。新舊辦法選角規則不同,如舊號“田”為10430;新號碼是10804。《新四角號碼詞典》和《現代漢語詞典》都附有“新舊四角號碼對照表”,以供參考。角編號的具體方法請參考本章附錄:⑤“四角編號查找法”;⑥“新四角號碼查找方法與舊四角號碼查找方法比較,主要修改”復印件。漢字提取是20世紀30年代原燕京大學編譯所用來編制中國古籍索引的壹種排序方法。“guǐ xiè”這個詞的意思是放入和取出。在這種方法中,“漢字”代表漢字的五種物理結構,以I-V為代碼;“吉劍”壹詞的筆畫分為10種,以0-9為代碼。其編號原理類似於四角編號法,只是編碼不同。比如“艾”字的筆畫形狀分為五種筆畫,即“0、1、2、3、4”作為編碼;“健”字的筆畫、筆畫分為五筆,分別為“才”、“益”、“廠”、“目”、“八”,分別以“5、6、7、8、9”為碼。並根據單詞的物理結構,確定其選號順序。例如,字體“中”按左上、右下、左下、右下的順序排列;字體“國”是先外左右,後內左右;“子”的字體首先是左上右下,然後是左下右下;“畢”字形首先是左斜邊的右上和左下,然後是右下的左上和右下;字體“Pick”是左半部分的左上右下;後者是右半邊的左上右下。得到數字後,數壹數這個字有多少個方塊,然後在數字後加上方塊的個數。如果沒有方塊,就加0,如果有9個以上的方塊,還是9。編號順序及其數字構成為以下格式:由字體/四角筆數得到的數字和方塊數的順序。如惠、田、的號碼分別為ⅱ/88881、ⅱ/888304、ⅰ/28220。

這種檢驗方法非常復雜,不便於推廣使用。由於燕京大學引文編纂系用這種方法編纂了60多種古籍索引,為了解決使用中的困難,近年來在影印出版這些引文中的壹部分時,增加了四角號碼檢索和漢語拼音檢索。也可以先用筆畫找出每個字的編號,再查索引文字。韻部排列,又稱“音韻”,是中國古代根據音韻排列漢字的方法。按韻排列的詞典叫韻書。我國在不同的歷史時期有不同的韻腳。宋代《廣韻》共分206韻。紀雲用的。自宋代開始流行的平水韻被刪除,合並為106韻,從而成為文人在詩歌中用韻的規範。壹些主要的工具書也是按韻排列的,如清代的《裴賦》、近代的《經典匯編》和《辭通》。《九史同名》按詞條首字排列。

用按韻排列的參考書查單詞。妳可以先通過新印的附索引找出這個詞的韻,然後再按韻查。例如,新出的《裴賦》和《辭通》都是用聲母和筆畫索引來編的。也可以先用相關詞典找出單詞的韻,再間接查。