中被認為是壹個詞語,如 阿波羅 ,有的詞語被識別為多個詞語,如 壹字之差
。這樣的差別就是Word在分詞方面的bug。下面就談談如何實現對Word漢語分詞自定義。
首先特別要感謝Excelhome論壇sylun兄。之前我還壹直固執地認為Word只支持導入英文詞典,對於中文詞語不支持自定義,是這位哥哥告訴我,可以通過導入微軟拼音輸入法自造詞實現自定義分詞效果。我的工作其實就是想辦法把這個效果的實現更簡單壹些:不再必須安裝龐大的微軟拼音輸入法,且壹經導入制作的自造詞在用戶間可以簡單實現通用。
效果如下:
1、 首先不做任何操作,打開測試文檔,點擊“統計每段詞語數”看看結果。不保存關閉文檔。
2、 運行Word自造詞工具.exe,點擊修改按鈕。
3、 再次打開測試文檔,點擊“統計每段詞語數”看看結果。兩次結果是否相同。
原來每壹段都被自定義成了壹個詞語。(回車符除外)