當前位置:成語大全網 - 英語詞典 - word分詞器分的詞怎麽都是壹個詞

word分詞器分的詞怎麽都是壹個詞

我們知道,Word中的words對象是Word可以識別的詞語,對於漢語詞語來說,有的詞語和我們的習慣並不完全相符。簡單的說就是有的詞語在Word

中被認為是壹個詞語,如 阿波羅 ,有的詞語被識別為多個詞語,如 壹字之差

。這樣的差別就是Word在分詞方面的bug。下面就談談如何實現對Word漢語分詞自定義。

首先特別要感謝Excelhome論壇sylun兄。之前我還壹直固執地認為Word只支持導入英文詞典,對於中文詞語不支持自定義,是這位哥哥告訴我,可以通過導入微軟拼音輸入法自造詞實現自定義分詞效果。我的工作其實就是想辦法把這個效果的實現更簡單壹些:不再必須安裝龐大的微軟拼音輸入法,且壹經導入制作的自造詞在用戶間可以簡單實現通用。

效果如下:

1、 首先不做任何操作,打開測試文檔,點擊“統計每段詞語數”看看結果。不保存關閉文檔。

2、 運行Word自造詞工具.exe,點擊修改按鈕。

3、 再次打開測試文檔,點擊“統計每段詞語數”看看結果。兩次結果是否相同。

原來每壹段都被自定義成了壹個詞語。(回車符除外)