而在WORD中的拼音標註是這樣的:
從中可以看出“長”和“參”在其中作為多音字有“多可愛”,就算是同樣的長字,它們之間的處理方法也不壹樣(也許只是基礎數據上的差異也不壹定),在我們程序中給相關中文實現拼音助記碼時,同樣也面臨多音字的問題,比如“長春新堿”,正規的拼音助記碼應就是“CCXJ”。所以在布置拼音碼字典時要處理以下問題:
1、單字或者是語義無關時,使用頻度較高字的拼音,比如“參”字,大部分時間是“CAN”,只有人參時才叫“RENSHEN”,當然象劉羅鍋那樣“參人”的,還是念“CAN”,雖然它和“人”在壹起;
2、當壹個字是多音字時,就需要考慮字的上下文關系,比如我們上面所舉例的“長春”和“人參”等,它與前後文字有很大關聯,只在特定的環境下才讀某個特殊音。
回來看我們前面舉例的文字,就算是WORD和WPS對常用字或者是無關語義時的定位也不相同。所以不要指望真正能壹勞永逸地解決這個問題。
在我們實現自動助記碼時使用了以下的字典表