如果我們將這些包含繁體字的文件導入到ABBYY FineReader PDF 15文字識別軟件中,可能會出現識別錯誤,那麽,我們該如何調整軟件,讓其順利識別繁體字?
壹、繁體字的識別錯誤
由於ABBYY FineReader PDF 15默認使用的識別語言是簡體中文與英語,因此,如果頁面中出現繁體字的話,如圖1所示,就會出現將繁體字識別為亂碼的狀況。
二、修正識別錯誤
鑒於以上原因,如果要修正繁體字的識別錯誤,就要將繁體中文添加到軟件的識別語言中,具體的操作如下:
1、打開語言編輯器
首先,我們需要打開語言編輯器,將繁體中文添加到編輯器中。
打開語言編輯器的方法有兩種,第壹種如圖2所示,ABBYY FineReader PDF 15完成頁面識別後,出現改進識別結果的提示,壹般情況下,如果文本出現了無法識別的語言,如繁體字,就會出現“打開編輯器”的鏈接。
如果您已經將提示窗口關閉的話,如圖3所示,也可以在軟件的頂部快捷菜單中,打開語言的下拉菜單,選擇“更多語言”選項。
這裏需要註意的是,我們可以直接將識別語言切換為繁體中文和英語,但如果需要同時包含簡體中文與繁體中文的話,就要打開“更多語言”選項。
2、勾選繁體中文
打開語言編輯器後,如圖4所示,勾選“簡體中文和英語”以及“繁體中文”,即可將兩種語言添加到當前識別語言中。
3、重新識別所有頁面
完成識別語言的調整後,回到ABBYY FineReader PDF 15的主界面,並單擊其頂部快捷菜單中的“識別”按鈕,即可重新識別所有頁面。
如圖6所示,可以看到,重新識別頁面後,頁面中包含的繁體字就被正確識別出來了。
三、小結
綜上所述,ABBYY FineReader PDF 15不僅提供了常用的簡體中文與英文的文字OCR識別功能,而且還內置了繁體中文的識別語言,可供我們隨時添加使用。