如何使用ABBYY識別頁面中的繁體字

隨著港澳與內地的交流增多，在文化上的交流也變得日益頻繁。我們在進行資料收集、分享的過程中，可能會接觸到壹些港澳文件，而這些文件大多是以繁體字的形式撰寫。

如果我們將這些包含繁體字的文件導入到ABBYY FineReader PDF 15文字識別軟件中，可能會出現識別錯誤，那麽，我們該如何調整軟件，讓其順利識別繁體字？

壹、繁體字的識別錯誤

由於ABBYY FineReader PDF 15默認使用的識別語言是簡體中文與英語，因此，如果頁面中出現繁體字的話，如圖1所示，就會出現將繁體字識別為亂碼的狀況。

二、修正識別錯誤

鑒於以上原因，如果要修正繁體字的識別錯誤，就要將繁體中文添加到軟件的識別語言中，具體的操作如下：

1、打開語言編輯器

首先，我們需要打開語言編輯器，將繁體中文添加到編輯器中。

打開語言編輯器的方法有兩種，第壹種如圖2所示，ABBYY FineReader PDF 15完成頁面識別後，出現改進識別結果的提示，壹般情況下，如果文本出現了無法識別的語言，如繁體字，就會出現“打開編輯器”的鏈接。

如果您已經將提示窗口關閉的話，如圖3所示，也可以在軟件的頂部快捷菜單中，打開語言的下拉菜單，選擇“更多語言”選項。

這裏需要註意的是，我們可以直接將識別語言切換為繁體中文和英語，但如果需要同時包含簡體中文與繁體中文的話，就要打開“更多語言”選項。

2、勾選繁體中文

打開語言編輯器後，如圖4所示，勾選“簡體中文和英語”以及“繁體中文”，即可將兩種語言添加到當前識別語言中。

3、重新識別所有頁面

完成識別語言的調整後，回到ABBYY FineReader PDF 15的主界面，並單擊其頂部快捷菜單中的“識別”按鈕，即可重新識別所有頁面。

如圖6所示，可以看到，重新識別頁面後，頁面中包含的繁體字就被正確識別出來了。

三、小結

綜上所述，ABBYY FineReader PDF 15不僅提供了常用的簡體中文與英文的文字OCR識別功能，而且還內置了繁體中文的識別語言，可供我們隨時添加使用。