當前位置:成語大全網 - 古籍修復 - 如何使用ABBYY識別頁面中的繁體字

如何使用ABBYY識別頁面中的繁體字

隨著港澳與內地的交流增多,在文化上的交流也變得日益頻繁。我們在進行資料收集、分享的過程中,可能會接觸到壹些港澳文件,而這些文件大多是以繁體字的形式撰寫。

如果我們將這些包含繁體字的文件導入到ABBYY FineReader PDF 15文字識別軟件中,可能會出現識別錯誤,那麽,我們該如何調整軟件,讓其順利識別繁體字?

壹、繁體字的識別錯誤

由於ABBYY FineReader PDF 15默認使用的識別語言是簡體中文與英語,因此,如果頁面中出現繁體字的話,如圖1所示,就會出現將繁體字識別為亂碼的狀況。

二、修正識別錯誤

鑒於以上原因,如果要修正繁體字的識別錯誤,就要將繁體中文添加到軟件的識別語言中,具體的操作如下:

1、打開語言編輯器

首先,我們需要打開語言編輯器,將繁體中文添加到編輯器中。

打開語言編輯器的方法有兩種,第壹種如圖2所示,ABBYY FineReader PDF 15完成頁面識別後,出現改進識別結果的提示,壹般情況下,如果文本出現了無法識別的語言,如繁體字,就會出現“打開編輯器”的鏈接。

如果您已經將提示窗口關閉的話,如圖3所示,也可以在軟件的頂部快捷菜單中,打開語言的下拉菜單,選擇“更多語言”選項。

這裏需要註意的是,我們可以直接將識別語言切換為繁體中文和英語,但如果需要同時包含簡體中文與繁體中文的話,就要打開“更多語言”選項。

2、勾選繁體中文

打開語言編輯器後,如圖4所示,勾選“簡體中文和英語”以及“繁體中文”,即可將兩種語言添加到當前識別語言中。

3、重新識別所有頁面

完成識別語言的調整後,回到ABBYY FineReader PDF 15的主界面,並單擊其頂部快捷菜單中的“識別”按鈕,即可重新識別所有頁面。

如圖6所示,可以看到,重新識別頁面後,頁面中包含的繁體字就被正確識別出來了。

三、小結

綜上所述,ABBYY FineReader PDF 15不僅提供了常用的簡體中文與英文的文字OCR識別功能,而且還內置了繁體中文的識別語言,可供我們隨時添加使用。