當前位置:成語大全網 - 漢語詞典 - 如何使用ABBYY識別頁面中的繁體字

如何使用ABBYY識別頁面中的繁體字

隨著港澳與內地交流的增加,文化交流日益頻繁。在資料收集和分享的過程中,我們可能會碰到壹些港澳文件,這些文件大部分是用繁體字書寫的。

如果我們將這些包含繁體字的文件導入ABBYY FineReader PDF 15,可能會出現識別錯誤。那麽,如何調整軟件才能讓它順利識別繁體字呢?

第壹,繁體字的識別錯誤

因為ABBYY FineReader PDF 15默認使用簡體中文和英文,如果頁面中出現繁體中文,如圖1所示,會被識別為亂碼。

第二,糾正識別錯誤

鑒於上述原因,如果要糾正繁體字的識別錯誤,必須將繁體字添加到軟件的識別語言中,如下所示:

1,打開語言編輯器

首先,我們需要打開語言編輯器,並在編輯器中添加繁體中文。

有兩種方法可以打開語言編輯器。第壹種方式如圖2所示。ABBYY FineReader PDF 15完成頁面識別後,會出現提示改善識別結果。通常,如果文本以無法識別的語言出現,如繁體中文字符,則會出現“打開編輯器”的鏈接。

如果已經關閉提示窗口,如圖3所示,還可以打開軟件頂部快捷菜單中的語言下拉菜單,選擇“更多語言”選項。

這裏需要註意的是,我們可以直接將識別語言切換為繁體中文和英文,但是如果需要同時包含簡體中文和繁體中文,就要打開“更多語言”選項。

2.檢查繁體中文。

打開語言編輯器後,如圖4所示,選中“簡體中文和英文”和“繁體中文”,將兩種語言添加到當前識別的語言中。

3.重新識別所有頁面

調整識別語言後,返回ABBYY FineReader PDF 15主界面,點擊頂部快捷菜單中的“識別”按鈕,重新識別所有頁面。

如圖6所示,可以看出,重新識別頁面後,頁面包含的繁體字被正確識別。

三。摘要

綜上所述,ABBYY FineReader PDF 15不僅提供了常用的簡體中文和英文OCR識別功能,還內置了繁體中文的識別語言,可以隨時添加使用。