當前位置:成語大全網 - 古籍修復 - 用Adobe Acrobat 7.0 Professional 和,尚書7號OCR。把掃描版的PDF轉換為TXT格式輸出來怎麽是亂碼呢

用Adobe Acrobat 7.0 Professional 和,尚書7號OCR。把掃描版的PDF轉換為TXT格式輸出來怎麽是亂碼呢

原因有幾方面:

1。掃描版的pdf分辨率太低,或掃描質量差。

2。jpeg的分辨率低,壹般300dpi才能較好識別。此項可在acrobat生成圖像文件時參數調整。質量設為高。

3。識別語言不對路。尚書七號-文件-系統設置,調整語言。目前國產這類免費軟件壹般只支持中文,中英文,或繁體。妳識別其他語言,最好找能識別多種語言的OCR軟件。如泰比finereader10軟件。

4。識別頁面傾斜,或橫豎排版,表格橫放,都影響識別。尚書中要相應調整。

5。數學化學符號非線性的也是亂碼或白板。

6。另外,識別正確率不可能100%,加上以上因素時,看上去就會整個亂碼。

換壹換其他OCR,如紫光th-ocr,readiris corporate12(加東亞語言包)再試試。