用Adobe Acrobat 7.0 Professional 和，尚書7號OCR。把掃描版的PDF轉換為TXT格式輸出來怎麽是亂碼呢

原因有幾方面：

1。掃描版的pdf分辨率太低，或掃描質量差。

2。jpeg的分辨率低，壹般300dpi才能較好識別。此項可在acrobat生成圖像文件時參數調整。質量設為高。

3。識別語言不對路。尚書七號-文件-系統設置，調整語言。目前國產這類免費軟件壹般只支持中文，中英文，或繁體。妳識別其他語言，最好找能識別多種語言的OCR軟件。如泰比finereader10軟件。

4。識別頁面傾斜，或橫豎排版，表格橫放，都影響識別。尚書中要相應調整。

5。數學化學符號非線性的也是亂碼或白板。

6。另外，識別正確率不可能100%，加上以上因素時，看上去就會整個亂碼。

換壹換其他OCR,如紫光th-ocr，readiris corporate12（加東亞語言包）再試試。