註意pdf文件中內容,有的是真實的文字,有的是掃描後的圖片,先區分壹下。
在得到每頁的jpg圖後,就可以打開OCR軟件,分別置入每張jpg後去ocr為文本,
校對後另存為txt即可了。
詳細關於尚書ocr的使用可見/view/93087089d0d233d4b14e699b.html