當前位置:成語大全網 - 古籍修復 - ocr文字識別

ocr文字識別

ocr文字識別分為印刷體文字識別和手寫體文字識別。文字識別方法的壹般流程為識別出文字區域,對文字區域矩形分割成不同的字符,字符分類,識別出文字,後處理識別矯正,文字檢測是文字識別過程中的壹個非常重要的環節。

ocr文字識別特點

文字檢測的主要目標是將圖片中的文字區域位置檢測出來,以便於進行後面的文字識別,只有找到了文本所在區域,才能對其內容進行識別,將文本行在水平方向解耦成slices進行檢測,再將slices區域合並成文本框。

CTPN結構與FasterRCNN類似,但加入了RNN(LSTM層)用於序列的特征識別來提高檢測精度,目前CTPN針對水平長行文本的檢測是工業級的算法魯棒,它可以從圖片或者PDF中識別和提取其中的文字內容輸出文本文檔,方便驗證用戶信息或者直接進行內容編輯。