如何將實體書轉化為電子書

制作工具:

1.掃描儀

不壹定是好的掃描儀，但最好能快壹點，這樣會節省很多時間。如果妳有足夠的錢，可以買壹個可以掃描A3紙的掃描儀，這樣可以掃描兩頁，做成壹頁。

2.OCR軟件

FINEREADER，這個軟件及其破解可以在百度或者狗裏找到。另外還自帶了很多語言包，可以識別很多語言(中文不太理想，可以找別人，同方識別能力很強)。建議安裝更多的語言包。(如果您正在進行PDF直接掃描，可以使用XP附帶的捕獲工具。)

掃描前的準備:

1.打開電腦，插上電源...這種廢話我就不多說了。

2.去谷歌看看有沒有妳想掃描的書的樣章。有就壹定要下載，哪怕是壹章。

3.設置FINEREADER:

a)測量書的尺寸，選擇工具菜單中的選項選項，切換到掃描/打開圖像頁面，點擊選擇源…按鈕，選擇要使用的掃描儀；然後選擇使用更精細的界面，切記不要選擇下面的“掃描前顯示選項對話框”。接下來，點擊右邊的掃描儀設置按鈕，在這裏填寫剛剛測量的書的尺寸。這樣在掃描到指定位置時，掃描儀會折返，不用走整個掃描儀的長度，當然節省了很多時間。最後，設置掃描間隔，我壹般設置為兩秒。

b)在與上壹步相同的界面中將掃描模式設置為灰度，300dpi。如果采用黑白模式，書裏的插圖會比較暗。

c)翻翻妳要掃描的書，主要是看看裏面有沒有什麽特殊的字符。比如有的數學書有很多公式等奇怪的字符，妳需要安裝相應的語言包。如果妳不想使用整個語言包，妳也可以自己定義壹個新的語言。這項工作是在工具菜單的語言編輯器…中完成的...語言包的安裝只是任務的壹半。為了讓軟件使用語言包或者妳自己定義的語言，妳還必須告訴軟件妳需要使用哪種語言來完成識別任務。工具欄上有壹個下拉列表框。默認值為英語。選擇選擇多種語言…...然後在彈出的對話框中勾選相應的語言。語言設置完成。(註意:這個功能很少用，壹般英語就夠了。)

d)點擊處理菜單，選擇開始背景識別，這樣就可以邊掃描邊識別了。掃描後，自動識別就結束了。

4.打開揚聲器，音樂響起，我們開始工作吧。

掃描識別時需要註意的問題:

1.如果妳的掃描儀不是超薄的，妳最好在旁邊放幾本書，高度和掃描儀壹樣，這樣妳掃描書的時候，書就不會塌到壹邊，可以省不少力氣。

2.有些厚書掃至中間，書脊會向上拱起，需要用力按壓，否則書脊附近的文字會扭曲，影響識別效果。壹般來說，掃到中間的時候，往往可以把書拉到兩邊或者用力向後翻，但是這樣會對書造成很大的傷害。如果借朋友的書來掃，不要這樣做，註意不要被壓平；如果是圖書館的書也沒關系

3.目前還沒有壹款OCR軟件可以100%識別書中的插圖。如果壹幅插圖中有非常多的橫線或直線，往往會被視為表格。有時候，不管三七二十壹就忽略它，把插圖當成文字。在這種情況下，您只能手動指定識別區域的類型。方法很簡單。只需選擇垂直工具欄上的圖形區域按鈕，並在掃描的圖形上繪制壹個矩形框。

4.只有當文本識別區域的大小發生變化或者添加了新的文本區域時，才需要重新識別頁面。如果只是刪除文字區域或者把文字區域變成圖形區域，就不需要再識別了。

5.FineReader處理表單很好，壹般不需要對表單的標識做任何改動。如果要在表單中添加或刪除分隔線，只需使用垂直工具欄上的響應按鈕，更改的結果會立即顯示出來，無需識別頁面。

6.為了確保準確性，在OCR之後，需要進行拼寫檢查。最常見的錯誤是將L(小寫L)與1(阿拉伯數字)、0、o混淆，如果能找到壹些規律，比如很多r0被識別為ro，可以使用替換函數，壹次性替換。這樣就不會再得到錯誤提示了。

標簽

以上只是我自己制作掃描電子書的壹些經驗。FineReader是壹個功能強大的軟件，有些功能我還沒用過，比如模式編輯器等。希望本文能起到拋磚引玉的作用，對想做電子書的朋友有所幫助。

制作掃描電子書是壹項大工程。制作高質量的電子書是需要時間和精力的，但是當妳完成壹部電子書的時候，感覺就像是壹部傑作。