據記載的資料,中國有十多萬種古籍。然而,長期以來,在我國古籍研究領域,由於計算機采用的雙字節編碼技術,許多生僻字和古文字無法在計算機平臺上顯示和編輯。
因此,大量古籍無法真正數字化,阻礙了中國文化的研究和傳播。
目前,這種情況正在好轉。據社會科學文獻出版社介紹,采用四字節處理技術的《說文解字》數據庫將解決7萬多個漢字的輸入和編輯,以及整個文獻的查詢管理等問題。這本書的出版,標誌著過去因大量生僻字而無法正常出版的古籍將重獲出版生命,古文字長期無法編輯的“堅冰”也將被打破。
據悉,《說文解字》的書和數據庫使用的四字節處理技術已經獲得專利。與此同時,出版商透露,類似的書籍和數據庫《康熙字典》的出版準備工作已接近完成。文史專家認為,以《說文解字數據庫》的出版為契機,我國古籍研究將進入新的數字化時代。