當前位置:成語大全網 - 書法字典 - 如何用java實現全文檢索

如何用java實現全文檢索

Lucene,壹個面向java的開源免費全文檢索工具。

Lucene並不是壹個完整的全文索引應用,而是壹個用Java編寫的全文索引引擎工具包,可以方便地嵌入到各種應用中,實現對應用的全文索引/檢索功能。

Lucene的作者:Doug Cutting,Lucene的撰稿人,資深全文索引/檢索專家。他曾經是V-Twin搜索引擎(蘋果公司Copland操作系統的成果之壹)的主要開發者,後來在Excite擔任高級系統架構師,目前從事壹些互聯網基礎設施的研究。他貢獻的Lucene的目標是為各種中小型應用增加全文檢索功能。

Lucene的發展:它發表在作者自己的www.lucene.com上,後來又發表在SourceForge上。2001年末成為APACHE基金會jakarta的子項目:http://jakarta.apache.org/lucene/.

許多Java項目都使用Lucene作為它們的後臺全文索引引擎。著名的有:

Jive:網絡論壇系統;

眉:郵件列表HTML存檔/瀏覽/查詢系統。本文主要參考文獻《Lucene搜索引擎:強大、靈活、免費》的作者是眉系統的主要開發者之壹,眉目前已經成為APACHE項目的主要郵件列表歸檔系統。

Cocoon:基於XML的web發布框架,全文檢索使用Lucene。

Eclipse:基於Java的開放式開發平臺。Lucene用於幫助部分的全文索引。

對於中文用戶來說,最關心的問題就是是否支持中文全文檢索。但是通過Lucene的結構介紹,妳會知道由於Lucene良好的架構設計,通過擴展其語言詞法分析接口,可以實現對中文的支持。