什麽是全文檢索全文檢索的簡介

全文檢索是壹種將文件中所有文本與檢索項匹配的文字資料檢索方法。那麽妳對全文檢索了解多少呢?以下是由我整理關於什麽是全文檢索的內容，希望大家喜歡!

全文檢索的簡介

　基本介紹

　全文檢索是將存儲於數據庫中整本書、整篇文章中的任意內容信息查找出來的檢索。它可以根據需要獲得全文中有關章、節、段、句、詞等信息，也就是說類似於給整本書的每個字詞添加壹個標簽，也可以進行各種統計和分析。例如，它可以很快的回答?《紅樓夢》壹書中?林黛玉?壹***出現多少次?的問題。

　與之相關的議題

　語根處理 (stemming)

　符素解析器 (token parser) 1-gram, 2-gram , n-gram

　斷詞/分詞 word segmentation

　倒排索引 inverted index

　算法、搜尋策略之模型

　布爾式 boolean

　統計模型 Probabilistic model

　向量空間模型 vector base model

　隱性語義模型 Latent semantic model

系統檢索的介紹

　評量之準則

　判斷檢索效果的兩個指標：

　查全率=被檢出相關信息量/相關信息總量(%)

　查準率=被檢出相關信息量/被檢出信息總量(%)

　開放源代碼之全文檢索系統

　Apache Solr

　BaseX

　Clusterpoint Server(freeware licence for a single-server)

　DataparkSearch

　Ferret

　Ht-//Dig

　Hyper Estraier

　KinoSearch

　Lemur/Indri

　Lucene

　mnoGoSearch

　Sphinx

　Swish-e

　Xapian

　ElasticSearch

議題優化的概念

　和中文有關的議題

　斷詞(分詞)

　語法解析

　古籍議題

　多語言混合

　優化

　剔除字(Stopwords)

　詞性標註

　權威檔(authority file)

　知識體系，本體論(ontology)

　超鏈接分析(page rank)技術

　歷史及未來之趨勢

　自由語句搜尋