全文檢索簡介
基本介紹
全文檢索是指檢索存儲在數據庫中的整本書和文章中的任何內容信息。它可以根據需要獲取全文中的章、節、段、句、詞等信息,也就是說,類似於給整本書的每壹個詞加壹個標簽,還可以進行各種統計和分析。比如它能快速回答?紅樓夢?林黛玉?壹個* * *出現多少次?問題。
相關問題
生根(莖幹)
令牌解析器1元語法,2元語法,n元語法。
分詞
倒排索引
算法和搜索策略模型
布爾布爾型
統計模型概率模型
向量空間模型向量基礎模型
潛在語義模型
系統檢索簡介
評估標準
判斷檢索效果的兩個指標:
召回率=檢測到的相關信息量/相關信息總量(%)
精確率=檢測到的相關信息/檢測到的總信息(%)
開源全文檢索系統
阿帕奇索爾
BaseX
Clusterpoint服務器(單臺服務器的免費許可證)
數據公園搜索
雪貂
Ht-//Dig
超級明星
KinoSearch
狐猴/印第裏
全文搜索引擎
mnoGoSearch
獅身人面像
Swish-e
夏皮安
彈性搜索
主題優化的概念
與中文有關的問題
分詞(分詞)
語法分析
古籍問題
多語言混合
使最優化
停用詞
詞性標註
權限文件(權限文件)
知識系統,本體論
頁面排名技術
歷史和未來趨勢
自由句子搜索