格式:16
定價:32.00元《網絡信息檢索》詳細介紹了網絡信息檢索的原理和技術,包括信息檢索模型、網絡信息自動獲取、網絡信息預處理和索引、查詢語言和查詢優化等。針對網絡信息檢索的廣泛應用,還深入探討了搜索引擎、中文和跨語言信息檢索、多媒體檢索、並行和分布式信息檢索、信息分類和聚類、信息抽取和自動問答等關鍵技術。
“網絡信息檢索”層次分明,解釋簡單;既有原理闡述和理論推導,又有大量案例分析,闡述力求系統科學。《網絡信息檢索》可作為高校計算機科學與技術、信息管理與信息系統、電子商務等專業的高年級本科生或研究生的教材和參考書,對從事網絡信息檢索、數字圖書館、信息管理、人工智能、Web數據挖掘等研究和應用開發的科技人員也具有重要的參考價值。第1章簡介
1.1網絡信息檢索概述
1.1.1網絡信息
1.1.2信息檢索
1.1.3網絡信息檢索
1.2信息檢索的發展
1.2.1手工檢索
1.2.2離線批量檢索
1.2.3在線檢索
1.2.4網絡信息檢索
1.3網絡信息檢索的應用
1.3.1搜索引擎
1.3.2多媒體信息檢索
1.3.3話題識別與跟蹤
1.3.4信息過濾
1.3.5問題答案
思考問題
參考
第二章信息檢索模型
2.1檢索模型定義
2.2布爾模型
2.3矢量模型
2.3.1指數項目權重
相似性度量
計算方法
2,4概率模型
2.5擴展布爾模型
2.5.1模糊集模型
擴展布爾模型
2.6擴展向量模型
2.6.1廣義向量空間模型
2.6.2潛在語義索引模型
2.6.3神經網絡模型
2.7擴展概率模型
2.7.1推理網絡模型
2.7.2信任網絡模型
2.7.3語言模型
2.8摘要
思考問題
運用
參考
第三章網絡信息的自動收集
3.1網絡信息的特征
3.1.1網的組成
3.1.2 Web的特性
3.2網絡信息收集的原則
3.2.1信息收集基本流程
遍歷策略
頁面解析。
3.3網絡信息收集的禮貌原則
3.3.1機器人排除協議
機器人元標簽
3.4高性能信息收集
3.4.1並行集合
DNS優化
3.4.3優先收集策略
3.4.4網頁更新
3.4.5網頁去重
避免蜘蛛陷阱
3.5專題信息收集
3.5.1網頁主題特征
3.5.2專題信息收集算法
3.6摘要
思考問題
運用
參考
第4章網絡文本處理和索引
4.1文本的特征
4.1.1信息熵
4.1.2統計法
4.2網絡信息的特點
4.2.1網頁結構
4.2.2網頁類型
4.3網頁去噪
4.3.1基於網頁結構的方法
基於模板的方法
4.4文本處理
4.4.1詞法分析
排除停用詞
莖提取
4.4.4索引詞的選擇
4.5索引
4.5.1特裏樹
後綴樹
簽名文件
倒排文件
4.6總結
思考問題
運用
參考
第5章查詢語言和查詢處理
5.1 Web查詢語言
5.1.1 WebSQL查詢語言
5.1.2 W3QL查詢語言
5.1.3 WebOQL查詢語言
5.2查詢方法
5.2.1關鍵字查詢
模式匹配
5.3相關反饋
5.3.1向量空間模型中的相關反饋
5.3.2概率模型中的相關反饋
5.4查詢擴展
5.4.1基於字典的簡單查詢擴展
自動局部分析
5,4.3自動全局分析
5.5總結
思考問題
運用
參考
第六章信息檢索績效評估
6.1信息檢索評價指標
6.1.1召回率和精確度
6.1.2其他評價指標
6.2信息檢索評價基準
6.2.1基準測試
TREC評估
6.2.3網絡檢索評估
6.2.4 CWIRF評估
6.3總結
思考問題
運用
參考
第七章搜索引擎
7.1概述
7.1.1的發展
7.1.2術語和定義
7.1.3工作原理
7.2鏈接分析
7.2.1網頁排名
點擊次數
算法的比較
7.3相關排序
7.3.1 Lucene檢索模型
7.3.2 Nutch排序算法
7.4大規模搜索引擎
7.4.1架構
數據結構
7.4.3檢索算法
相關排序
7.5總結
思考問題
運用
參考
第八章並行和分布式信息檢索
8.1並行信息檢索
8.1.1並行計算的概念
8.1.2並行信息檢索架構
8.1.3並行編程
8.1.4數據並行度
8.2分布式信息檢索
8.3元搜索引擎
8.3.1系統架構
8.3.2資源選擇
文件選擇
8.3.4信息融合
8.4 P2P網絡信息檢索
8 . 4 . 1 P2P網絡信息檢索原理
8.4.2非結構化P2P網絡的信息檢索
8.4.3結構化P2P網絡信息檢索
8.5總結
思考問題
運用
參考
第九章中文和跨語言信息檢索
9.1中文預處理
9.1.1中文編碼及轉換
9.1.2中文分詞
9.2中文信息檢索
9.2.1中文檢索模型
9.2.2中文索引
9.3跨語言信息檢索
9.3.1基本原則
9.3.2基於GVSM的跨語言檢索
9.3.3基於LSI的跨語言檢索
9、4摘要
思考問題
運用
參考
10章多媒體信息檢索
10.1基於內容的圖像信息檢索
10.2圖像特征提取
1顏色特征
10.2.2形狀特征提取
10.2.3紋理特征提取
10.3圖像相似性度量
10.4基於內容的視頻信息檢索
10.4.1鏡頭分割
10.4.2關鍵幀提取
10.5基於內容的音頻信息檢索
10.6匯總
思考問題
運用
參考
第11章信息分類與聚類
基礎知識11.1
類11.1.1的概念
11.1.2對象特征描述
11.1.3文檔相似度
11.1.4級間距離
11.2特征描述和提取
11.2.1特征提取
11.2.2功能選擇
11.3聚類方法
11.3.1劃分聚類法
11.3.2層次聚類法
11.3.3其他聚類方法
11.4分類方法
11.4.1樸素貝葉斯算法
11.4.2 kNN算法
11.4.3羅基奧算法
11.4.4 SVM算法
11.5方法評估
11.5.1聚類法的評價
11.5.2分類方法評價
11.5.3顯著性檢驗
11.6匯總
思考問題
運用
參考
第12章網絡信息抽取與問答系統
12.1信息提取概述
12.1.1信息提取的開發
12.1.2信息提取評價指標
12.2 Web信息抽取
基於關鍵詞的網頁信息抽取
12.2.2基於模式的Web信息抽取
12.2.3基於樣本的Web信息抽取
12.3問答系統
12.3.1問題分析
12.3.2信息檢索
12.3.3答案抽取
12.6匯總
思考問題
參考