網絡信息檢索的圖書1

ISBN: 978-7-5606-2378-8

開本： 16開

定價: 32.00元《網絡信息檢索》詳細介紹了網絡信息檢索的原理和技術，內容包括信息檢索模型、網絡信息的自動獲取、網絡信息預處理和索引、查詢語言和查詢優化等。針對網絡信息檢索的廣泛應用，書中對搜索引擎、中文和跨語言信息檢索、多媒體檢索、並行和分布式信息檢索、信息分類和聚類、信息提取與自動問答等重要應用的關鍵技術也進行了深入的探討。

《網絡信息檢索》層次分明，深入淺出；既有原理闡述和理論推導，也有大量的實例分析，闡述力求系統性和科學性。《網絡信息檢索》可作為高等院校計算機科學與技術、信息管理與信息系統、電子商務等專業的高年級本科生或研究生的教科書和參考書，對廣大從事網絡信息檢索、數字圖書館、信息管理、人工智能、Web數據挖掘等研究和應用開發的科技人員也有較大的參考價值。第1章緒論

1.1 網絡信息檢索概述

1.1.1 網絡信息

1.1.2 信息檢索

1.1.3 網絡信息檢索

1.2 信息檢索的發展

1.2.1 手工檢索

1.2.2 脫機批處理檢索

1.2.3 聯機檢索

1.2.4 網絡信息檢索

1.3 網絡信息檢索的應用

1.3.1 搜索引擎

1.3.2 多媒體信息檢索

1.3.3 話題識別與跟蹤

1.3.4 信息過濾

1.3.5 問題回答

思考題

參考文獻

第2章信息檢索模型

2.1 檢索模型定義

2.2布爾模型

2.3 向量模型

2.3.1 索引項權重

2.3.2 相似度量

2.3.3 計算方法

2，4 概率模型

2.5 擴展的布爾模型

2.5.1 模糊集合模型

2.5.2 擴展布爾模型

2.6 擴展的向量模型

2.6.1 廣義向量空間模型

2.6.2 潛語義標引模型

2.6.3神經網絡模型

2.7 擴展的概率模型

2.7.1 推理網絡模型

2.7.2 信任度網絡模型

2.7.3 語言模型

2.8 小結

思考題

習題

參考文獻

第3章網絡信息的自動搜集

3.1 網絡信息的特點

3.1.1 Web的組成

3.1.2 Web的特點

3.2 網絡信息搜集的原理

3.2.1 信息搜集的基本流程

3.2.2 遍歷策略

3.2.3 頁面解析

3.3 網絡信息搜集的禮貌原則

3.3.1 機器人排斥協議

3.3.2 機器人元標簽

3.4 高性能信息搜集

3.4.1 並行搜集

3.4.2 DNS優化

3.4.3 優先搜集策略

3.4.4 網頁更新

3.4.5 網頁消重

3.4.6 避免蜘蛛陷阱

3.5 專題信息搜集

3.5.1 網頁的主題特性

3.5.2 專題信息搜集算法

3.6 小結

思考題

習題

參考文獻

第4章網頁文本處理和索引

4.1 文本的特性

4.1.1 信息熵

4.1.2 統計定律

4.2 網頁信息的特征

4.2.1 網頁結構

4.2.2 網頁類型

4.3 網頁去噪

4.3.1 基於網頁結構的方法

4.3.2 基於模板的方法

4.4 文本處理

4.4.1 詞匯分析

4.4.2 排除停用詞

4.4.3 詞幹提取

4.4.4 索引詞選擇

4.5 索引

4.5.1 Trie樹

4.5.2 後綴樹

4.5.3 簽名檔

4.5.4 倒排文件

4.6 小結

思考題

習題

參考文獻

第5章查詢語言與查詢處理

5.1 Web查詢語言

5.1.1 WebSQL查詢語言

5.1.2 W3QL查詢語言

5.1.3 WebOQL查詢語言

5.2 查詢方式

5.2.1 基於關鍵字的查詢

5.2.2 模式匹配

5.3 相關反饋

5.3.1 向量空間模型中的相關反饋

5.3.2 概率模型中的相關反饋

5.4 查詢擴展

5.4.1 基於字典的簡單查詢擴展

5.4.2 自動局部分析

5，4.3 自動全局分析

5.5 小結

思考題

習題

參考文獻

第6章信息檢索性能評價

6.1 信息檢索評價指標

6.1.1 查全率和查準率

6.1.2 其他評價指標

6.2 信息檢索評價基準

6.2.1 基準測試

6.2.2 TREC評測

6.2.3 Web檢索評價

6.2.4 CWIRF評測

6.3 小結

思考題

習題

參考文獻

第7章搜索引擎

7.1 概述

7.1.1 發展概況

7.1，2 術語與定義

7.1.3 工作原理

7.2 鏈接分析

7.2.1 PageRank

7.2.2 HITS

7.2.3 算法比較

7.3 相關排序

7.3.1 Lucene檢索模型

7.3.2 Nutch排序算法

7.4 大規模搜索引擎

7.4.1 體系架構

7.4.2數據結構

7.4.3 檢索算法

7.4.4 相關排序

7.5 小結

思考題

習題

參考文獻

第8章並行和分布式信息檢索

8.1 並行信息檢索

8.1.1 並行計算的概念

8.1.2 並行信息檢索體系架構

8.1.3 並行編程

8.1.4 數據並行

8.2 分布式信息檢索

8.3元搜索引擎

8.3.1 系統架構

8.3.2 資源選擇

8.3.3 文檔選擇

8.3.4 信息融合

8.4 P2P網絡信息檢索

8.4.1 P2P網絡信息檢索的原理

8.4.2 非結構化P2P網絡信息檢索

8.4.3 結構化P2P網絡信息檢索

8.5 小結

思考題

習題

參考文獻

第9章中文和跨語言信息檢索

9.1 中文預處理

9.1.1 中文編碼及轉換

9.1.2 中文分詞

9.2中文信息檢索

9.2.1 中文檢索模型

9.2.2 中文索引

9.3 跨語言信息檢索

9.3.1 基本原理

9.3.2 基於GVSM的跨語言檢索

9.3.3 基於LSI的跨語言檢索

9，4 小結

思考題

習題

參考文獻

第10章多媒體信息檢索

10.1 基於內容的圖像信息檢索

10.2 圖像特征提取

10.2.1 顏色特征

10.2.2 形狀特征提取

10.2.3 紋理特征提取

10.3 圖像相似量度

10.4 基於內容的視頻信息檢索

10.4.1 鏡頭分割

10.4.2 關鍵幀提取

10.5 基於內容的音頻信息檢索

10.6 小結

思考題

習題

參考文獻

第11章信息分類與聚類

11.1 基本知識

11.1.1 類的概念

11.1.2 對象特征描述

11.1.3 文檔相似性

11.1.4 類間距離

11.2 特征描述及提取

11.2.1 特征提取

11.2.2 特征選擇

11.3 聚類方法

11.3.1 劃分聚類法

11.3.2 層次聚類法

11.3.3 其他聚類方法

11.4 分類方法

11.4.1 NaiveBayes算法

11.4.2 kNN算法

11.4.3 Rocchio算法

11.4.4 SVM算法

11.5 方法評測

11.5.1 聚類方法評測

11.5.2 分類方法評測

11.5.3 顯著性檢驗

11.6 小結

思考題

習題

參考文獻

第12章 Web信息抽取與問答系統

12.1 信息抽取概述

12.1.1 信息抽取的發展

12.1.2 信息抽取的評價指標

12.2 Web信息抽取

12.2.1 基於關鍵字的Web信息抽取

12.2.2 基於模式的Web信息抽取

12.2.3 基於樣本的Web信息抽取

12.3 問答系統

12.3.1 問題分析

12.3.2 信息檢索

12.3.3 答案抽取

12.6 小結

思考題

參考文獻