當前位置:成語大全網 - 成語詞典 - 搜索引擎的分類及其工作原理

搜索引擎的分類及其工作原理

搜索引擎的分類:

1、全文索引

搜索引擎分類部分提到過全文搜索引擎從網站提取信息建立網頁數據庫的概念。搜索引擎的自動信息搜集功能分兩種。壹種是定期搜索,即每隔壹段時間,搜索引擎主動派出“蜘蛛”程序,對壹定IP地址範圍內的互聯網網站進行檢索,壹旦發現新的網站,它會自動提取網站的信息和網址加入自己的數據庫。

2、目錄索引

目錄索引也稱為:分類檢索,是因特網上最早提供WWW資源查詢的服務,主要通過搜集和整理因特網的資源,根據搜索到網頁的內容,將其網址分配到相關分類主題目錄的不同層次的類目之下,形成像圖書館目錄壹樣的分類樹形結構索引。

3、元搜索

元搜索引擎接受用戶查詢請求後,同時在多個搜索引擎上搜索,並將結果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索結果排列方面,有的直接按來源排列搜索結果,如Dogpile;有的則按自定的規則將結果重新排列組合。

搜索引擎的工作原理:

第壹步:爬行

搜索引擎是通過壹種特定規律的軟件跟蹤網頁的鏈接,從壹個鏈接爬到另外壹個鏈接,像蜘蛛在蜘蛛網上爬行壹樣,所以被稱為“蜘蛛”也被稱為“機器人”。搜索引擎蜘蛛的爬行是被輸入了壹定的規則的,它需要遵從壹些命令或文件的內容。

第二步:抓取存儲

搜索引擎是通過蜘蛛跟蹤鏈接爬行到網頁,並將爬行的數據存入原始頁面數據庫。其中的頁面數據與用戶瀏覽器得到的HTML是完全壹樣的。搜索引擎蜘蛛在抓取頁面時,也做壹定的重復內容檢測,壹旦遇到權重很低的網站上有大量抄襲、采集或者復制的內容,很可能就不再爬行。

第三步:預處理

搜索引擎將蜘蛛抓取回來的頁面,進行各種步驟的預處理。

第四步:排名

用戶在搜索框輸入關鍵詞後,排名程序調用索引庫數據,計算排名顯示給用戶,排名過程與用戶直接互動的。但是,由於搜索引擎的數據量龐大,雖然能達到每日都有小的更新,但是壹般情況搜索引擎的排名規則都是根據日、周、月階段性不同幅度的更新。

擴展資料:

十大搜索引擎:

1、百度

百度是全球最大的中文搜索引擎、最大的中文網站。2000年1月由李彥宏創立於北京中關村,致力於向人們提供“簡單,可依賴”的信息獲取方式。“百度”二字源於中國宋朝詞人辛棄疾的《青玉案·元夕》詞句“眾裏尋他千百度”,象征著百度對中文信息檢索技術的執著追求。

2、谷歌

Google(中文名:谷歌),是壹家美國的跨國科技企業,致力於互聯網搜索、雲計算、廣告技術等領域,開發並提供大量基於互聯網的產品與服務,其主要利潤來自於AdWords等廣告服務。Google由當時在斯坦福大學攻讀理工博士的拉裏·佩奇和謝爾蓋·布盧姆***同創建,因此兩人也被稱為“Google Guys”。

3、雅虎

雅虎是美國著名的互聯網門戶網站,也是20世紀末互聯網奇跡的創造者之壹。其服務包括搜索引擎、電郵、新聞等,業務遍及24個國家和地區,為全球超過5億的獨立用戶提供多元化的網絡服務。同時也是壹家全球性的因特網通訊、商貿及媒體公司。

4、搜狗

搜狗是搜狐公司的旗下子公司,於2004年8月3日推出,目的是增強搜狐網的搜索技能,主要經營搜狐公司的搜索業務。在搜索業務的同時,也推出搜狗輸入法、搜狗高速瀏覽器。

5、愛問

作為首個中文智慧型互動搜索引擎,“愛問”突破了由GOOGLE、百度為代表的算法致勝的搜索模式。 新浪“愛問”在保留了傳統算法技術在常規網頁搜索的強大功能外,以壹個獨有的互動問答平臺彌補了傳統算法技術在搜索界面上智慧性和互動性的先天不足。

6、搜搜

搜搜是騰訊旗下的搜索網站,是騰訊主要的業務單元之壹。網站於2006年3月正式發布並開始運營。搜搜目前已成為中國網民首選的三大搜索引擎之壹,主要為網民提供實用便捷的搜索服務,同時承擔騰訊全部搜索業務,是騰訊整體在線生活戰略中重要的組成部分之壹。

7、有道

有道是網易旗下利用大數據技術提供移動互聯網應用的子公司。網易有道公司已推出有道詞典、有道雲筆記、惠惠網、有道推廣等壹系列產品。

8、中搜

中搜是中國國內領先的第三代搜索引擎服務及技術應用提供商。依托第三代搜索引擎和個性化微件,實現了人類知識和搜索技術的融合,通過兩大WEB站點、移動APP、雲服務平臺等載體為網民及企業提供全新的第三代搜索引擎體驗。

9、360搜索

360綜合搜索,屬於元搜索引擎,是搜索引擎的壹種,是通過壹個統壹的用戶界面幫助用戶在多個搜索引擎中選擇和利用合適的(甚至是同時利用若幹個)搜索引擎來實現檢索操作,是對分布於網絡的多種檢索工具的全局控制機制。

10、天網

天網搜索的前身是北大天網。北大天網由北京大學網絡實驗室研究開發,是國家重點科技攻關項目“中文編碼和分布式中英文信息發現”的研究成果。北大天網於1997年10月29日正式在 CERNET上向廣大互聯網用戶提供Web信息搜索及導航服務,是國內第壹個基於網頁索引搜索的搜索引擎。

百度百科——搜索引擎