當前位置:成語大全網 - 書法字典 - 搜索引擎的分類和工作原理

搜索引擎的分類和工作原理

搜索引擎的分類:

1,全文索引

搜索引擎的分類提到了全文搜索引擎從網站中提取信息建立web數據庫的概念。搜索引擎有兩種自動信息收集功能。壹種是定期搜索,即每隔壹段時間,搜索引擎主動發送“蜘蛛”程序,搜索某壹IP地址範圍內的互聯網網站。壹旦發現新網站,它會自動提取網站信息和網址,並將其添加到自己的數據庫中。

2.目錄索引

目錄索引又稱分類檢索,是互聯網上最早提供WWW資源查詢的服務。它主要收集和整理互聯網資源,並根據搜索到的網頁內容,將其網址分配到不同類別的相關分類主題目錄中,形成類似圖書館目錄的分類樹形結構索引。

3.元搜索

元搜索引擎接受用戶的查詢請求後,同時在多個搜索引擎上進行搜索,並將結果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等。在中文元搜索引擎中,星搜索引擎是具有代表性的壹個。在搜索結果排名方面,有的直接按來源對搜索結果進行排名,比如Dogpile;還有的按照自己的規則重新排列組合結果。

搜索引擎如何工作:

第壹步:爬行

搜索引擎通過壹個特定的軟件跟蹤網頁的鏈接,從壹個鏈接爬到另壹個鏈接,就像蜘蛛在蜘蛛網上爬行壹樣,所以被稱為“蜘蛛”,也叫“機器人”。搜索引擎蜘蛛的抓取是有壹定規則進入的,需要遵循壹些命令或者文件的內容。

第二步:搶儲物。

搜索引擎通過蜘蛛跟蹤鏈接抓取網頁,並將抓取的數據存儲在原始頁面數據庫中。頁面數據和用戶瀏覽器獲取的HTML完全壹樣。搜索引擎蜘蛛在抓取頁面時也會做壹些重復內容檢測。壹旦他們在權重較低的網站上遇到大量抄襲、收錄或抄襲的內容,很可能會停止抓取。

第三步:預處理

搜索引擎將抓取蜘蛛返回的頁面,並在各個步驟中對其進行預處理。

第四步:排名

用戶在搜索框中輸入關鍵詞後,排名程序調用索引數據庫數據,計算排名並顯示給用戶,排名過程直接與用戶交互。但是由於搜索引擎的數據量巨大,雖然可以做到每天小更新,但是搜索引擎的排名規則壹般是按照日、周、月的不同階段進行更新的。

擴展數據:

十大搜索引擎:

1,百度

百度是全球最大的中文搜索引擎,也是最大的中文網站。李彥宏於2000年10月成立於北京中關村,致力於為人們提供“簡單可靠”的信息獲取方式。“百度”壹詞源於中國宋代詩人辛棄疾的壹句“眾裏尋他千百度”,象征著百度對中文信息檢索技術的執著追求。

2.谷歌

美國跨國科技企業谷歌(中文名:Google),致力於互聯網搜索、雲計算、廣告技術等領域,開發和提供大量基於互聯網的產品和服務,主要盈利來自AdWords等廣告服務。谷歌是由當時正在斯坦福大學攻讀科學技術博士學位的拉裏·佩奇(Larry Page)和謝爾蓋·布魯姆(Sergey Bloom)創立的,所以他們也被稱為“谷歌佬”。

3.美國Yahoo公司(提供互聯網的信息檢索服務)

雅虎是美國著名的互聯網門戶網站,也是20世紀末互聯網奇跡的創造者之壹。其服務包括搜索引擎、電子郵件、新聞等。其業務覆蓋24個國家和地區,為全球超過5億獨立用戶提供多樣化的網絡服務。它也是壹家全球性的互聯網通信、商業和媒體公司。

4.搜狗

搜狗是搜狐的子公司,於2004年8月3日推出,目的是增強搜狐的搜索技能。主要從事搜狐的搜索業務。在搜索業務的同時,還介紹了搜狗輸入法和搜狗高速瀏覽器。

5、愛問

作為第壹個中文智能交互搜索引擎,愛文突破了以GOOGLE、百度為代表的優勝搜索模式。新浪“愛問”不僅保留了傳統算法技術在常規網頁搜索中的強大功能,還以獨特的互動問答平臺彌補了傳統算法技術在搜索界面智慧性和互動性上的先天不足。

6.搜搜

搜搜是騰訊旗下的搜索網站,也是其主要業務部門之壹。該網站於2006年3月正式發布並開始運行。目前,搜搜已經成為中國網民首選的三大搜索引擎之壹。主要為網民提供實用便捷的搜索服務,承擔騰訊所有的搜索服務。是騰訊整體在線生活戰略的重要組成部分之壹。

7.有道

有道是網易旗下利用大數據技術提供移動互聯網應用的子公司。網易有道公司推出了有道詞典、有道雲筆記、惠惠網、有道推廣等系列產品。

8.中搜

中搜是中國領先的第三代搜索引擎服務和技術應用提供商。依托第三代搜索引擎和個性化widgets,實現人類知識和搜索技術的融合,通過兩大網站、手機app、雲服務平臺等載體,為網民和企業提供全新的第三代搜索引擎體驗。

9360搜索

360綜合搜索,屬於元搜索引擎,是搜索引擎的壹種。它通過統壹的用戶界面幫助用戶在多個搜索引擎中選擇和使用合適的搜索引擎來實現檢索操作,是對分布在網絡中的各種檢索工具的全局控制機制。

10,天網

天網搜索的前身是北京大學的天網。北大天網,由北大網絡實驗室開發,是國家重點科技項目“中英文中文編碼與分布式信息發現”的研究成果。10月29日,1997,10,北大天網正式在CERNET上向廣大網民提供網頁信息搜索導航服務,這是國內首個基於網頁索引搜索的搜索引擎。

百度百科-搜索引擎