當前位置:成語大全網 - 英語詞典 - 搜索引擎自動識別技術,詞匯聯想技術,誰知道這個技術?說說吧,誰發明的。

搜索引擎自動識別技術,詞匯聯想技術,誰知道這個技術?說說吧,誰發明的。

1990阿奇是加拿大麥吉爾大學計算機學院的師生開發的。那時候萬維網還沒有出現,人們使用FTP來享受通信資源。Archie可以定期收集和分析FTP服務器上的文件名信息,並提供對每個FTP主機中文件的搜索。用戶必須輸入確切的文件名進行搜索,Archie告訴用戶哪個FTP服務器可以下載文件。阿奇收集的信息資源雖然不是網頁(HTML文件),但其工作原理和搜索引擎壹樣:自動收集信息資源,建立索引,提供檢索服務。所以阿奇是公認的現代搜索引擎鼻祖。

搜索引擎的起源:

所有搜索引擎的始祖是蒙特利爾麥吉爾大學的三個學生(艾倫·恩塔奇、彼得·多伊奇和比爾·惠蘭)在1990年發明的阿奇·常見問題(Archie FAQ)。Alan Emtage等人想到開發壹個可以通過文件名查找文件的系統,於是Archie應運而生。Archie是第壹個在互聯網上自動索引匿名FTP網站文件的程序,但它不是壹個真正的搜索引擎。Archie是壹個可搜索的FTP文件名列表。用戶必須輸入準確的文件名搜索,然後Archie會告訴用戶哪個FTP地址可以下載文件。受Archie受歡迎程度的啟發,內華達系統計算服務大學在1993開發了壹個Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是後來的另壹個地鼠搜索工具。

發展(1):

世界上第壹個蜘蛛程序,麻省理工學院馬修·格雷分校的萬維網漫遊者,被用來跟蹤互聯網發展的規模。起初,它只是用來統計互聯網上的服務器數量。後來,它被開發用來捕捉網址。

搜索引擎壹般由以下三部分組成:

爬蟲(機器人、蜘蛛)

索引生成器

查詢檢索器

發展(2):

Excite的歷史可以追溯到2月1993。六個斯坦福大學學生的想法是分析單詞之間的關系,以便更有效地搜索互聯網上的大量信息。到1993中期,這個項目已經全部投入,他們還發布了壹個版本的搜索軟件,供站長們在自己的網站上使用,這個軟件後來被稱為Excite for Web Servers。

註:Excite後來因為概念搜索而出名。2002年5月,被Infospace收購的Excite停止了自己的搜索引擎,轉而使用元搜索引擎Dogpile。

發展(3):

1994年4月,兩位斯坦福大學的博士生,美籍華人楊致遠和大衛·費羅***共同創立了雅虎!。隨著訪問量和鏈接數的增加,雅虎目錄開始支持簡單的數據庫搜索。因為雅虎!的數據是人工輸入的,所以不能真正歸類為搜索引擎。事實上,它只是壹個可搜索的目錄。雅虎!由於網站收錄的網站都附有簡要信息,搜索效率明顯提高。

註:繼雅虎之後,Altavista、Inktomi、Google將陸續提供搜索引擎服務。

雅虎!——幾乎成了90年代互聯網的代名詞。

發展(4):

1995年,出現了壹種新的搜索引擎形式——元搜索引擎。用戶只需提交壹次搜索請求,元搜索引擎負責轉換處理後提交給多個預選的獨立搜索引擎,獨立搜索引擎返回的所有查詢結果都經過收集處理後返回給用戶。

第壹個元搜索引擎是華盛頓大學的碩士生埃裏克·塞爾伯格和柳文歡·埃齊奧尼的Metacrawler。元搜索引擎在概念上聽起來不錯,但是搜索效果總是不盡如人意,所以從來沒有元搜索引擎有過強勢地位。

發展(5):

智能檢索的出現:利用分詞詞典、同義詞詞典、同音字詞典提高檢索效果,可以進壹步輔助知識層面或概念層面的查詢。通過對主題詞典、上級詞典和同級相關詞典的檢索處理,形成知識體系或概念網絡,給予用戶智能知識提示,最終幫助用戶獲得最佳檢索效果。

示例:

(1)查詢“電腦”,也可以檢索到與“電腦”相關的信息;

(2)查詢範圍可進壹步縮小到“微型計算機”、“服務器”或擴大到“信息技術”或相關的“電子技術”、“軟件”、“計算機應用”;

(3)還包括歧義信息和檢索處理,比如“蘋果”指的是水果還是電腦品牌,“中國人”和“中國人* * *和中國”的區分會結合歧義知識描述庫、全文索引、用戶檢索上下文分析、用戶相關反饋等技術進行處理,從而高效準確地反饋給用戶最需要的信息。