搜索引擎的起源:
所有搜索引擎的始祖是蒙特利爾麥吉爾大學的三個學生(艾倫·恩塔奇、彼得·多伊奇和比爾·惠蘭)在1990年發明的阿奇·常見問題(Archie FAQ)。Alan Emtage等人想到開發壹個可以通過文件名查找文件的系統,於是Archie應運而生。Archie是第壹個在互聯網上自動索引匿名FTP網站文件的程序,但它不是壹個真正的搜索引擎。Archie是壹個可搜索的FTP文件名列表。用戶必須輸入準確的文件名搜索,然後Archie會告訴用戶哪個FTP地址可以下載文件。受Archie受歡迎程度的啟發,內華達系統計算服務大學在1993開發了壹個Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是後來的另壹個地鼠搜索工具。
發展(1):
世界上第壹個蜘蛛程序,麻省理工學院馬修·格雷分校的萬維網漫遊者,被用來跟蹤互聯網發展的規模。起初,它只是用來統計互聯網上的服務器數量。後來,它被開發用來捕捉網址。
搜索引擎壹般由以下三部分組成:
爬蟲(機器人、蜘蛛)
索引生成器
查詢檢索器
發展(2):
Excite的歷史可以追溯到2月1993。六個斯坦福大學學生的想法是分析單詞之間的關系,以便更有效地搜索互聯網上的大量信息。到1993中期,這個項目已經全部投入,他們還發布了壹個版本的搜索軟件,供站長們在自己的網站上使用,這個軟件後來被稱為Excite for Web Servers。
註:Excite後來因為概念搜索而出名。2002年5月,被Infospace收購的Excite停止了自己的搜索引擎,轉而使用元搜索引擎Dogpile。
發展(3):
1994年4月,兩位斯坦福大學的博士生,美籍華人楊致遠和大衛·費羅***共同創立了雅虎!。隨著訪問量和鏈接數的增加,雅虎目錄開始支持簡單的數據庫搜索。因為雅虎!的數據是人工輸入的,所以不能真正歸類為搜索引擎。事實上,它只是壹個可搜索的目錄。雅虎!由於網站收錄的網站都附有簡要信息,搜索效率明顯提高。
註:繼雅虎之後,Altavista、Inktomi、Google將陸續提供搜索引擎服務。
雅虎!——幾乎成了90年代互聯網的代名詞。
發展(4):
1995年,出現了壹種新的搜索引擎形式——元搜索引擎。用戶只需提交壹次搜索請求,元搜索引擎負責轉換處理後提交給多個預選的獨立搜索引擎,獨立搜索引擎返回的所有查詢結果都經過收集處理後返回給用戶。
第壹個元搜索引擎是華盛頓大學的碩士生埃裏克·塞爾伯格和柳文歡·埃齊奧尼的Metacrawler。元搜索引擎在概念上聽起來不錯,但是搜索效果總是不盡如人意,所以從來沒有元搜索引擎有過強勢地位。
發展(5):
智能檢索的出現:利用分詞詞典、同義詞詞典、同音字詞典提高檢索效果,可以進壹步輔助知識層面或概念層面的查詢。通過對主題詞典、上級詞典和同級相關詞典的檢索處理,形成知識體系或概念網絡,給予用戶智能知識提示,最終幫助用戶獲得最佳檢索效果。
示例:
(1)查詢“電腦”,也可以檢索到與“電腦”相關的信息;
(2)查詢範圍可進壹步縮小到“微型計算機”、“服務器”或擴大到“信息技術”或相關的“電子技術”、“軟件”、“計算機應用”;
(3)還包括歧義信息和檢索處理,比如“蘋果”指的是水果還是電腦品牌,“中國人”和“中國人* * *和中國”的區分會結合歧義知識描述庫、全文索引、用戶檢索上下文分析、用戶相關反饋等技術進行處理,從而高效準確地反饋給用戶最需要的信息。