在線翻譯應用了人工智能的什麽技術
人工智能的研究領域分支較多,從研究角度來分有三大分支:知識工程(knowledge engineering)、模式識別(pattern recognition)與機器人學(robotoligy)。這裏僅擇其中幾種研究領域進行粗略的介紹。專家系統 1977年費根鮑姆提出“知識工程”,把實用的人工智能稱為知識工程,標誌著人工智能研究進入實際應用的階段。他開發出了第壹個“專家系統”(expert systems),認為“專家系統是壹種智能的計算機程序,它運用知識和推理步驟來解決只有專家才能解決的復雜問題”。專家系統是指利用研究領域的專業知識進行推論,在解決專業的高級問題方面具有和專家相同能力的解決系統,屬於人工智能的應用領域。目前,這壹領域發展較快,應用也較廣,已開發出不少有實際價值的專家系統.與傳統的計算機程序相比,專家系統是以知識為中心,註重知識本身而不是確定的算法.專家系統所要解決的是復雜而專門的問題,對這些問題人們還沒有精確的描述和嚴格的分析,因而壹般沒有解法,而且經常要在不確定或不精確的信息基礎上做出判斷,需要專家的理論知識和實際經驗。標準的計算機程序能精確地區分出每壹任務應該如何完成,而專家系統則是告訴計算機做什麽,而不區分出如何完成,這是兩者最大的區別。另外,專家系統突出了知識的價值,大大減少了知識傳授和應用的代價,使專家的知識迅速變成社會的財富。再者,專家系統采用的是人工智能的原理和技術,如符號表示、符號推理、啟發式搜索等等,與壹般的數據處理系統不同。60年代末,以猜測為基礎的第壹個專家系統Dendral是由費根鮑姆和萊登伯格在斯坦福大學***同設計的,當時用於分析化合物的化學結構。這壹系統至今仍被有機化學家經常使用。70年代中期,肖特列夫開發了Mycin這壹專家系統,它是針對傳染性血液病的診斷和治療開發的。把患者的病狀輸入後,經過Mycin推理,最終由計算機開出處方來。據檢測,Mycin的能力通常並不比專門的醫生遜色。但它沒敢投入實際使用,只是在培養醫生的學校當作教材在使用。還有由斯坦福研究所美國地質調查國際組織開發的“探礦人”(Prospector)專家系統,波音公司的專家系統可輔助工程師更快地設計飛機等等。從不同角度,專家系統也可分為多種類型。從其完成的功能來分,可包括診斷、解釋、修理、規劃、設計、監督、控制等多種類型,這些功能又可分為兩大類:分析型和綜合型。分析型專家系統所要解決的問題有明確的、有限個數的解,系統的任務在於根據實際的情況選擇其中壹種或幾種解。綜合型專家系統的任務是根據實際的需要構造問題的解,包括設計、規劃等問題。此外,也可根據知識的特征和推理的類型對專家系統進行分類。專家系統在各個領域的應用已經產生了很可觀的經濟效益,這從另壹方面促進了對專家系統的理論和技術方面的研究。開發專家系統的關鍵是如何獲取知識,如何表示、運用人類專家的知識,這方面的研究也就成了重點。對這壹點,範倫特(K.Vanlent,1987)作了充分說明:“我們應該去建構壹個專家系統,去模擬專家的問題解決。專家行為,不管是由人或機器產生,都是他(它)的知識產物,但是,用什麽能解釋知識呢?盡管可以用不同的方式進行測量或限定,但對專家知識的形式和內容的最終解釋,是人用來獲取知識的學習過程。實際上,對於專家問題解決,學習理論可能是唯壹足夠科學的理論。”自然語言處理自然語言處理是人工智能早期的研究領域之壹,也是壹個極為重要的領域,主要包括人機對話和機器翻譯兩大任務,是壹門融語言學、計算機科學、數學於壹體的科學。由於以喬姆斯基為代表的新壹代語言學派的貢獻和計算機技術的發展,自然語言理解正在變得越來越熱門.有很多理由值得人們去研究如何使計算機程序能以某種方式使用自然語言的問題。口語是人們進行交際的自然形式,計算機用戶希望能與機器對話交流。自然語言輸入可以表示成口語,也能從鍵盤上打入,以文體的形式給出。最早的自然語言理解方面的研究工作是機器翻譯。1949年,美國人威弗首先提出了機器翻譯設計方案。20世紀60年代,國外對機器翻譯曾有大規模的研究工作,耗費了巨額費用,但人們當時顯然是低估了自然語言的復雜性,語言處理的理論和技術均不成熱,所以進展不大。主要的做法是存儲兩種語言的單詞、短語對應譯法的大辭典,翻譯時壹壹對應,技術上只是調整語言的同條順序。但曰常生活中語言的翻譯遠不是如此簡單,很多時候還要參考某句話前後的意思。例如,英語的壹句話:Stay away from the bank.由於bank有銀行和河堤兩個意思,因此上面這句活應該翻譯成“不要靠近那家銀行”呢?還是“不要靠近河堤”呢?顯然,光翻譯這句話本身不看背景場合,不能保證翻譯的正確,需要上下文聯系起來才能正確翻譯,這就是技術難度高之所在。從20世紀70年代末期,隨著機器翻譯理論和計算機技術的進步,機器翻譯有很大的進展。壹種常見的做法是將語言的翻譯分為“原語言的理解”和“所理解的語言表達成目的語言”兩個子過程。這樣就需要—種中間語言,只要做好原語言到中間語言以及中間語言到目的語言的轉換程序,就可完成翻譯。這種辦法還容易實現—種語言到多種語言的翻譯系統。到現在為止,西語系的壹些語言(例如法語、英語)之間的互譯技術已經比較成熟,雙向翻譯輔助系統準確性比較高,不過,翻譯完後,還要對譯文稍作修改。1995年,松下公司試制成功壹種可進行曰英文對譯的可視電話,引起了人們的廣泛興趣。該系統由計算機語音識別、聲音合成和可視電話通信三個子系統組成,使用者可以用各自的語言進行交談,通過分析語音波形的變化,該系統可從3000個例句中選擇出語意最接近的單詞,其識別率達到98%。據稱,只要備有專用詞典,就可以用它來流利地進行會話。對於我們每天使用的漢語,總的來說,與其他語言的互譯水平還不太高,其中與英語的互譯水平稍微高—些,市面上已有多種翻譯軟件出售。主要是我們對漢語的形式化研究還不夠,特別是漢語與西方語言不是壹個語系,翻譯起來難度較大。總之,要真正建立壹個能夠生成和理解自然語言的計算機處理系統是相當困難的。因為,語言的生成和理解是壹個極為復雜的編碼和解碼過程,壹個能理解用自然語言來表達信息的計算機系繞,就應像人那樣,不僅需要掌握上下文知識和語境等有關信息,而且還要能夠利用這些知識進行推理,人具備大量的經驗以及擁有自己的觀點和對世界的看法,而現在的機器還做不到這壹點。機器翻譯離達到“自然的理解和表達”這個最終目標還有相當大的距離。 目前所能做到的仍然是人工輔助型的翻譯系統,即靠人對翻譯的結果進行修正,來獲得自然的翻譯。