用計算機把壹種自然語言翻譯成另壹種自然語言也叫自動翻譯。翻譯的語言稱為源語言,翻譯的語言稱為目標語言。機器翻譯不僅與人工智能研究密切相關,還涉及語言學研究(尤其是應用語言學研究)。它是計算機的壹個典型的非數值應用研究。機器翻譯和人工翻譯有壹些相似之處,同樣需要經歷查字典、源語言分析、目標語言合成等幾個階段。
機器翻譯的特點是速度快,計算機可以在短時間內“不知疲倦”地完成大量文本翻譯工作;但是機器翻譯的質量並不理想,翻譯生硬呆板,有些翻譯出來的句子不通順,甚至錯誤。機器翻譯只適合翻譯語法結構嚴謹、詞匯意義明確的文檔,比如科技文獻。
機器翻譯原理
1,預處理就是把源語言中的句子標準化,用標點符號把長句分成幾個短句,過濾掉壹些與意思無關的語氣詞和詞語,把壹些數字和不規則表達融入到標準化的句子中,等等。
2.翻譯模塊是將輸入的字符單位和序列翻譯成目標語言序列的過程,是機器翻譯中最關鍵、最核心的地方。縱觀機器翻譯的歷史,翻譯模塊可以分為三類:基於規則的翻譯、基於統計的翻譯和基於神經網絡的翻譯。
3.後處理模塊是將翻譯結果進行大小寫轉換,對建模單元進行拼接,並對特殊符號進行處理,使翻譯結果更符合人的閱讀習慣。