語料庫對齊是對雙語文檔進行逐句對齊,比如中文和英文(中文為原文,英文為譯文)。語料庫對齊的目的是建立壹個語料庫/記憶庫,應用於計算機輔助翻譯,可以大大提高翻譯效率,特別是在專門領域。市面上有很多免費的語料庫對齊軟件,比如Tmxmall在線對齊、WinAlign、ABBYY對齊器、雪人對齊、ParaConc等等。有興趣可以在網上壹壹搜索學習。我覺得Tmxmall的在線對齊功能對於新手來說是最簡單高效的。
下面是語料庫對齊的演示圖。簡單來說,中文(原文)的壹句話對應英文(譯文)的壹句話/多句話,因為有時候中文的壹句話在翻譯中會被拆分成英文的多句話。這種方法也適用於其他語言。