當前位置:成語大全網 - 成語詞典 - 翻譯利器:語料庫(入門篇)

翻譯利器:語料庫(入門篇)

從事筆譯工作越久,越意識到語料庫的重要。最近想梳理並更新壹下自己的語料庫知識、技能和資源,清理壹下自己的庫存,希望直接或間接地有助於提高自己的翻譯工作效率和質量。相應地,在這個過程中,會把涉及到的有用的東西拿出來曬壹曬,以供分享和交流。

語料庫是啥? 基本概念請自已查壹下,就不搬來這裏了。

語料庫對於筆譯的用處,簡要地說,主要在於詞法句法,譯者能以語料庫中的語料為參考,判斷自己寫出的字詞句是否有毛病,也就是印證的作用。語料庫還有其他用處,在下面幾個高手寫的文章中都有具體示例,看完這幾篇差不多就能感覺出語料庫的魅力所在了 (點擊藍字可跳轉到相關文章) :

1. 如何用“語料庫”提高妳的英語表達? (2018-01-21)

2. 比“native speaker更懂英語”的語料庫學習工具 (2018-06-28)

3. 怎樣利用COCA語料庫提升英語用詞水平? (2018-02-26)

4. COCA:翻譯必知| 最好用的英語語料庫,沒有之壹! (2017-10-16)

現在有很多在線的語料庫,有單語語料庫,如現代漢語、古代漢語、英語語料庫,也有中英雙語語料庫,即平行語料庫。優點是資源龐大,詞條、句例很多,缺點是有的需要註冊、甚至收費而且有查詢次數限制,也有的搜索語法復雜。

也有人提出自己創建語料庫,下面是別人的兩個思路:

1. 建立自己的專屬英語語料庫,當作電子詞典、工具書、例句庫用 (原文標題:建立妳自己的專屬英語語料庫,媽媽再也不擔心妳的寫作啦2017-01-15)

壹言以蔽之:自己準備好語料,然後用AntConc,文內介紹了壹點AntConc的用法。 不想付費用在線語料庫,不嫌自建語料庫麻煩的,可以試試這個方法。另:AntConc的開發者也有關於語料庫的軟件,但我還沒研究,這裏就只提壹下,感興趣的可以按圖索驥。

2. 建立自己的翻譯參考用語料庫,制作出的文件用於trados等CAT工具 (原文標題:如何創建壹個英漢雙語語料庫?如何創建壹個任意兩種語言的語料庫?2017-09-20)

請註意 :文中有壹步是“雙語對齊”,介紹的工具是tmxmall。本人用過tmxmall的在線對齊,確實非常強大,操作很方便,只是我比較小家子氣,把自己的文件提交到別人的雲上,還是有點擔心隱私,雖然並沒有什麽根據。如果處理的語料不需要註意隱私,用tmxmall還是很便利的。

其實雙語對齊的工具有很多,比如SDL Trados自帶的就有對齊工具,還有本人常用的Abby Aligner,根據我的經驗,Abby比Trados的對齊功能好用,操作起來要方便很多很多,雖然兩個工具手上都有,我壹般還是用Abby Aligner。總之,在收集利器時,大家可以多嘗試壹下或者多了解壹點別人的使用經驗,不要以為工具只有某壹款。

上面這些文章主要是提供思路,讀者可以自己再發揮壹下,比如自己去找建語料庫用的其他工具、其他方法,或者自己研究出更好用的方法(這也是我對自己的期待~)。搜索資源的過程中,用英語搜很有用哦。

之前搜集了壹些語料庫資源,但是有段時間沒去用,不了解近況,將來深入研究後,再來詳細分享吧。