(1)計算機的飛速發展;
(2)轉換生成語言學對語料庫語言學的批評並不總是正確的(比如指責計算機分析語料庫是偽技術),有些是片面的,甚至是錯誤的(比如否定語料庫數據的價值)。
兩層意思:壹是指同壹種語言的語料庫中的排比。例如,國際英語語料庫有20個平行子語料庫,它們來自以英語為母語或官方語言和主要語言的國家,如英國、美國、加拿大、澳大利亞和新西蘭。其並行性表現為語料選取的時間、對象、比例、文本數量、文本長度幾乎相同。建立數據庫的目的是對不同國家的英語進行比較研究。
另壹種平行語料庫是指兩種或兩種以上語言之間的平行采樣和處理,例如機器翻譯中的雙語對齊語料庫。
?加拿大議會議事錄(e.html)
?香港特別行政區(http://catalog.ldc.upenn.edu/LDC2000T50)立法會會議紀要
?香港新聞
?香港法律(香港法律)
歷時8年,由兩個階段組成:第壹階段為1996-2000年,主要完成詞法和句法分析層的標註,形成PDT 1.0版本;第二階段,2000-2004年,主要標記樹庫深層語法層的信息,形成PDT 2.0版本。
http://www.chineseldc.org(192。168.88.2)