當前位置:成語大全網 - 新華字典 - 語言學研究怎麽保證語料的覆蓋面

語言學研究怎麽保證語料的覆蓋面

語言學研究語料的覆蓋面有以下幾個方面:語料庫及語料庫語言學的概念,探討了語料庫在語言研究方面的作用,提出大範圍培訓語言教師和語言學習者掌握語料庫資源的使用方法是有效利用隨著計算機科學的迅猛發展,人類對語言學的研究也不斷深入拓展,語料庫語言學就是在這壹背景下茁壯成長起來的。自20世紀80年代以來,國內外越來越多的學者致力於語料庫的建設和研究,語料庫語言學借助計算機,對語言進行存儲、標註、並在此基礎上描述語言的運用實例。其研究手段與“語言學是壹種描寫式科學”的觀點不謀而合,由此而開創了語言學研究的新時期[1]。本文將討論語料庫及語料庫語言學的概念、發展及其在語言研究中的作用。

壹、語料庫及語料庫語言學的概念語料庫亦稱語庫或素材,是存放語言材料的倉庫。語料庫是收集並科學地組織起來的語言材料數據庫,這種材料是某種語言中自然出現的,可以是書面的,也可以是口頭的,這些未經加工的材料是語言統計的基礎,是分析和研究語言規律的第壹手資料[2~3]。而語料庫語言學就是在文本語料的基礎上進行語言研究的壹門學科。對於語料庫語言學這壹術語,不同的研究者持有不同的觀

點。有人認為語料庫語言學是壹種理論構架,是壹門與語言學的其他分支並駕齊驅的新學科;另外壹些研究者認為語料庫語言學並不是壹個獨立的學科領域,只是為語言研究提供了壹種方法論基礎,同時它又給語言學的研究提供了新的哲學思路。針對這壹問題,我國研究者在總結國外著名語言學專家Halliday ,Leech ,Tognini -Bonelli 等人研究成果的基礎上指出,只有語料庫

中的語言材料和語言事實被語言學家用來對現行語言學理論進行批判,提出新觀點或新理論時,語料庫語言學才是壹個新學科的名稱[3~6]。而通常情況下,語料庫是運用真實的語言材料對語言的某壹方面進行研究的方法和手段。借助於語料庫語言學所提供的方法,語言學家既可以驗證已有的語言規則,也可以基於語料庫提供的數據描寫演變中的語法、語用規則。過去,語料庫中的材料由人工收集和整理,通常用來計算詞匯使用的頻率,以此作為編寫教材和字典的依據;現在,運用計算機建設語料庫的效率和規模都有了很大提高。語料庫是由從有代表性的語言材料中隨機抽

09

樣輸入計算機並可由計算機處理的大量文本組成的。語料庫收入的文本越多,其所覆蓋的面越寬,則語料庫提供的信息就越可靠。語料庫的建設包括原始材料的收集工作,構成原始語料庫,然後對語料進行標註,生成標註語料庫。我們可以應用語料分析軟件,對標註的語料庫進行各種不同的統計分析,從而揭示目標語言的各種特征。

二、語料庫語言學在語言研究中的作用

語料庫語言學的發展對語言的深入研究起到了積極的促進作用,壹方面,影響了語言學習理念和語言學習方法;另壹方面,為某些語言學習理念提供了實施依據。本文僅探討語料庫影響語言研究的三個方面。

(壹)語言是描寫式的還是規定式的

對於語言究竟是描寫式的還是規定式的,不同時期的側重點不同。18世紀,主要的歐洲語言都是通過規定式的方法進行研究的,語言學家總是努力為正確運用語言制定各種規則,它強調語言的正確性和拉丁語標準模式的應用。因此,語法是語言研究和語言學習的重點,壹些用法被規定後需要不斷重復記憶,“因為這是黑或白,正確或錯誤的問題”[7]。在這壹觀點影響下,語言教學采用的是以教師為中心的語法翻譯法。語言教學的方法包括對大量定義、規則的解釋和記憶。書面語往往受到更多的關註。與此相對應的觀點是語言是描寫式的科學,在此觀點的引導下,語言學家盡力去發現和紀錄某壹語言社團實際運用的語言,而不用其他規則來修正該社團的語言。而語料庫語言學為這壹觀點提供了依據和可實施性。語言的實際運用規則可以通過對語料庫中大量實例的研究分析而得出結論。這壹觀點在語言學習中的體現是更加註重學習者的個人需求,將以教師為中心的填鴨式教學轉變為以學生為中心的知識探索型教學,在教學活動中,教師不再壹味地灌輸語言規則和語言知識,而是要求學習者可以通過搜索語料庫,接觸真實自然的語言,觀察語言現象,分析和歸納語言規律,做出假設,並在語言運用中不斷檢驗和修正自己的假設。教師也由傳統的知識傳授者轉變為與學生平等的知識探索者,語言研究者。誠然,片面強調語言是規定式或描寫式似乎都不夠客觀。以語言的規定式為出發點,可能會使語言研究者和學習者將復雜的語言簡單化,能夠宏觀把握語言的基本框架,減少語言研究和學習的難度。對語言學習者而言,學習動機以及學習興趣可能不太高,學習方法比較刻板。從語言的描寫式觀點出發,會令語言研究者和學習者置身於豐富真實的語言,通過觀察、分析和歸納語言規則達到研究和掌握語言的目的,在這壹過程中,研究者和學習者是主動的,因此,動機和興趣會極大地提升。

(二)語言和言語以及語言能力和語言運用

索緒爾將語言區分為語言和言語。語言是社會系統中各個成員使用的語法系統,是在壹群人中的大腦中的潛力,具有社會性,是同質的、抽象的語言形式;而言語是社團中每壹個個體所產出的語言,是異質的、五花八門的語言[5]。由於對語言本質的不同認識以及對語言和言語的劃分,產生了結構主義和功能主義兩大派別,他們對語言的研究重點也不盡相同。結構主義研究的語言是淩駕於個人和社會之上的壹個抽象的符號系統;功能主義則強調語言的使用功能,調查實際發生的語言現象,並試圖從中找出***性的結構。喬姆斯基在索緒爾研究的基礎上提出了語言能力和語言運用兩個概念。喬姆斯基認為語言使用者對語言的規則有著本能的把握,語言能力是個人能根據有限規則生成無限言語的,根植於大腦中的語言知識。語言學家研究的重點是能生成無限言語的有限規則。而語言運用這壹概念與索緒爾定義的言語概念十分相似,是指在具體場景中語言的真實使用。語料庫語言學為功能主義的進壹步發展提供了更為科學的研究方法,它的研究重點在言語和語言運用方面,通過對言語和語言運用的深入研究,可以驗證已有的規定性的語言規則並試圖概括出新的語言規則。語料庫對言語和語言運用的研究體現在語言研究的各個方面,如對語域的研究;對本族語者的話語進行分析,歸納出其典型結構,用於口語教材編撰;統計高頻詞,運用於教學大綱的設計;對外語學習者語言運用進行分析比較,探求更加有效的學習策略等。而對語言和語言能力的研究則落實到了語言習得方面,即以潛意識形式存在於人的大腦中的規則是何時形成的,怎樣形成的。因此,語料庫研究的是具體語言,而對語言和語言能力的研究更側重抽象語言的研究。我們不能盲目地肯定或否定某壹種研究方法,因為語言可以從多個角度進行研究,不同的研究角度可以相互補充,服務不同的目的,滿足不同的需要。但語料庫的出現為語言研究提供了

1

9

新的視角,使語言研究更加客觀,真實。

(三)組合關系和聚合關系

索緒爾是結構主義學派的創始人,他認為語言是壹個符號系統,因此語言學家必須努力從壹個符號與其他符號的關系中發現語言的價值,了解符號在系統中的地位。索緒爾提出了兩種主要語言關系類型:組合關系和聚合關系。組合關系指壹個單位和同壹序列中的其他單位之間的關系,或者說是在現場中的所有成分之間的關系。而聚合關系也稱為聯想關系,是指在結構的某個特殊位置上彼此可以相互替換的成分之間的關系,或者說是在現場的成分與不在現場的成分之間的關系。處於聚合關系中的詞語具有***同的句法特征,但在語義上不能替換[7]。大型語料庫的出現給兩種關系的研究提供了極大的空間,對組合關系的研究尤其活躍。因為計算機有能力搜索壹個特定的詞,研究與該詞具有***現關系的所有詞。這也就是通常所研究的搭配關系。韓禮德(1976)將搭配界定為“體現詞項在某種顯著的臨近範圍內組合關系的線性***現”。該定義明確無疑地將搭配界定為組合關系。在搭配關系的研究方面,瓊斯和辛克萊(Jo nes&Sinclair)是第壹個研究語料庫的詞語搭配的研究者。20世紀80年代至今,基於語料庫或語料庫驅動的詞語搭配研究廣泛展開,使搭配研究發生了巨大變化。研究效度提高,量化研究的比重增大,搭配力等都具有了可觀察、可操作性。自動化程度愈來愈高,研究過程中的人為幹擾因素大大降低。Daniel Krieger在他的論文中用“any”的用法研究肯定了語料庫語言學在組合關系研究中的客觀性[9]。根據傳統語法規則,“any”通常用於否定句和疑問句中,但Mindt通過語料分析統計出“any”在肯定句中出現的頻率是50%,否定句中出現的頻率是40%,而疑問句僅占10%。因此,語料庫為組合關系的研究提供了極大便利。對於聚合關系的研究更多體現在對某些近義詞的研究方面。如崔淑珍在其文章中指出Rundell利用語料庫對“start”和“begin”這壹組近義詞做了比較研究[10]。這些研究成果為利用語料庫對組合關系和聚合關系的研究提供了樣板,語言研究者可以利用語料庫做很多類似的研究。

三、目前語料庫研究存在的問題

語料庫對語言學研究的積極作用是毋庸置疑的,但目前存在的最大問題是只有壹小部分語言研究專家掌握語料庫研究方法,絕大多數語言教師和語言學習者不了解語料庫,不會使用語料庫,更不懂如何運用語料庫資源進行科學研究。而關於語料庫使用問題的文章又很少。因此,大範圍地培訓語言教師和語言學習者學會使用語料庫資源會更加有效地發揮語料庫的作用,極大地推動語言研究和語言學習的步伐。

語料庫為語言研究提供了新的思路和方法,但語料庫資源的利用率需要大幅提高,只有當更多的與語言接觸最密切的語言教師和語言學習者掌握語料庫時,語料庫才能真正推動語言研究和語言學習。