當前位置:成語大全網 - 英語詞典 - 馮誌偉的與數理語言學***舞

馮誌偉的與數理語言學***舞

跨學科奇才

語言學家馮誌偉教授是極為罕見的跨學科奇才。過去的著名語言學家有的只懂社會科學,不懂自然科學;許多人只懂古代漢語、現代漢語或普通語言學,壹般只著重研究漢語的語音、詞匯、語法或文字等某壹個方面的問題,研究的問題和領域比較單壹;他們中的壹些佼佼者,至多也只懂得兩三門外語,視野不夠開闊,語言的縱橫向對比研究都不夠,有壹定的局限性。而馮誌偉先生卻懂得理科中的數學、物理、化學和計算機科學,又懂得語言學中的古代漢語、現代漢語、文字學、音韻學和普通語言學,深研過漢、英、法、德、俄、日等語言的語音、詞匯和語法的自動處理,並把各方面的知識緊密地結合起來綜合應用,在計算機上加以實現,成為文理兼通的語言學專家。馮誌偉教授不但在國外著名大學的電子工程與計算機科學系講授理科的“機器翻譯的方法和技術研究”、“自然語言處理的算法研究”、“計算語言學專題研究”等艱深的博士課程,而且還在國內外大學的中文系講授“漢魏六朝散文”、“唐詩”、“宋詞”、“古代漢語”、“現代漢語”、“漢字的歷史與結構”等饒有風趣的課程,他還能給學生們輔導英、德、法、俄、日等外國語課程,提高學生們的外語口語表達能力和書面寫作能力。他的散文和詩歌也寫得很好,他為哀悼好友馬希文教授(著名數學家)英年早逝而寫的詩歌《長歌當哭》,淒楚感人,讀後令人潸然淚下。他還是壹位翻譯專家,出版過翻譯著作。這樣的人才確實是很罕見的。

馮誌偉自幼聰慧沈靜,18歲就以優異成績考入北京大學地球化學專業。他在北大圖書館偶然看到了美國語言學家喬姆斯基(N. Chomsky)的論文《語言描寫的三個模型》(Three models for the description of language),被喬姆斯基在語言研究中的新思想深深地吸引,繼而從理科轉到中文系語言學專業從事語言學的學習。在中文系讀書期間,馮誌偉壹面學好傳統語言學的各門課程和外語,壹面利用課余時間,繼續研究數理語言學的問題,他充分地利用北京大學圖書館豐富藏書和最新的雜誌,跟蹤著國際上數理語言學發展的足跡,他成為了班上名列前茅的學生。1964年考上北京大學語言學理論的研究生後,經導師岑麒祥教授同意,他的研究生畢業論文的題目定為《數學方法在語言學中的應用》,在我國語言學研究中,首次系統地、全面地來研究數理語言學這個新興學科。

這樣,我國的數理語言學研究便首先在北京大學正式地開展起來。北京大學中文系的著名語言學家王力先生和朱德熙先生都支持馮誌偉的數理語言學研究,王力先生曾對馮誌偉說:“語言學不是很簡單的學問,我們應該像趙元任先生那樣,首先做壹個數學家、物理學家、文學家、音樂家,然後再做壹個合格的語言學家。”朱德熙先生曾對馮誌偉說:“數學和語言學的研究都需要有邏輯抽象的能力,在這壹方面,數學和語言學有***同性。”北京大學的這些第壹流的學者,總是站在科學的最前沿來看待學術的發展,他們的鼓勵給了馮誌偉以巨大的力量。

1978年,之前畢業於北京大學中文系研究生的文科學生馮誌偉,以優異的理科成績考上了中國科學技術大學研究生院信息科學系的研究生,又開始了理科的學習。1979年,入學不到壹年,他就在《計算機科學》雜誌創刊號上發表了《形式語言理論》的長篇論文,用嚴格的數學表達方式向計算機科學界說明數理語言學中的形式化方法如何推動了當代計算機科學的發展,並且指出:在數理語言學研究中發展起來的形式語言理論,事實上已經成為了當代計算機科學不可缺少的壹塊重要的理論基石,計算機科學絕不可忽視形式語言理論。許多人認為這篇文章壹定是資深的計算機科學家寫的,後來,當計算機界的壹些專家了解到,這篇論文的作者竟然是文革前北京大學中文系的壹個文科研究生的時候,感到非常驚訝。

1990年~1993年,馮誌偉應邀在德國特裏爾大學用德語講授壹系列的漢語語言學課程,並且用德語出版了語言學的專著,顯示了他的外語才能。在我國中文系出身的語言學家當中,像馮誌偉這樣通曉多門外語的人還不多。他不僅是壹位善於深思的語言學的理論家,而且還是壹位勇於實踐的能操多種外國語的多面手。

梅花香自苦寒來

在多學科間遊走是需要深厚的知識積澱的,知識積澱則來自於勤奮。馮誌偉在上世紀六十年代初期就已經學會了4門外語,而且能夠使用這4種外語閱讀數理語言學的外文文獻。他取得這樣的學習成績,不僅是天賦,更多的是因為勤力。為了學習英語,他就買壹本中型的英漢詞典來,壹頁壹頁地記憶和背誦,背完壹頁就撕去壹頁。幾年來,馮誌偉先後撕完了英漢、俄漢、法漢、德漢、日漢等多部詞典,他就用這樣的笨方法,學會了多門外語。

又比如,“文革”期間,馮誌偉在朋友們的幫助下,用了將近10年的時間,對數百萬字的現代漢語文本(占70%)和古代漢語文本(占30%)進行手工查頻,從小到大地逐步擴大統計的規模,建立了6個不同容量的漢字頻度表,最後根據這些不同的漢字頻度表,逐步地擴大漢字的容量,終於計算出了漢字的熵。在當時的政治環境和技術環境下,能實現如此繁重的工作,難度可想而知。

馮誌偉不僅自己的學習時候勤奮有加,對待教學也是壹絲不茍。在特裏爾大學文學院任教期間,馮誌偉用德語給德國學生講授《漢魏六朝散文選》、《唐詩宋詞選》、《中國現代散文選》、《漢字的發展與結構》、《漢語拼音正詞法》、《漢語詞匯史》、《機器翻譯的理論和方法》等課程。為了講好課,他苦練德語口語,認真用德語備課,在上每壹節課之前,他都要先用德語把講課的內容自己對自己敘述壹遍或多遍,直到能夠熟練地背誦為止,他把“備課”當作了“背課”。由於馮誌偉的備課特別認真,課堂教學效果很好,他的講課受到德國學生們的壹致好評。

馮誌偉在韓國科學技術院任教期間,利用全部的業余時間來翻譯《語音和語言處理 – 自然語言處理,計算語言學和語音識別導論》(原文為英語)壹書,晚上加班到深夜,連續工作了11個月,當翻譯完14章(全書的三分之二)的時候,他不幸患了黃斑前膜的眼病,視力出現障礙,難於繼續翻譯工作。剩下的7章由中國科學院軟件研究所的壹位年輕的副研究員協助他完成。這位副研究員把剩下的7章逐壹翻譯成中文,通過計算機網絡壹章壹章地傳給在韓國的馮誌偉,馮誌偉使用語音合成裝置,讓計算機把書面的文本讀出來,通過讀出來的語音進行譯文的校正。2004年,全書的翻譯大功告成,由電子工業出版社以《自然語言處理綜論》的書名出版。這本書的出版受到廣大讀者的歡迎,而馮誌偉為此卻損害了自己的視力,他不得不借助於語音合成裝置來閱讀了。

碩果累累著作豐

天賦和勤勉成就了跨學科奇才,馮誌偉在數理語言學領域不斷前行,解決壹個又壹個難度很高的問題,碩果累累。

在法國留學期間,經過在計算機上編寫程序進行潛心的鉆研和反復的試驗,馮誌偉提出了“多叉多標記樹模型”(Multiple-labeled and Multiple-branched Tree Model,簡稱MMT模型)。這個模型提出後,立即引起了國際計算語言學界的高度重視。馮誌偉根據他提出的MMT模型,於1981年完成了漢-法/英/日/俄/德多語言機器翻譯試驗,建立了FAJRA系統(FAJRA是“法語-英語-日語-俄語-德語”的法文首字母縮寫),在IBM-4341大型計算機上,把二十多篇漢語的文章自動地翻譯成英文、法文、日文、俄文、德文,當時在實驗室工作的外國朋友親自目睹他們視為天書的壹篇篇漢語文章被計算機翻譯成他們懂得的五種外國語之後,無不拍手叫絕。這是世界上第壹個漢語到多種外語的機器翻譯系統,開創了多語言機器翻譯系統之先河。

從法國回國之後,馮誌偉在中國科技信息研究所計算中心擔任機器翻譯研究組的組長,在王力先生的鼓勵之下,他利用當時北京遙感技術研究所的IBM-4361計算機,於1985年進行了德-漢機器翻譯試驗和法-漢機器翻譯試驗,建立了GCAT德-漢機器翻譯系統和FCAT法-漢機器翻譯系統,進壹步檢驗了MMT模型分析漢語和生成漢語的能力,試驗結果良好。

在北京大學“語言學中的數學問題”選修課講稿的基礎之上,馮誌偉寫出了我國第壹部數理語言學的專著,書名就叫做《數理語言學》,於1985年8月由上海知識出版社出版。接著,他又出版了《自動翻譯》的專著,深入地探討自然語言機器翻譯的理論和實踐問題。這兩本專著的出版,受到了我國計算語言學界的歡迎。當時不少出國學習計算語言學的留學生,出國時都帶著這兩本書,作為入門的向導,在本書的引導下,他們很快就接觸到了國外計算語言學研究中的前沿問題。

馮誌偉上世紀80年代在德國夫瑯禾費研究院新信息技術與通訊系統研究所(FhG)擔任客座研究員期間,克服了重重困難,使用UNIX操作系統和INGRES軟件,建立了數據處理領域的中文術語數據庫GLOT-C,並且把這個數據庫與FhG的其他語言的術語數據庫相連接,可以快速地進行多語言術語的查詢和檢索,並且能夠處理漢字(當時計算機上還沒有成熟的中文操作系統)。這是世界上第壹個使用漢字的中文術語數據庫,具有開創作用。

2006年,聯合國教科文組織奧地利委員會(Austrian Commission for UNESCO)、維也納市(City of Vienna)和國際術語信息中心(INFOTERM)給馮誌偉教授頒發了維斯特獎(Wüster Special Prize),以表彰他在術語學理論和術語學方法研究方面做出的突出貢獻。維斯特(Eugen Wüster,1898-1977)是奧地利著名科學家,是術語學和術語標準化工作的奠基人。維斯特獎是專門為那些對於術語學和術語標準化工作有出色成就的科學家而設置的。

今年七十壹歲的馮誌偉著述頗豐,其內容涉及不少領域,引起國內外不少同行專家的廣泛關註和高度評價。他現在已在多家著名出版社出版了二十余部專著,翻譯國外重要論著數十篇(部),並用漢、英、法、德文等撰寫了有代表性的重要學術論文百余篇,在國內外許多著名刊物上發表。最主要的代表作如:專著《數理語言學》、《自動翻譯》、《現代語言學流派》、《現代漢字和計算機》、《中文信息處理與漢語研究》、《數學與語言》(新版更名為《語言與數學》)、《自然語言機器翻譯新論》、《應用語言學綜論》、《應用語言學新論》、《計算語言學基礎》、《計算語言學探索》、《機器翻譯研究》、《現代術語學引論》、《自然語言的計算機處理》、《漢語教學與漢語拼音正詞法》、《自然語言處理的形式模型》、《漢字的歷史與現狀》(德文版),譯著《自然語言處理綜論》,等等。他還主持和參與了若幹個國家標準的制定,為我國標準化做出了貢獻。他又是《中國大百科全書》語言文字卷編輯組成員、《數學辭海》總編委會委員、《計算機百科全書》和《中國少年百科全書》等大型工具書的撰稿人,為這些權威性工具書寫了不少重要條目。他還為壹些當代語言學名著的外文版寫導讀,如《應用語言學中的語料庫》、《語言學中的數學方法》、《譯者的電子工具》、《人工智能在第二語言教學中的應用》、《牛津計算語言學手冊》、《自然語言生成系統的建造》等,幫助國內讀者閱讀外文原著。

馮誌偉對於他的這些成就卻看得很平淡,他很少對別人談起他的成就。除了平時喜歡喝白開水和遊泳之外,他幾乎沒有什麽特殊的嗜好,他每日粗茶淡飯,過著非常清貧的生活。他從來不以為自己是什麽“專家”,沒有任何的架子,總是謙和地對待他的學生和周圍的同誌。在北京大學中文系59級同學紀念冊上,他寫下了這樣的人生感言:“先天不足,後天失調;歲月蹉跎,艱辛備嘗;老當益壯,窮且越堅;平生無悔,褒貶由之。”他始終認為自己是壹個很平常的普通人,對於別人的褒貶,他是看得很平淡的。他對於生活的信條是:“在科學探索的過程中,我所知道的東西終究是有限的,而我不知道的東西始終是無限的,只要平生無悔就很好了! ”