語言學家馮誌偉教授是極其難得的跨學科天才。過去壹些著名的語言學家只懂社會科學,不懂自然科學。很多人只懂古代漢語、現代漢語或普通語言學,壹般只專註於漢語語音、詞匯、語法或寫作的某壹方面,研究問題和領域比較單壹;其中的壹些佼佼者最多只懂兩三門外語,視野不夠開闊,對語言的縱橫向比較研究不夠,具有壹定的局限性。而馮誌偉先生,科學上懂數學、物理、化學、計算機,語言學上懂古代漢語、現代漢語、文字學、音韻學、普通語言學。對漢語、英語、法語、德語、俄語、日語的語音、詞匯、語法的自動處理進行了深入研究,將各方面的知識緊密而全面地結合起來,並在計算機上實現,成為文理兼備的語言學家。馮誌偉教授不僅在國外著名高校電子工程與計算機系講授機器翻譯方法與技術研究、自然語言處理算法研究、計算語言學專題研究等高難度博士課程,還在國內外高校中文系講授漢魏六朝散文、唐詩宋詞、古代漢語、現代漢語、漢字史史等課程。他的散文和詩歌也寫得很好。他為悼念好友馬教授(著名數學家)而作的《長歌行》,感人至深,讀之令人潸然淚下。也是翻譯專家,出版過翻譯作品。這樣的人才真的不多見。
馮誌偉從小聰明文靜。65歲,438+08,以優異的成績考入北京大學。他在北京大學圖書館偶然看到美國語言學家n .喬姆斯基的《語言描述的三種模式》壹文,被喬姆斯基在語言研究方面的新思路深深吸引,後從理科轉到中文系語言學專業學習語言學。在中文系學習期間,馮誌偉在學好傳統語言學各門課程和外語的同時,利用業余時間繼續學習數理語言學。他充分利用北京大學圖書館豐富的藏書和最新的雜誌,跟蹤世界數學語言學的發展。他成了班上的尖子生。他於1964考入北京大學語言學理論研究生院後,經導師岑啟祥教授同意,其畢業論文題目為《數學方法在語言學中的應用》,這是我國第壹次系統、全面地研究數學語言學這壹新興學科。
就這樣,中國的數學語言學研究在北京大學第壹次正式展開。北京大學中文系著名語言學家王力先生和朱先生都支持馮誌偉的數理語言學研究。王力先生曾對馮誌偉說:“語言學不是壹門很簡單的學問。我們應該首先成為數學家、物理學家、作家和音樂家,然後像趙元任先生壹樣成為壹名合格的語言學家。”朱先生曾對馮誌偉說:“數學和語言學的學習,需要邏輯抽象的能力。在這方面,數學和語言學具有同性。”北大這些壹流的學者總是站在科學的最前沿來看待學術發展,他們的鼓勵給了馮誌偉很大的力量。
1978,之前北大中文系畢業的文科生馮誌偉,以優異的理科成績考入中科大研究生院信息科學系,重新開始學理科。1979,他入學不到壹年,就在第壹期《計算機科學》雜誌上發表了壹篇關於形式語言理論的長文,用嚴格的數學表達式向計算機科學界解釋了數學語言學中的形式方法是如何促進了當代計算機科學的發展,並指出在數學語言學研究中發展起來的形式語言理論實際上已經成為當代計算機科學——計算機科學不可或缺的理論基石。很多人認為這篇文章壹定是某個資深計算機科學家寫的。後來當壹些計算機領域的專家得知這篇論文的作者竟然是文革前北大中文系的文科研究生時,都非常驚訝。
1990-1993期間,馮誌偉應邀在德國特裏爾大學用德語講授中國語言學系列課程,並用德語出版了語言學專著,顯示了他的外語能力。在國內來自中文系的語言學家中,像馮誌偉這樣通曉多門外語的人不在少數。他不僅是壹位有思想的語言理論家,還是壹位能說多種外語並勇於實踐的多面手。
梅花的芳香來自嚴寒
走在學科之間,需要深厚的知識積累,知識積累來源於勤奮。馮誌偉在20世紀60年代初已經學會了四門外語,他能夠用這四門外語閱讀數學語言學的外國文獻。他取得這樣的學術成就不僅是因為他的才華,也是因為他的勤奮。為了學英語,他買了壹本中等大小的英漢詞典,壹頁壹頁地背,背完了撕下壹頁。這幾年來,馮誌偉撕了很多字典,英漢、俄漢、法漢、德漢、日漢,就這樣笨笨的學了很多外語。
再比如,文革期間,馮誌偉在朋友的幫助下,用了近10年的時間,人工核對了上百萬篇現代漢語文本(占70%)和古代漢語文本(占30%)的頻率,由小到大逐步擴大統計規模,建立了6個容量不同的漢字頻率表,最後根據這些不同的漢字頻率表逐步擴充漢字容量。在當時的政治和技術環境下,很難實現如此繁重的工作。
馮誌偉不僅學習勤奮,教學也壹絲不茍。馮誌偉在特裏爾大學文學院任教期間,用德語給德國學生講授《漢魏六朝散文選》、《唐宋詩詞選》、《中國現代散文選》、《漢字的發展與結構》、《漢語拼音正詞法》、《漢語詞匯史》、《機器翻譯的理論與方法》等課程。為了教好壹堂課,他刻苦練習德語口語,認真用德語備課。每次上課前,他都要用德語給自己講壹遍或幾遍講課內容,直到能熟練背誦為止。他把“備課”當成了“背課”。由於馮誌偉認真備課,課堂教學效果非常好,他的講座深受德國學生的歡迎。
馮誌偉在韓國科學技術學院任教期間,利用全部業余時間翻譯了《語音學和語言處理——自然語言處理、計算語言學和語音識別導論》壹書(原文為英文)。他加班到深夜,連續工作了11個月。當他翻譯完14章節(全書三分之二)時,不幸患上了黃斑變性。其余七章由中國科學院軟件研究所的壹位年輕副研究員完成。副研究員把剩下的七章逐條翻譯成中文,通過計算機網絡逐章發給韓國的馮誌偉。馮誌偉用了壹個語音合成裝置,讓電腦把寫好的文字讀出來,通過讀出來的語音來糾正翻譯。2004年,全書翻譯完成,由電子工業出版社出版,書名為《自然語言處理概述》。這本書的出版受到了讀者的歡迎,但馮誌偉損害了他的視力,所以他不得不借助語音合成設備來閱讀。
碩果累累
天賦和勤奮使他成為跨學科的天才,馮誌偉在數理語言學領域不斷進步,解決了壹個又壹個難題,碩果累累。
在法國留學期間,馮誌偉在計算機上寫了程序,做了艱苦的研究和反復的實驗後,提出了“多標記多分枝樹模型”(簡稱MMT模型)。該模型提出後,立即引起了國際計算語言學界的極大關註。馮誌偉根據他的MMT模型,在1981完成了中-法/英/日/俄/德多語種機器翻譯實驗,建立了FAJRA系統(FAJRA是“法-英-日-俄-德”的法語首字母縮寫),並在IBM-4341中實現。20多篇中文文章被自動翻譯成英文、法文、日文、俄文和德文。當時,在實驗室工作的外國朋友親眼目睹了壹篇被他們視為天書的中文文章被電腦翻譯成他們所知道的五種外文,他們都拍手稱快。這是世界上第壹個中文對多種外文的機器翻譯系統,在同類系統中尚屬首例。
從法國回來後,馮誌偉在中國科技信息研究所計算中心擔任機器翻譯研究組組長。在王力先生的鼓勵下,他利用當時北京遙感技術研究所的IBM-4361計算機,在1985進行了德中機器翻譯實驗和法中機器翻譯實驗,建立了GCAT德中機器翻譯系統和FCAT法中機器翻譯系統。此外,
馮誌偉在北京大學選修課《語言學中的數學問題》講義的基礎上,撰寫了我國第壹部數學語言學專著,書名為《數學語言學》,於8月由上海知識出版社出版,1985。接著,他出版了專著《自動翻譯》,深入探討了自然語言機器翻譯的理論和實踐問題。這兩部專著的出版受到了我國計算語言學學術界的歡迎。當時很多出國學習計算語言學的留學生,出國的時候都帶了這兩本書。在這本書的指導下,他們很快接觸到了國外計算語言學研究的前沿問題。
上世紀80年代,馮誌偉在德國弗勞恩霍夫研究所新信息技術與通信系統研究所(FhG)做訪問研究員時,克服了很多困難。他利用UNIX操作系統和INGRES軟件,建立了數據處理領域的中文術語數據庫GLOT-C,並將這個數據庫與FhG其他語言的術語數據庫連接起來,可以快速查詢和檢索多語種術語,處理漢字(當時計算機上還沒有成熟的中文操作系統)。這是世界上第壹個使用漢字的中文術語庫,具有開創性作用。
2006年,馮誌偉教授被聯合國教科文組織奧地利委員會、維也納市和國際術語信息中心(INFOTERM)授予Wüster特別獎,以表彰他在術語學理論和方法研究方面的突出貢獻。歐根·威斯特(1898-1977)是奧地利著名科學家,術語學和術語標準化的創始人。西獎是專門為在術語學和術語標準化方面取得突出成就的科學家設置的。
71歲的馮誌偉著述甚多,涉及多個領域,受到國內外眾多專家的廣泛關註和高度評價。在多家著名出版社出版專著20余部,翻譯國外重要著作數十部,用中、英、法、德四種文字撰寫代表性學術論文100余篇,在國內外多家著名期刊發表。最重要的代表作有:《數學語言學》、《自動翻譯》、《現代語言學流派》、《現代漢字與計算機》、《中文信息處理與國學》、《數學與語言》(新版更名為《語言與數學》)、《自然語言機器翻譯新論》、《應用語言學綜合論》、《應用語言學新論》、《應用語言學新論》。現代術語學概論,自然語言的計算機處理,漢語教學與漢語拼音正詞法,自然語言處理的形式模型,漢字的歷史與現狀(德文版),自然語言處理綜合理論的翻譯,等等。他還主持和參與了多項國家標準的制定,為我國標準化事業做出了貢獻。也是《中國大百科全書語文卷》編輯組成員,《數學詞典》編委會成員,《計算機百科全書》、《中國青少年百科全書》等大型工具書作者,為這些權威工具書撰寫了許多重要詞條。他還用外文為壹些當代著名的語言學著作撰寫了指南,如《應用語言學中的語料庫》、《語言學中的數學方法》、《翻譯者的電子工具》、《人工智能在第二語言教學中的應用》、《牛津計算語言學手冊》、《自然語言生成系統的構建》等。,幫助國內讀者閱讀原版外文。
馮誌偉對自己的成績漠不關心,他很少對別人談自己的成績。平時除了喝開水和遊泳,他幾乎沒有什麽特別的愛好。他每天過著非常貧困的生活。他從不認為自己是“專家”,也沒有架子。他對待自己的學生和身邊的同誌總是很謙虛。在北大中文系59級學生紀念冊上,他寫下了這樣壹段人生感言:“先天不足,後天失調;時光飛逝,難以品味;老的強,窮的強;我這輩子無怨無悔,也就順其自然了。”他壹直認為自己是壹個很普通的人,對別人的褒貶都無動於衷。他的人生信念是:“在科學探索的過程中,我知道的終究是有限的,我不知道的永遠是無限的,只要我這輩子沒有遺憾!”