關於漢字的起源,中國古代文獻中有“結繩說”、“八卦說”、“圖畫說”、“書法契約說”等多種說法。古籍也普遍記載了創造漢字的黃帝史官倉頡的傳說。
特點:壹、漢字的性質。
文字是在口語的基礎上產生和發展的。所以語言是首要的,文字是次要的。先有語言,再有文字。沒有語言,就沒有文字。語言是用文字符號表示的具體內容。沒有語言,書面文字就無法存在。世界上的任何符號都是由壹定的形式和壹定的意義構成的統壹體。作為記錄語言的符號,文字也不例外,它也是由形式和內容兩部分組成的。世界上有很多民族,到目前為止,只有語言沒有文字,但沒有壹個民族只有文字沒有語言,語言不依賴文字。可見語言確實是第壹位的,文字是第二位的。記錄語言離不開語言。世界上有各種各樣的書寫系統。雖然記錄語言的方式不同,結構也大相徑庭,但依附於某種語言的原因是壹樣的。
所以,從本質上來說,文字其實是壹個符號系統,但這個符號代表的是語言,必須用它來發揮作用。語言是符號,由形式和意義組成;文字也是壹種符號,其構成也包括形式和意義兩個方面。雖然都是由形式和意義組成,但內涵是不同的。語言的形式是語音,書寫的形式是由書寫單位(筆畫或字母)組成的。語言的意義是以壹定的語音形式表達的內容。比如普通語音“舒”的意思是“成本之作”,詞的意義就是記錄下來的語言,具體來說就是語言中的詞或語素,既包括語音方面的,也包括語義方面的。例如,漢字“舒”的書寫符號不僅代表語音“舒”,還代表“成本的工作”的意義,而是語音和語義方面。語言的語音形式和意義內容在任何書寫系統中都是統壹的。世界上所有的文字,不管是音標的還是非音標的,都是用壹種既記錄語音又記錄意義的語言記錄下來的。沒有只記錄發音或意思的書寫系統。語言是語音形式和意義內容的統壹。既然文字是記錄語言的符號,當然要記錄兩個方面,不可能割裂開來。那樣的話,文字就無法完成記錄語言的任務,也無法成為文字中代表語言的符號。
世界上的各種書寫體系,根據記錄語言的方式不同,壹般可以分為拼音和非拼音。拼音文字用壹定的構詞符號來表示語言中的各個語音單位,符號的排列和組合順序與所記錄的語言單位的實際發音相壹致,因此可以很容易地拼寫出來。非拼音文字的構詞法符號與讀音關系不密切,從字形結構上看不出與記錄詞讀音的聯系,只能壹個壹個記憶,不能拼寫。
我們的教材是按照寫作單位和語言單位的關系來分類的。不同的書寫體系對書寫基本單位的劃分是不壹樣的,比如英語、法語、俄語是字母,日語是假名,漢字是單字。語言的單位可以分為語音層和符號層。音位和音節可分為語音層,語素、詞和句子可分為符號層三個層次。看詞的基本單位和語言的基本單位的對應關系,根據記錄的語言單位的不同,詞壹般分為三類:音素詞、音節詞和語素詞。
音位書寫用字母記錄音位,即在記錄壹種語言時,需要將音節分解為輔音和元音音位,分別用對應的字母表示,然後在朗讀時將元音和輔音組合成音節,這是壹個比較完整、比較理想的拼音體系。音位書寫的體系比較簡單,因為壹種語言只有幾十個音位,可以分析成元音和輔音,所以語言可以用幾十個字母來記錄。音素書寫適用於音節結構類型多的語言,英語音節結構更復雜,類型多。有資料顯示,日本權威統計過,英語音節不會少於8萬個,所以只能用音素書寫來記錄。現在世界上大部分文字都屬於音素文字。
音節文字是用壹定的字母來記錄語言中的音節,符號和音節之間有固定的關系,適用於記錄音節類型較少的語言。日語中的假名是音節文字的典型代表。
語素詞以單個詞記錄語言中的語素,詞與語素基本對應。語素字最大的特點就是字多,而且由於各不相同,結構非常復雜。漢字是典型的語素字。由於語素字註重字形與語素義的對應關系,不要求找到同* * * *的標準音標點,因此特別適合記錄方言復雜、方言間語音差異大、語法規則壹致、語素義壹致的語言。
漢字的基本單位是字,每個漢字對應的語言單位壹般是語素。所以從文字單位和語言單位的對應關系來看,漢字是語素字。語素是最小的語音語義組合。比如漢語的“祖國”,就是由“祖先”和“國家”兩個語素構成的。每壹個語素都有壹個音,壹個義:“祖”的音是zǔ,意為第壹代;“過”的音是,意思是“過”的反義詞。漢字的字記錄了漢語中的語素,所以漢字是語素。漢語語素有同音字,也有異音。不同音的語素壹般用不同的漢字來表示。比如漢語中的“人”和“民”是兩個不同音的語素,所以用兩個不同的漢字來寫。同音字素往往用不同的漢字來表示。比如“壹、壹、二、壹、壹、二、壹”這七個語素都是Y發音,用七個不同的漢字書寫,從而在形式上區分不同的語素。不同形態的漢字可以有效區分同音字。
每壹個漢字都有除了形和音之外的意義。這和英文字母、日文假名有很大區別。語素是最小的音義組合,是有意義的。所以漢字記錄語素,它的音義來源於它記錄的語素的音義。比如我們用“書”這個詞來表示漢語中的語素“書”,因為語素“書”讀shū,就是“造價的作品”的意思,所以漢字“書”讀shū,就是“造價的作品”的意思。漢字的形體與其所代表的語素的音義緊密結合,形成了形、音、義的統壹。大多數漢語語素是單音節的,但也有壹些是多音字。有些復音語素是連詞和疊字,如“蜘蛛、琵琶、秋千、無邊、漸”等;壹些音譯的詞,比如“吉他,巧克力”。每壹個記錄多音節語素的漢字都只有形和音,沒有意義。它只有幾個詞組合起來才有意義,所以不是形、音、義的統壹。漢字數量如此之少,並不能反映漢字的本質特征,也不影響漢字是語素的結論。
關於漢字的性質,歷來有表意文字、語標文字、語素音節文字(或詞音節文字)等不同的看法。
漢字是表意文字。這個說法的出發點是,漢字不限於同壹個讀音。從語音上看,漢字缺乏系統性,但從意義上看,漢字非常規則,字形結構體現了詞語的語義特征。如“樺樹、案樹、柳樹、月桂、椅子”等詞語用“木”來表示語義範疇,體現了表意特征。但由於漢字經過改造簡化後,字體結構發生了很大的變化,字體結構與字義的直接關系遠沒有古代漢字那麽明顯,表意本身也比較模糊,所以近年來越來越少采用這種說法。如果說絕大多數漢字是有意義的,那麽從這個角度說漢字是表意文字也是可以的。
Logogram的說法集中在漢字80%以上是形聲字這壹客觀事實上。而我們在教材分析中,現代漢字中的形聲字很少,大部分是表意或表意的,或者音符不是音韻的。從現代漢字的角度來看,這樣的字應該已經不算形聲字了,所以真正意義上的形聲字並不多。筆者沒有看到這方面的確切資料,但比較確定的數據是,現代形聲字,所有形聲字中只有20%的音、音相同。如果考察這20%形聲字的能指和意義的關系,估計還要排除壹部分形聲字,所以剩下的不多了。所以稱漢字為語標是不合適的。
也有人把組成漢字的符號分為三類:能指、音符、符號。根據符號所能代表的語言結構層次,漢字的有些字只與語素層次有關,有些則起音節符號的作用。所以漢字被認為是語素-音節文字,這個名稱被認為是適合古代漢字和現代漢字的。但是現在的音節文字壹般指的是拼音文字的壹種,用來指代漢字容易造成混淆。漢字雖然表示音節,但嚴格意義上其結構中並沒有專職的語音成分,所以使用名稱音節是否合適值得考慮。
以上說法都是可以理解和深入研究的。但從我們課程的教學實踐來看,明確漢字是語素書寫的立足點,並做必要的說明就足夠了。
二、漢字的特點
漢字有六個特點,有些是優點,有些是缺點。
(1)漢字和漢語基本適應。
漢字之所以適應漢語,主要是因為漢字的單音節形式與漢語語素的單音節形式壹致,記錄漢語語素與漢字之間往往存在對應關系。漢字基本兼容中文,可以從以下幾個方面來理解:
第壹,壹個漢字代表壹個音節,壹個語素基本上就是壹個音節,所以漢字和語素是對應的,所以用漢字記錄漢語語素是非常合適的。但是,漢字和語素的對應並不意味著漢字和語素是對等的。仔細分析,漢字和語素的關系其實更復雜。畢竟漢字是書寫單位,語素是語言單位。漢字與語素的復雜關系是,壹個漢字可能代表幾個不同的語素,如“米”代表米,米代表長度單位,“站”代表“站”或“站”的意思。也有可能是幾個漢字代表壹個語素,比如“沙發、吉他、馬來西亞”這些外來詞是在外來詞發音的影響下,用漢字音譯過來的,漢字沒有獨立的意義,這樣的詞可以忽略。在中國傳統中,有壹些連詞,都是在幾個漢字中記錄壹個語素,比如“苗條、搖擺、琵琶、蜘蛛、猶豫”當然,大多數漢字都是用壹個漢字來表示壹個語素,比如“山、河、燈、人、看”等等。
第二,漢語是沒有形態變化的語言。語法意義和語法關系主要通過語序和虛詞來表達,而不是像印歐語系那樣通過音位來表達。所以漢語的特點決定了用漢字記錄比較合適。比如英語動詞do (da)有do、did、done等詞形變化。壹個詞(尤其是動詞)的詞形在不同的句子中是不壹樣的,它的音位需要變化。用音位來記錄這樣壹種語言比較合適,而動詞的類似意義則用漢語中的“正、曾、己”等獨立語素(詞)來表達。再比如,英語中,復數要用名詞後的後綴S來表示,這個語素也是通過在單詞內部加音素(即內部屈折)來表示的,而漢語中,復數是通過加壹個語素“們”來表示的,非表意名詞主要用前面的量詞來表示,而不是在單詞內部變化。這種情況用壹個獨立的漢字來表達是非常方便的,用漢字來表達像英語壹樣的形態變化會很困難。
漢字適合漢語,借用漢字可以反證韓語和日語的情況。日本和韓國曾經借用漢字來記錄自己的語言,但是由於兩種語言和漢語的語法規則差異很大,漢字只能記錄固定的部分,而對於有形態變化的部分,有固定書寫方式的漢字是無法分解的。因此,用漢字記錄日語和韓語並不完全合適,需要用字母來表示有形態變化的部分。正因為如此,朝鮮在漢字的基礎上創造了諺語,日本也創造了。而且歷史上漢字也有被周邊少數民族借用的,但沒有直接借用來記錄自己的民族語言。而是在它們的基礎上進行了改造,以適應自己民族語言的需要,如契丹、西夏、女真等。
再次,用漢字記錄漢語,可以非常有效的區分同音字。漢語音節結構簡單,輔音和元音只有400個音節左右,元音和聲調只有1,200多個音節。另外,詞形短小,以雙音詞為主,單音詞還是很活躍的,可以說是漢語詞匯的基礎,所以同音字、同音字很多,容易混淆,而且不同形態的漢字起到了區分同音字的作用,所以漢語同音字很多。在書寫中,同音字有微妙的區分,這是拼音文字做不到的,如“公式-商業-進攻-宮廷-防禦工事”、“形式-形勢-行動”、“國家-國家-國情”、“中期-末期”。口語中,同音字讀音完全相同,容易混淆,但我們看看幾組讀音完全相同但字形不同的漢字,就壹目了然了,漢字在區分同音字中的作用:
居(平調):棲、弓、捕、被剪、壞疽、駒、毛、蹲、蹲、蹲。
石(無聲):是,市,式,事,示範,遠景,世界,形勢,適,考,室,蝕,誓,死,柿。
李(去聲):李,李,李,周,例,李,李,李,李,李,李,李,李,李,李,李,李,李,李,李,李。
伊(去聲):伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊。
以上四組漢字,每壹組都有完全相同的音韻聲調,但是字體卻有很大的不同,這就給區分不同的語素帶來了很大的方便。我國著名語言學家先生曾利用漢字的這壹鮮明功能,用聲韻完全壹致的漢字寫了壹個史吃獅史的故事,抄在這裏供大家欣賞:
獅子愛好者石獅石獅發誓要吃掉十只獅子。石總是在市場上看到獅子。十點鐘,十頭獅子適合趕集。在正確的時間,石獅在正確的市場。石視其為十獅,靠矢勢使其十獅不死。石拾得十獅之屍,正適合石室。石室是濕的,所以我讓仆人擦拭它。石室擦拭,初嘗十獅屍。吃飯的時候,我首先知道的是十獅之屍,其實是十頭獅子的屍體。審判口譯是壹個問題。
如果這些語素用拼音記錄,按照拼音的規則,發音相同的語素也應該有相同的字形,那麽這些語素根本無法從字形上區分。漢字是從古代的表意文字發展到形聲字的。為什麽他們沒有步入註音字的行列?這與漢字有效區分同音字的功能有關,也是很多人反對漢字改革和漢字拼音化的重要原因。的確,目前拼音文字解決不了漢語同音字的問題。
第四,現代漢語方言很多,發音差異很大。但由於各方言語法體系和詞匯體系的壹致性突出,用漢字記錄漢語在文字上起到了溝通方言的作用。雖然同壹個字的讀音因地而異,但大部分都是用同壹個漢字記錄的,大家看得壹清二楚。所以漢字在溝通方言方面有很好的作用,拼音文字很難適應漢語方言差異的特點。漢字為維護漢語的統壹,避免漢語分裂成不同的語言做出了巨大的貢獻。在歐洲,許多不同的語言彼此之間的差異遠不如中國方言,但它們是不同的語言。雖然差異很大,但中國不同地區的方言並沒有進壹步劃分,而且由於漢字的維護,沒有人會認為中國的方言是不同的語言,盡管壹些西方語言學家把中國的壹些方言視為不同的語言(見哈特曼和斯托克的《語言學和語言學詞典》)
(2)漢字是形、音、義的統壹。
因為漢字記錄的是語素,語素是音義的統壹,每個語素既有音義,再加上漢字的形體,所以漢字是形、音、義的統壹。壹個漢字可以代表幾個語素和音節,但每個漢字必須獨立地代表壹個音節、壹個語素,並且是有形的。所以漢字是形、音、義三位壹體,不可分割。這與音位字符和音節字符非常不同,例如英語字母a、b、c、d、e和日語字母ぁ、ぁ、ぅ、ぇ、ぉ等。他們有形式和自己的發音,但他們是沒有意義的,所以他們不是形式,聲音和意義的統壹,因為他們
正是因為漢字的這個特點,我們壹開始學漢字很難,但是學了壹定數量的漢字之後,學單詞就不難了。比如我們學了“電”這個字,就可以和其他有意義的漢字組成“電話、電燈、電線、電視、電影、電流、電機、電表、電”,基本不用再去學習和記憶這些生詞了。因為我們把漢字壹個壹個的學了,實際上就相當於把構詞法的語素壹個壹個的學了,掌握了這些構詞法成分的形、音、義,那麽學習理解這些詞自然就很容易了。另壹方面,音素對於人們學習單詞來說是非常容易的,比如英語只有26個字母,幾節課就能學會,日語有50個表音符號,對於初學者來說很容易,但是在學習單詞的時候就比較難了,因為每個單詞的拼寫形式都不壹樣,不容易記住。
(3)漢字具有很強的永恒性。
漢字的超越性可以從兩個方面來理解:壹是古今壹致性強,二是溝通方言的特殊功能。漢字的超越性在於從古代到現代都是可以通達的。今天,我們仍然知道幾千年前文獻中的漢字。我們不能理解的不是漢字本身,而是古今語素義的變化。漢字雖然有幾千年的歷史,但古今漢字的結構模式和體系本質上是壹樣的,與語言中基本單位的對應關系也是壹樣的,即都是記錄的語素(和古代同時的詞),沒有本質的變化,所以有著貫穿古今的特殊作用。比如中國歷史上的宋元明清小說,今天讀起來難度不大,而用拼音記錄的當代文獻,今天壹般人很難看懂,只有專家才能看懂,因為拼音要隨著單詞讀音的變化而調整拼寫(當然也不是絕對壹致,比如英語單詞know中的k今天不發音,但拼寫沒有調整)。
漢字的超空間特征是它有壹種特殊的溝通方言的功能。漢語方言比較復雜,有七種方言。再細分的話,方言就更多了,方言之間的差異特別大。口頭上,不同方言區的人根本不會說話。如果他們說話,就像和外國人說話壹樣,彼此聽不懂。除非他們使用雙方溝通的中介語言(比如普通話),否則無法溝通。但是,用漢字書寫是壹種非常奇妙的情況:無論妳是上海人、廣東人、湖南人還是福建人,妳們之間都沒有障礙。如果沒有漢字,很難想象不同方言之間如何交流!當然,漢字在溝通方言方面的根本作用是漢字記錄漢語。漢語方言雖多,但每種方言的語法結構特征(詞和句子的特征)是相同的,語素義的差異很小。否則,也是無法理解的。用漢字記錄的日語,雖然妳每個字都認識,但無法理解其內容。有人誇大說學日語的人經常“進去笑,出來哭”,就是這個道理,但是學漢語方言就不會這樣了。
從上面的分析可以看出,漢字的研究需要我們了解漢字的永恒功能。我們還應該註意到,漢字這壹特征的根源是中國古今語法、詞匯系統與方圓的* * *連通性。漢字溝通古今、方言的功能,其實還是漢字基本適應漢語的反映。
(4)漢字數量眾多,結構復雜,缺乏完整的語音系統。
漢字系統的字數是驚人的。從古至今,漢字總數已達八萬多。據統計,現代漢語使用的漢字數量約為1000。《國家現代漢語通用字表》收錄了7000個漢字,《現代漢語通用字表》收錄了3500個漢字。
漢字數量龐大的根源在於漢語的特點。因為漢語的音節結構比較簡單,音節數量比較少,與語言中的語素數量不成比例。比如現代漢語由輔音和元音組成的基本音節只有400個左右,有四聲的只有1,200個左右,而現代漢語的詞匯系統中有上千個語素。這種情況下,讀音相同的語素很多,詞形較短,主要是兩個音節,但正因為如此,也有很多而且往往是常用詞。如果在書寫中不使用形態各異的漢字來區分這些同音字和詞,就會造成混淆,使用混亂,影響交流和人際交往,甚至導致誤解和損失。從壹些漢字的分化過程可以看出漢字字形在區分詞義方面的作用。比如“雲”的本義就是雲朵之雲。後來加上了“說”的意思。為了區分它,又造了壹個“雲”來區分它。“箕”本來是簸箕的意思,後來有表示第三人稱的意思,於是人們在院子裏加了壹個竹字頭,形成“簸箕”;“莫”是指太陽從配置上淹沒在草中,表示傍晚的黃昏。後來引申出否定的意思,表示沒有人。為了區分,在原字形上加了壹個“日”來區分。這就是“黃昏”這個詞。類似的例子還有很多,比如“昏婚”、“自然燒”、“截趾”、“挑挑”、“利益溢出”等等。可見,漢字的數量是復雜的,不容易學習和掌握,也有自己容易分辨的壹面。
漢字結構復雜,可以從幾個方面看出來。壹方面,漢字筆畫多。以7000個常用漢字為例,筆畫從7到15不等,筆畫超過5000個,最多的壹個漢字筆畫多達36個。另壹方面,漢字結構單元的筆畫和部件是否按統壹的方向排列組合,而是上下左右四面八方散開,向多個方向行進,具有平面的特點,結構單元的組合方式也是多種多樣的。筆畫之間有分離、連接、交叉,構件之間有左右結構、上下結構、圍合結構、框架結構的組合,而且很多往往是幾種方式的總和,所以結構比較復雜。漢字與拼音字符的行進方向不同。所以,學習漢字,只知道筆畫成分,不知道結構,還是寫不出壹個字。
而且漢字的結構中沒有語音成分。雖然漢字系統中有大量的形聲字,但是形聲字的音符並不是特殊的音標,很多還是獨立的文字。更重要的是,現代漢字中的形聲字的音符大多已經失去了語音功能。有些音符可以用壹個詞表達聲音,但不能用另壹個詞。這些情況混在壹起很難判斷,比如“臺灣”根據現代形聲字筆記的語音情況,如果用筆記來推斷壹個不認識的字的讀音,多半可能會出錯。人們在使用漢字時,往往會產生壹種錯覺,認為既然漢字是並列的,就可以用自己的筆記來推斷讀音,這往往會導致錯誤和笑話。比如下面這個漢字的讀音錯誤,就是人們盲目用筆記來推斷的結果:“易、郁、坎、齲、牙、酵母、幹、葉、癮”。人們常說漢字難讀,和漢字不能從結構上表達聲音有關系。
(5)難以用漢字進行機械加工和信息處理。
漢字難以用於機械化和信息處理,可以從以下幾個方面來理解。首先,漢字數量龐大,現代漢語共有7000個常用字。如果專業領域用字多了,那麽機械處理這麽多漢字當然更困難。其次,漢字結構復雜,大部分筆畫在10左右,有幾十種。而且漢字的筆畫和部件組合的模式也很復雜。我們可以把這些漢字的組合模式與人進行分類,但是通過逐字的觀察比較,可以說是壹字壹句的結構模式,有些詞,比如“東、麝香、氣”比較而言,由於拼音中音位字的數量有限,機械處理沒有障礙。比如引文只有26個拉丁字母,只有52個大寫字母,其他字符(如標點符號等。),所以總數不超過65,438+000。所以,英文字符都可以放在鍵盤上,在鍵盤上抄寫7000個漢字簡直不可想象。所以在我國,打字已經成為壹門技術,需要專門學習。
我們可以做壹個英文和漢字的對比,這個差異就可見壹斑。目前計算機壹般用點陣來表示文字信息,也就是用壹個電子方陣來表示壹個字符。每壹個方陣都有若幹個網格,網格中的筆畫被點亮,每壹個筆畫被變暗,從而實現單詞的顯示。要顯示英文,最少要用7×9點來表示壹個字符(壹般是9×12點),最少要用16×16點來表示壹個字符(壹般是24×24點)。英文字符100,中文字符只有7000。所以重點是:
英語:7×9×100=6300分。
漢字:16×16×7000 = 1792000點。
漢字在計算機中的存儲空間是英語的284倍。差距大得驚人。漢字的機械化處理以前落後於其他文字,因為7000個漢字需要存儲1750k比特,而英文不到10k比特。計算機發展之初,根本沒有這麽大的內存。資料顯示,美國IBM公司在60年代末生產的最先進型號的電子計算機,內存為4096-131072,可以加載漢字,但價格太高,無法投放市場,而其他型號的計算機無法加載漢字。這還是壹個普通的漢字點陣。如果是精確的漢字點陣,比如32×32點,或者100×100點,處理10000個字符,占用的空間就更驚人了。當然,在計算機存儲迅速膨脹的今天,這個問題已經成功解決,但相對於拉丁字母,漢字的局限性還是很明顯的,所以有學者認為,從長遠來看,只有拼音才能方便信息處理。
(6)在國際文化交流中難以使用漢字。
漢字難以在國際交流中使用,壹是因為其結構復雜,二是漢字不表音,難以學習和使用,而拉丁字母在國際上被廣泛使用,可以說是國際化的文字。相比較而言,漢字很孤獨。雖然隨著中國經濟文化的發展,隨著中國在世界上地位的提高,會有越來越多的人學習和使用漢字,甚至研究漢字,那是不同於漢字國際化的。所以有人說漢字是國際文字,21世紀是漢字的時代。從熱愛漢字和中國文化的角度來看,無可厚非,但從科學求實的態度來看,漢字作為國際交流的工具有其局限性。
漢字有幾千年的歷史。它們之所以能使用這麽長時間,根本原因就是適應了漢語的特點。所以我們在學習和研究漢字的時候,既要看到漢字的優點,也要看到漢字的缺點。對待漢字,我們不驕不躁。