壹,象形文字的演化
最初“象形文字”和真實的物體非常相似,但不同的地區有不同的表達方式,但是這些象形文字彼此之間缺乏***性。
而文字演化的第壹步是抽象化。下面壹張圖描述了美索不達米亞文字(上)、古埃及文字(中)和古代中國的文字(下),對“魚、鳥、戚、矢(“有的放矢”的“矢”,也就是箭)、壺”這五個字抽象化的過程。
後面逐漸地,這些象形文字就被抽象化成壹些直線或者弧線了。在中國和美索不達米亞,由於早期的文字是刻在金石、竹木和泥板上,因此,更多被抽象化成點和線的組合,這樣便於刻寫。
而古埃及是寫在莎草紙上的,能夠使用曲線書寫,因此多用曲線進行抽象化。但不管怎麽樣,抽象化之後,就可以總結出***性了。
接下來文字演變的第二步,是文字信息矢量化的過程,我們就以漢字為例來說明。
絕大多數漢字被映射到兩個維度上,即壹個表意的偏旁維度和壹個提示讀音的發音維度,如“湖”,有些時候,提示讀音的維度本身也表意。
再往後,表達含義的偏旁已經和原來的圖畫不太像了。而這些偏旁就構成了文字的基本單元,而且慢慢固定下來了。
以後有新的概念需要創作出新字時,使用那些基本單元,即偏旁部首,重新組合就可以了。比如唐朝的宗秦客為武則天發明了壹個“曌”字,意思是日月當空,獻給武則天拍馬屁。
事實上,很多古代人所表達的信息今天早已經過時了,因此大量的古體字其實今天已經廢了。雖然《康熙字典》裏收集了47000個漢字,但是3000多個壹級國標漢字已經能覆蓋今天98%以上的文本了。
類似地,在《牛津詞典》中有大約1/4的詞今天已經不用了。今天的人,更習慣於用現有的字發明新詞,而不是造字。
二,拼音文字的演化。
拼音文字的簡化主要是圍繞讀音進行的。
在美索不達米亞人發明了楔形文字後,它很快就由象形文字變成了拼音文字。但是那些拼音文字並不簡單,每壹個表達意思的拼音其實是壹堆很復雜的小箭頭(很像楔子,所以也被成為楔形文字)。
後來楔形文字被當地的閃米特人學會了,他們中間有壹支非常善於遠洋經商的族群——就是腓尼基人。
腓尼基人將美索不達米亞的文字傳播到地中海各島嶼。但是,在經商途中,商人們可沒有閑情逸致刻寫精美漂亮的楔形文字,於是他們對這種復雜的拼音文字進行了進壹步簡化,就剩下幾十個字母了。
可以講,從復雜的楔形文字,變成簡單的幾十個字母,是壹個巨大的進步,它使得人類學習讀寫變得很容易。再後來希臘人從腓尼基字母中總結成24個希臘字母,而羅馬人又將它們變成22個拉丁字母。
隨著羅馬的擴張,征服了很多外國土地,吸納了很多外國人,有些外國的人名和地名就無法表示了,於是羅馬人在字母表中加入了x,代表所有那些無法表示的音和詞,這既是英語裏包含x的單詞特別少的原因,也是後來人們用x表示未知數的原因。
再後來拉丁文裏的i被拆成了i和j兩個字母,v被拆成了u,v,w三個字母,最終就形成了今天英語的26個字母。
今天歐洲其它的拼音文字大多源於拉丁語,雖然它們字母表的多少略有區別,而且讀音不同,但是寫法上相似,因為同壹種寫法表達的是同壹條信息。
雖然象形文字和拼音文字的形成和進化代表了兩種不同的信息編碼方式,但是它們都利用了信息論中矢量化的原理。
在歐洲的拼音文字中,雖然沒有表達意思的偏旁部首,但是有很多詞根,前綴和後綴起到了表達意思的作用,也就是說這些語言實際上將表達信息的基本單元(單詞)用壹個詞根、前綴、後綴這樣三維的矢量表示了。
於是,稍微有些語言基礎的人,可以猜出壹些沒見過的單詞的含義。正因為這個原因,拼音文字比漢語容易學。