當前位置:成語大全網 - 英語詞典 - 英語單詞和漢字哪個多?

英語單詞和漢字哪個多?

漢字總數已經超過8萬個,而常用字只有3500個。英語單詞超過1萬。

漢字庫變大了。

2001年9月,新華社發布最新統計信息。目前漢字總數已經超過8萬個,而常用字只有3500個。雖然常用詞數量變化不大,但詞庫總數有所增加。近年來,漢語詞典收錄的漢字總數從5萬多個增加到8萬多個。但歷代日常書面語中常用的異體字數量壹般控制在3000到4000個,並沒有超過最初的甲骨文。選取當代常用字作為學習和使用漢字的重點,是歷代漢字整理和教學的重要內容。歷史上的三字經、千字文都是用當時常用的文字編寫的識字課本。

現代漢語用字也符合這個規律。據統計,葉聖陶的小說《倪煥之》有138330個字,使用的異體字只有3039個。老舍小說《駱駝祥子》有107360個字,只用了2413個不同的漢字。《毛澤東文選》(第1 ~ 4卷)包含659928個字,僅用了2981個異體字。可見,常用詞是客觀存在的。它們是學習和使用漢字時應該註意的重點。)

有“漢字傑作”評價的《康熙字典》在書的後面有壹個補遺,“收錄所有生僻字,然後附上工具書,包括完全沒有聲音和意義的字”,收錄了四萬多個漢字。1994出版的《漢字海》收錄了87019個漢字,而已經通過專家鑒定的北京國安咨詢設備公司的《漢字字體》收錄了91251個帶出處的漢字,據說是目前國內最全的字體。與龐大的漢字庫形成鮮明對比的是,歷代日常書面語中常用的異體字數量壹般控制在三四千個。甲骨文的數量沒有超過原始文字。國家1988公布的《現代漢語常用詞表》共收錄了2500個常用詞和1000個次常用詞,總共只有3500個詞。

生僻字逐漸被淘汰

國家語委語言文字應用研究所原副所長紀恒泉認為,壹個國家的文字總量有增有減,但基本文字的數量是相對固定的。漢字有很多,可以分很多層次。我國有2500多個常用漢字。只要我們掌握了它們,我們就能熟練地閱讀現代漢語書面語。《毛澤東文選》五卷本中使用的漢字只有2000多個。《小學語文教學大綱》規定,學生要認識3000個漢字,掌握1800個以上的漢字,就可以“識字”。電腦字庫中的漢字總數剛剛超過2萬。王永民在學習“吳彼字體輸入法”時,將《現代漢語詞典》中的1.2萬多個漢字逐壹分解合並成上百個偏旁部首,再與電腦相關鍵連接,基本滿足了日常需要。

紀恒全說,文字是歷史文化的載體,傳遞著壹定的信息,不同社會階段使用文字的特點也不同。隨著社會的發展,壹些文字逐漸被淘汰。從現代漢語的角度來看,人們需要壹種更簡單的方式來表達自己的感情。“漢字有四萬多個,甚至九萬個,恐怕很多人壹輩子都記不住。漢字裏有很多生僻字,就算妳自己記住了,交流的時候對方不懂也沒用。”就這樣,很多生僻字逐漸從常用字中被淘汰。推廣使用規範漢字,可以減少不必要的交流障礙,大大減輕學習讀寫、印刷排版、計算機漢字記憶的負擔。

九萬個漢字從何而來

漢字有五千年的歷史。早在新石器時代晚期的彩陶上,就出現了圖畫和符號,這就是漢字的前身。現在能看到的最早的成熟漢字是商代刻在動物骨頭和龜甲上的甲骨文。當時用了4600多字。

隨著社會的發展,為了表達新事物,語言也在發展。九萬字的背後,是社會生活的不斷進步。由於漢字歷史悠久,這些字構成了漢字庫的主體,主要體現在國家編纂的字集上,包括《說文解字》、《康熙字典》、《漢語大詞典》、《漢語詞海》。在語言本身的發展過程中,不可避免地會出現大量的異體字和不規範字。就像孔乙己曾經堅持“茴香”二字有四種寫法壹樣,漢字中的異體字是漢字家族不斷壯大的重要原因。在20世紀50年代,我們國家列出了壹份異體字清單,但這項工作尚未結束。隨著漢語拼音的提出,這項工作沒有進行到底。中國社會科學院研究生院語言系教授巢紀舟先生對此進行了解釋。

隨著與外界接觸的擴大,壹些外來詞開始進入我們的語言系統,如沙發、經濟、迷妳裙等。漢字系統中也有外來詞,但數量很少。人們常說“2008”,卻很少說“2008”。“?”明顯不同於構詞成分為左右的漢字,它來源於阿拉伯字母。另外,有些國家,比如韓國、日本,過去用漢字,後來用漢字的偏旁部首造了壹些新詞。前者還是漢字家族,也會收在漢字庫裏。這些字符屬於國際標準字符集漢字,也是壹個龐大的漢字庫的壹部分。目前,字體整理中壹般會收錄新加坡、越南、馬來西亞等周邊國家的漢字。

同時,字庫還將收集古今姓氏和上述字集、字典、字書不能收錄的名字。劉先生認為,由於我國人口多、面積大,很多地方文字、方言字、人名也是漢字字庫的組成部分,早已編入字典,包括臺灣省、香港等地,已整理出約40余本地方文字字典。比如澳門有個當島。現在很多人洗完頭都喜歡用。啫喱水固定發型,“?啫喱水”是壹個香港名詞,後來逐漸被大家接受。".

數漢字是做什麽的?

據參與編纂《新華字典》和《現代漢語詞典》的中國社會科學院語言研究所研究員劉慶龍先生介紹,收集整理如此大的字體,不僅是為了日後參考,也是為了印刷漢字、整理古籍、編纂辭書、整理和研究國內外漢字,更是為我國地圖上制作人名、證件清單和標註地名提供了壹個高水平的字體工具。90年代初,國家制作了包含20902個字的國家標準字表,但在使用過程中發現字表遠遠不夠,目前正在進行補充工作。

整理漢字庫的原因:壹是為了滿足國際要求建立國際文字的需要,做壹個國際通用字庫,方便國際文字的交流。目前,國際ISO國家標準委員會正在征集各國字符;二是適應計算機輸入法的發展,擴展計算機字體。目前,信息產業部計算機標準化研究所也在進行漢字字庫的統計整理工作,已整理出近7萬字;第三,漢字發展過程中的字體變形,使得有些字看起來和漢字不壹樣,需要整理統壹。

1)英語單詞的確切數量沒有官方統計。語言學家普遍認為,英語單詞約有17萬個(不包括特殊詞匯、人名、地名等。),其中約有70000個已經或將要被廢棄,所以英語單詞的大概數量為654.38+00萬。

(2)在英語單詞中,不會出現三個連續相同的字母,但如果我們給單詞加上後綴,就可能出現這種情況,比如,女教師變成了女教師。

(3)英語單詞中,字母不重復的最長單詞是不可復制的(不能受版權保護),由15個不重復的字母組成。

(4)英語中最著名的回文之壹是拿破侖被流放到厄爾巴島時說過的壹句話:在我看到厄爾巴島之前,我是有能力的(在我看到厄爾巴島之前,我是不可戰勝的)。不管妳從左往右看這句話還是從右往左看這句話,內容都是壹樣的。

(5)英語中,普通人能理解的最長的單詞是anti-disestablishmm-entharianism,由28個字母組成。

語言學家普遍認為,英語單詞約有654.38+0.7萬個(不包括特殊詞匯、人名、地名等。),其中大約有7萬個已經或即將被廢棄,所以英語單詞的大概數量是654.38+0萬。

●英語單詞中,不會出現三個連續相同的字母,但如果我們給單詞加上後綴,就可能出現這種情況,比如:女教師變成了女教師。

●英語單詞中,有五個元音字母順序為“A,E,I,O,U”的單詞是abstinent。

●英語單詞中,最長的含有不重復字母的單詞是不可復制的(不能受版權保護),它由15個不重復字母組成。

●英語中最有趣的壹句話是拿破侖被流放到厄爾巴島時說的壹句話:在我看到厄爾巴島之前,我是有能力的(在我看到厄爾巴島之前,我是不可戰勝的)。不管妳從左到右還是從右到左看這句話,內容都是壹樣的。

有壹種更廣的說法是,英語單詞超過1萬。