當前位置:成語大全網 - 成語詞典 - 齊普夫定律的起源

齊普夫定律的起源

關於單詞在文獻中出現頻次的齊普夫定律(Zipf's Law)。亦稱省力法則。1948年由美國哈佛大學語言學教授G.K.齊普夫(George K. Zipf )對英語文獻中單詞出現的頻次進行大量統計以檢驗前人的定量化公式而提出的。該定律指出文章中單詞的頻次(f)與其排列的序號(r)之間存在著下述定量的關系,齊普夫認為:如果有壹個包含n 個詞的文章,將這些詞按其出現的頻次遞減地排序,那麽序號r和其出現頻次f之積fr,將近似地為壹個常數,即fr=b,(式中r=1,2,3.…),即詞頻分布定律最普通而又最典型的表達。 此後, 許多工具書大 都采用類似觀點和說法 。如英國著名的語言學著作《語言與語言詞典》 中的釋義是:“(詞頻分布定律) 是指談話者或寫作者使用的詞的分布和頻次的總描述。F×R=C,方程式中F=頻次,R=序號,即頻率表上的位置;C=常數。方程式表示詞使用的總次數和詞頻表上的位置之間有壹個固定比率。”但是齊普夫的表達僅適宜於中頻詞的情況,高頻與低頻詞與該表述偏差較大。於是對詞頻分布規律又有許多補充和深化的研究。

· ·George Kingsley Zipf observed that the frequency of usage of any word in a corpus is approximately inversely proportional to its frequency rank:

·

-i.e., the power law fr ~ 1 / rk, where r is rank and k≈ 1.