當前位置:成語大全網 - 新華字典 - python統計歌詞中有哪些單詞

python統計歌詞中有哪些單詞

1、首先定義壹個函數getText(),能夠對獨立的文本進行歸壹處理,將所有的英文字符統壹變為小寫,所有的符號變為空格然後我們用壹個字典對所有的單詞,以及出現的次數進行了映射對應。

2、其次將字典類型轉換為列表類型,通過排序獲得當前最高的單詞出現次數,用forin對前五位單詞出現次數的元素以及它的次數進行打印;待進行詞頻統計的文本壹定要保存在所安裝python文件夾中,否則讀取文本的時候就會報錯。

3、最後引入jieba庫,jieba庫中的分詞不考慮標點符號,以及大小寫問題,只需要將分詞結果及對應的數值存放在字典中,用大括號創建壹個字典,遍歷所有分詞結果組成的列表,排除要壹個字的分詞,其余的做統計儲存在字典中。將字典中鍵值對轉換為列表類型,對列表進行排序並輸出排名前十五的值。