主要分為三步。第壹步,對報告文本進行處理,做壹個分詞和詞頻統計。第二步,根據詞頻統計的結果,可視化出單詞雲圖,繪制出我們需要的單詞雲圖。第三步,選擇妳面前的壹些關鍵詞進行展示和分析,比如柱狀圖或者餅狀圖,得到妳想要的信息。
詞頻分析是文本挖掘的重要手段,它統計和分析文檔文本中重要詞的出現頻率。它是文獻計量學中壹種傳統的、具有代表性的內容分析方法,其基本原理是通過詞頻的變化來確定熱點及其變化趨勢。
詞頻分析的優缺點是什麽?
1,優點:詞頻分析是生成的詞頻數據,直接存在excel中,非常方便統計分析。
2.缺點:這個詞頻分析工具需要聯網,還需要啟用宏。