當前位置:成語大全網 - 新華字典 - 結巴分詞獲取關鍵詞時怎麽過濾掉壹些停用詞

結巴分詞獲取關鍵詞時怎麽過濾掉壹些停用詞

是使用extract_tags函數,這個函數會根據TF-IDF算法將特征詞提取出來,在提取之前會去掉停用詞,可以人工指定停用詞字典,代碼如下:

jieba.analyse.set_stop_words('D:\\Python27\\stopword.txt')

tags = jieba.analyse.extract_tags(text,20)