主要技術:
1.文章關鍵詞提取。
2.推薦相關文章(產品)。
最近很多網友提問,以php為例講解php中“關鍵詞提取”的實現,而這也是“相關文章推薦”的前提。
它基本上分為以下步驟:
1.文章的分段:
php中的中文分詞程序還是挺多的,從前輩的scws到純php實現的PHP解析,PHP CWS(PHP CWS)和自己開發的robbe擴展。
這裏的解釋是使用“robbe分詞擴展”來分詞。robbe可能不是最好的,但壹定是最快的。
所選的分詞系統需要支持停用詞過濾。
2.統計條目的詞頻並進行排序:
將文章分段後,計算每個條目的出現次數。然後按詞頻降序排序,妳想要的結果就在前幾個詞裏。
前提是去掉詞頻較高的停用詞,否則會得到壹些無用的停用詞。?
目前,許多web系統使用許多自然語言處理技術來改善客戶體驗。主要技術有:1。文章關鍵詞提取。2.相關文章(產品)推薦。最近有很多網友提問,以php為例講解php中“關鍵詞提取”的實現,而這也是實現“相關文章推薦”的前提。
它基本上分為以下步驟:
1.文章分詞:php的中文分詞程序還是很多的,從前輩們的scws到純php實現的PHP解析,phpcws(phpcws)和自己開發的robbe擴展。這裏的解釋是使用“robbe分詞擴展”來分詞。robbe可能不是最好的,但壹定是最快的。所選的分詞系統需要支持停用詞過濾。?
2.統計詞條的詞頻並進行排序:將壹篇文章分段後,統計每個詞條的出現次數,然後按詞頻降序排序,妳想要的結果就在前幾個詞中。沙河IT培訓建議的前提是去掉詞頻高的停用詞,否則得到的都是無用的停用詞。