當前位置:成語大全網 - 新華字典 - 如何使用Spark MLlib 構建分類模型

如何使用Spark MLlib 構建分類模型

1.1 LDA實例 實例步驟: 1)加載數據 返回的數據格式為:documents: RDD[(Long, Vector)],其中:Long為文章ID,Vector為文章分詞後的詞向量;用戶可以讀取指定目錄下的數據,通過分詞以及數據格式的轉換,轉換成RDD[(Long, Vector)]即可。