中文維基語料庫,整理->;簡單和復雜的轉換-& gt;分詞(這個過程比較耗時)。
整理後大概是1g語料庫。如果訓練的話,CBOW算法已經訓練了不到半個小時。
訓練好的模型在2g左右,加載也比較慢,但是可以接受。