搜索引擎、個人助理、機器翻譯、機器閱讀、智能問答、聊天機器人、知識圖譜、語義搜索、機器閱讀、輿情監測分析、推薦系統、文本關鍵詞提取、自動文本摘要等都需要自然語言處理技術。
反正現在NLP特別火。學習建議,需要先學習ML(機器學習)、DL(深度學習)、RL(強化學習)。可以研究壹兩個優秀的開源項目。這些開源項目可以在github上找到。GitHub上的人很多,也有很多好的開源項目。例如:
考慮詞的詞表征學習算法
GitHub - Leonard-Xu/CWE
網絡表征學習
文本增強的網絡表示學習算法
GitHub-albertyang 33/TADW:ij Cai 2015論文“富文本信息的網絡表征學習”的代碼
跨語言單詞表征學習算法
通過矩陣分解學習跨語言單詞嵌入
主題增強的詞表征學習算法
GitHub-large ymfs/topic _ word _ embedding:主題單詞嵌入的演示代碼
可解釋單詞表示學習算法
GitHub - SkTim/OIWE:在線可解釋單詞嵌入
中國的自然語言處理工具:哈爾濱工業大學LTP:/
建議學習壹些最新的經典論文,如ACL、EMNLP、COLING、CCL等。
我推薦幾本關於學習自然語言處理的書,首先是李航的《統計方法》,還有機器學習和Python自然語言處理。