自然語言處理是研究如何讓計算機處理、理解及運用人類語言(中文、英文等),實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言理解的本質是結構預測。自然語言處理屬於人工智能的壹個重要分支,是計算機科學、語言學、統計學和數學的交叉學科。
搜索引擎、個人助理、機器翻譯、機器閱讀、智能問答、聊天機器人、知識圖譜、語義搜索、機器閱讀、輿情監控與分析、推薦系統、文本關鍵詞抽取、文本自動摘要這些都需要自然語言處理技術。
反正就是現在NLP特別火,對於學習建議,首先需要學壹下ML(機器學習)、DL(深度學習)、RL(強化學習);可以去研究壹兩個優秀開源項目,這些開源項目可以去github上找,GitHub上面牛人很多,有很多很好的開源項目。比如:
考慮字的詞表示學習算法
GitHub - Leonard-Xu/CWE
網絡表示學習
文本增強的網絡表示學習算法
GitHub - albertyang33/TADW: code for IJCAI2015 paper"Network Representation Learning with Rich Text Information"
跨語言詞表示學習算法
Learning Cross-lingual Word Embeddings via MatrixCo-factorization
主題增強的詞表示學習算法
GitHub - largelymfs/topical_word_embeddings: A demo code fortopical word embedding
可解釋的詞表示學習算法
GitHub - SkTim/OIWE: Online Interpretable Word Embeddings
國內壹個NLP工具:哈工大LTP:/
建議去研讀壹些最新的經典的論文比如ACL、EMNLP、COLING、CCL等,
推薦幾本書關於學習自然語言處理的,首先是李航老師的《統計學方法》,還有《機器學習實戰》、《Python自然語言處理》