起源
雖然之前已經有壹些相關的工作,但是目前關於情感分析比較系統的研究工作是普遍接受的,這是從(龐等,2002)基於監督學習的影評文本情感傾向性分類和(Turney,2002)基於非監督學習的文本情感傾向性分類開始的。龐等(2002)基於文本的N元文法(ngram)和詞性(POS)特征,分別采用樸素貝葉斯、最大熵和支持向量機(SVM)將文本的情感傾向分為積極和消極兩類,並沿用至今。同時,他們在實驗中使用的電影評論數據集已經成為廣泛使用的情感分析測試集。(Turney,2002)基於逐點互信息(PMI),計算從文本中提取的關鍵詞與優、差)詞之間的相似度來判斷文本的情感傾向(SO-PMI算法)。之後的大部分研究都是基於(龐等,2002)。相對而言,(Turney et al .,2002)提出的無監督學習方法在實現上更簡單,但由於難以準確計算詞與詞之間的情感相似度,也難以確定種子詞,所以在無監督學習方向的研究並不多。但是,利用SO-PMI算法計算文本情感傾向的思想被很多研究者繼承。