當前位置:成語大全網 - 成語詞典 - 如何讓機器擁有像人壹樣的思維——用戶畫像、人物性格與聊天機器人

如何讓機器擁有像人壹樣的思維——用戶畫像、人物性格與聊天機器人

[人工智能] [用戶心理] ?

最近,我給我三歲的女兒買了壹本繪本,名字是“Can I build another me”,她愛不釋手。這本書的主角是壹個厭倦了自己規律生活的孩子,他希望能訓練出壹個機器人代替自己按時午睡、吃飯、去幼兒園,這樣他就可以自由自在地玩耍。於是,他買來壹個最便宜的機器人,帶回家來訓練它。在這個過程中,他遇到的第壹個問題就是,怎樣才能讓機器人才能變成他呢?於是,他試圖告訴機器人各種關於自己的信息,包括他的姓名、年齡、身高、體重,父母、兄弟和寵物,甚至包括“左撇子”“易煩躁”“襪子經常破洞”這種信息。

這繪本的作者腦洞很大,他也在思考我們所思考的問題。這個故事也告訴我們,要讓機器人擁有人壹般的思維,第壹步便是 理解自己 。因為這樣我們才能告訴機器人,怎樣做才能最像自己。我們從以下幾個方面探討這個問題:

1. 人工智能與心理學

2. 人格分類及推測

3. 如何讓機器人像人壹樣思考

在很長壹段時間內,我們團隊壹直從事用戶畫像的研究。什麽是用戶畫像?簡單說來,就是通過用戶產生的大數據,去猜測和理解壹個人的年齡、職業、興趣愛好,也可以去描繪壹群人的 生活規律 和 移動模式 。這讓我們開始思考,我們能不能通過這些數據進壹步走到人的內心深處,去了解她們的 性格和情感 呢?這並不容易。但是在研究的過程中,我們發現這些問題在心理學領域已經被思考了上千年。實際上,人工智能和心理學這兩個領域實際上早就有交叉。

兩年前,我們便開始拜訪著名的心理學家和教授,試圖進行跨學科合作交流。在這個過程中,我們首先想解決的問題就是人格。 從用戶生成的大數據中能否計算出人的性格?

雖然人格這個術語在日常生活中很常見,但是給人格下壹個準確清晰的定義卻並非易事,即使是心理學家們在這個術語的定義上也很難達成***識。 人格最早的定義可以追溯到2000多年前(公元前400年) 古希臘醫學家希波克拉底(Hippocrates)的體液說 ,他認為人體是由四種體液構成,包括血液、粘液、黃膽汁和黑膽汁,而這四種體液的分布便決定了人的性格:黑色的膽汁產生了憂郁型人格,血液產生了樂觀型人格,黃色膽汁產生了沖動易怒型人格,而粘液產生了冷靜型人格。盡管希波克拉底的體液說已經被現代醫學所否定,但是他關於人格分類的探討是有啟發意義的,以致於後來的心理學家仍然壹直探討這個問題。

在我們與心理學家交流時,我們發現了壹個有趣事實:在現代心理學中, 人格的定義其實跟語言的使用有著緊密的關系 。其實在計算機科學領域,我們對語言也有很多研究,我們稱之為“自然語言理解”。在心理學裏面,有壹個概念叫“詞匯學假說”。什麽叫詞匯學假說?根據這個假說,我們無需通過觀察、研究各種各樣的人來研究人格,我們可以簡單壹些,通過直接觀察人類語言中相關詞匯。比如說,妳介紹壹位朋友給我認識,可能會用壹大段話來描述他:“他特別喜歡說話,每次都聽到他在說話,是個話癆”等等。其實,壹個詞即可概括這段話:健談。因此,心理學家決定整理這些描述性詞匯。如果這個詞匯不多的話,它們便可成為建立分類體系的基礎。

基於這些觀察,人格理論的先驅奧爾波特(Allport)和奧德伯特(Odbert)於1936年對英語詞匯進行了艱難而又系統的調查研究。通過查看詞典,他們按照個人特質、暫時的情緒或者行為以及智力與才幹這四個類別發現大約18000個單詞,並進壹步從中整理出 四千多個描述性格的詞匯 。雖然說四千似乎已經很少了,但對於整個用戶語言來說,這仍然是很復雜的。

試想下,在描述壹個人性格的時候,如果要給這四千個描述維度分別打分,這該是多大的工作量。因此,他們想在此基礎上進壹步縮減。在這個過程中,他們發現,這些單詞間其實存在壹些相關性。比如說,壹般外向的人通常也比較健談,冷靜的人通常也比較理智,但他可能也比較內向。如果能定位這些相關性,便可在此基礎上對四千多個詞進行進壹步歸類。

近二十年來,人格研究者關註與支持最多的人格定義是 “大五人格理論 ” 。包括了五個高度概括的人格因素:外向性 (Extraversion),盡責性 (Conscientiousness),神經質 (Neuroticism),隨和型(Agreeableness)和開放性(Openness)。每個人格因素下還有壹些細分特質(比如外向性下包括了是否經常參加活動、是否熱心腸等)。這樣,以後妳在介紹朋友時,可以將他描述為“比較外向,但不太隨和,可能比較情緒化的壹個人”。方式很簡單,但是描述很全面。

實際上,整理這些詞匯以及生成人格分類體系大多是依賴數據驅動,與計算機科學有很多很緊密的聯系。那我們能不能自動的計算用戶的大五人格呢?其實這也是有可能的。

在傳統人格測量中,心理學家往往采用訪談和調查問卷這種形式,需要耗費大量的人力、財力和時間,受測者往往局限於幾十人到幾百人的規模,不可能實現大規模用戶的測量。但心理學中還有壹種人格測量的方法,叫做 行為測量 ,通過觀察個體的行為來進行測評。行為測量的理論基礎是人格理論中的人類行為的壹致性。既然人格能夠解釋人際之間的穩定的個體差異,那麽個 體行為表現出的差異性就跟個體的人格息息相關 ,因此通過觀察個體行為使得預測人格變成了可能。只是在計算機技術得到廣泛應用之前,心理學家很難收集到用戶足夠豐富的行為數據,因此數據的匱乏導致了行為測量在傳統心理學中並沒有被廣泛采用。

近年來,隨著互聯網、智能手機和各種傳感設備的普及,用戶的行為數據被廣泛收集,再加上人工智能方法在建模用戶方面的推進,使得通過行為數據測量人格的方法在計算機和心理學的交叉領域得到了快速的發展。我們的研究工作在此基礎上更進壹步,提出 “人格推測模型” ,利用社交媒體上的 異構數據 (比如頭像照片、發表的文字、表情符使用以及社交關系等)來預測大五人格。比如說針對圖片,我們可以,算出語義表示,再將這些圖片聚成某些類別,如卡通、自拍、合影、動植物。用基於行為數據的人工智能方法進行人格預測,首先需要收集少量用戶的調查問卷結果作為標註。通過 標註用戶行為特點及人格特征,將它們之間的映射和聯系輸入模型中,以訓練出壹個好的模型 。

實際上,我們找了壹批誌願者,他們提供了自己的數據,並完成了問卷調查,這樣我們便擁有兩方面數據。在訓練完模型後,新的用戶便無需完成用戶調查,模型可以自動計算其人格。聽很抽象但其實也很具體。例如,我們可以計算用戶發表文字和性格間的關系。大五人格有五個維度,我們可以 計算出文字和每壹個維度間是特別正相關或者特別負相關 。例如壹個經常在朋友圈寫青春和自我的人可能比較外向,而常寫失敗和面對的用戶外向性得分便很低。還有壹些用戶可能會寫時代、社會、成功這些聽起來非常正能量的詞匯,我們發現這些人盡責性比較高。相反,有些人可能經常寫隨便、萌萌、氣質這些詞,我們發現他們盡責性比較低。盡責性低並不是壹個貶義詞:在這個模型中,在乎結果的人盡責性比較高,在乎過程的人盡責性比較低。這兩個極端都有它的優勢,並無好壞之分。

我們還通過計算大五人格和用戶頭像 類簇的皮爾遜系數 ,展示了與大五人格強烈正相關或者負相關的類簇(每個類簇選取了2張圖片顯示)。這樣的計算揭示了壹些有趣的現象:比如外向性得分高的用戶喜歡使用包含笑臉的頭像,而得分低的用戶往往在頭像中遮擋了面部表情或者使用側臉;開放性得分高的用戶往往使用和朋友在壹起的照片作為頭像,而開放性得分低的用戶的頭像很多是自拍照。

我們的實驗結果表明單單使用頭像照片,就能使個體性格預測的準確性到達0.6。我們不僅對每種維度上的行為數據提出了針對性的特征提取策略,而且使用集成學習技術(Ensemble)有效融合了不同維度的行為數據來提升大五人格預測的準確率,使得個體大五人格預測的準確性到達0.75以上。

在理解用戶之後,下壹步就是 如何利用這些知識來幫助機器人產生像人壹樣的思維 。人類希望機器人能實現的重要行為之壹就是聊天,微軟也提出了“Conversation as a Platform(對話即平臺)”的概念,認為未來所有人機界面都將轉變為對話界面。

兩年前我看過壹部電視劇,至今記憶猶新,是英劇《黑鏡(Black Mirror)》第二季第壹集“be right back”。這部電視劇描述了壹家人工智能公司,它可以通過壹個人的社交媒體和在線聊天數據合成壹個虛擬人,來模仿人物原型的性格特點和他的女友進行對話。這看起來很科幻,但實際上離我們已經並不遙遠。2016年10月壹篇新聞報道中也提到,來自俄羅斯的創業者Kuyda為了紀念去世的朋友Roman,用他的8000條短信數據訓練了壹個聊天機器人,並於2016年5月正式發布。

盡管技術已經前進了壹大步,但就算是目前最好的聊天機器人也還無法讓人感覺他是壹個具有穩定性格和情感、活生生的人。這就涉及到如何讓機器人的語言和行為更具有個性。

隨著社交網絡盛行,帶有用戶標簽的語言數據變得容易獲取。就像前面提到的新聞報道描述壹樣,如果我們有足夠的關於某個人的數據,就有可能訓練出壹個和他個性壹樣的聊天機器人。當然,我們還可以通過壹群人,例如兒童、學生、甚至詩人的數據來訓練出 具有壹類人特點 的機器人。例如,我們是否可以收集所有現代詩人的數據,用這些數據來訓練壹個出口成詩的機器人?現在是可以做到的,但隨著研究的深入,相信最終我們還會遇到瓶頸,例如到底如何才能讓機器人具備更加真實的人類性格與情感,這還是需要和心理學家合作。

其實,最早的聊天機器人Eliza就是壹個心理咨詢師。大概50多年前,MIT的壹位研究員Joseph開發了Eliza,在與用戶聊天時,Eliza引入了心理學家羅傑斯提出的個人中心療法(Person-Centered Therapy),更多強調對話態度,比如尊重與同理心。Eliza其實自己並不主動說新內容,它更多的是壹直在引導用戶說話盡可能傾訴。看似討巧的Eliza項目取得了意外的成功,它的效果讓當時的用戶非常震驚。以致於後來產生壹個詞匯,叫ELIZA效應,即高估了機器人能力的壹種心理感覺。ELIZA效應其實現在也很常見,比如擊敗頂尖高手的AlphaGo壹出現,人們便覺得電腦已經具有下圍棋的靈感,人工智能馬上要超越人類。但其實,AlphaGo背後所有的程序都是人寫的。 所謂的靈感,所謂的智能,實際最終都是程序實現的 。

受ELIZA項目啟發,微軟亞洲研究院也開展了DiPsy項目,這個項目的目標是讓機器人能夠和人聊天,幫助他們克服心理上的問題。在這個項目中,我們借鑒了心理咨詢中常用的 認知行為療法 (Cognitive Behavior Therapy) 和 正念療法 (Mindfulness)。DiPsy的特點是以自然、有效的方式引導對話,讓用戶盡情傾訴。它還會研究用戶心理過程,在數據驅動下,對用戶的心理特質與精神障礙作出診斷。我們采取認知行為療法(CBT)或早期幹預,在各種治療性的語境中,改變用戶的思維與行為方式,幫助存在風險的用戶緩解並管理心理問題。

在未來,我們期待這個項目能幫助解決實際的社會問題,例如農村留守兒童的心理疏導。在前不久舉辦的未來論壇上,微軟全球執行副總裁沈向洋說,他想要解決三個和人腦息息相關的疾病:兒童自閉癥、中年憂郁癥、老年癡呆癥。我希望我們的技術能幫助他做到這壹點。當然,這些研究項目很多都還在起步階段,裏面涉及到很多跟其他領域學者的合作,包括心理學,社會學以及認知科學。希望未來可以和更多學科交流,獲得更多研究上的靈感和創新。

我們希望最終能實現讓機器擁有像人壹樣的思維,並在人需要時能提供不僅幫助,還能陪伴。當妳孤獨時,至少有個AI與妳在壹起。

知識圖譜:

皮爾遜系數: 用於度量兩個變量X和Y之間的相關(線性相關),其值介於-1與1之間。在自然科學領域中,該系數廣泛用於度量兩個變量之間的相關程度。

集成學習: 使用壹系列學習器進行學習,並使用某種規則把各個學習結果進行整合從而獲得比單個學習器更好的學習效果的壹種機器學習方法。