當前位置:成語大全網 - 讚美詩歌 - 智能語音行業觀察:微軟蕭冰的半開放生態AI創作和商業化是否已經到來?

智能語音行業觀察:微軟蕭冰的半開放生態AI創作和商業化是否已經到來?

與過去五次不同的是,7月26日舉行的微軟蕭冰第六代發布會首次走出微軟亞太研究總部壹樓報告廳,移師798區域的大型會場。“會議規模也從過去的幾十家媒體擴大到幾百家,覆蓋全國。”壹位接近微軟的人士告訴21世紀經濟報道。這是壹個信號。過去,微軟從未給蕭冰任何商業壓力。即使在最近接受包括21《世紀經濟報道》在內的媒體采訪時,微軟蕭冰負責人李迪仍然強調蕭冰沒有利潤指標。

但就像會議本身壹樣,蕭冰也在不自覺地走出實驗室和研究機構,逐漸嘗試商業化。這就是蕭冰第壹步的由來。經過過去的五代,蕭冰從萌芽到成長,從擁有二維的框架圖到二維圖像,再到現在展示三維全息圖像,越來越接近壹個人類。

背後的技術不斷叠代,生態開始成型。根據微軟的說法,這次會議是蕭冰情感技術框架所有部分的全面升級。從第壹次登陸時的情商+智商設定,到對話式人工智能、生成模型、全雙工語音,蕭冰現在已經進入AI創作階段。在生態方面,微軟首次提出構建雙AI半開放生態系統,差異化整合合作夥伴優勢,打造蕭冰專屬技能和能力。

“人工智能的終極目標是‘人機協作’,用數字智能幫助人類,但這個方向有不同的路線。”微軟全球執行副總裁、微軟人工智能和微軟研究部門負責人沈向洋表示,“蕭冰團隊走出了壹條不同的道路。”

人工智能創造

從去年開始,微軟蕭冰在創作上做了很多嘗試,甚至出版了壹本自己的詩集。現在,蕭冰將更進壹步。

在發布會上,沈向洋宣布微軟思考了AI創造的三個原則:其主體首先必須是智商和情商的結合,而不僅僅是智商;其次,人工智能創造的產品必須能夠成為擁有自主知識產權的作品;第三,人工智能創造的過程必須對應人類的某種創造行為,而不是對人類勞動的簡單替代。

蕭冰的目標是成為壹個高情商的機器人。“我們計劃將人工智能創造作為壹個新興產業來運營。”在發布會上,微軟人工智能創作事業部總經理許表示,“如果把AI創作看作是壹個內容產業,而不是簡單的文學創作,光有‘概念車’是不夠的。從去年開始,我們開展了‘量產車’的工作。”

據介紹,在過去的12個月裏,蕭冰主持了21個電視節目和28個電臺節目,覆蓋了全國41個電視臺和電臺,其中包括9個各大衛視。今天,蕭冰每天主持25個廣播節目。在日本和中國,蕭冰制作了2878小時的視聽內容。

與此同時,蕭冰的有聲讀物已經覆蓋了中國90%以上的早教機器人和80%的在線遊戲平臺。此外,與網易新聞客戶端合作的新聞閱讀器蕭冰,兩個月前新聞閱讀評論突破654.38+00萬。在金融和其他相關領域,蕭冰也在繼續創造內容。

這背後的技術支持來自於蕭冰的情感技術框架,第六代蕭冰的核心對話引擎和交互感官得到了進壹步升級。微軟在第六代蕭冰上推出了全新的* * sensory模型,並公開測試了壹款融合了文本、全雙工語音和實時視覺的全新sensory。

其中,* * *感覺模型是壹個基於生成模型的對話引擎。據報道,蕭冰去年完成的生成模型可以創建自己的響應,而不是從現有的對話語料庫中檢索。如今的* * *感覺模式進壹步增強了蕭冰對對話內容、領域和節奏的掌控,即蕭冰可以創造自己的回應來引領對話的方向。

本次公測的對話引擎、全雙工語音和實時視覺三大新感官,結合* * *感官模型,使蕭冰能夠通過視覺和語音的實時持續交互,指揮用戶完成人臉檢測,並在此過程中進行開域對話。

此外,微軟還發布了第四版DNN模式的AI歌曲。據蕭冰首席語音科學家欒建介紹,該版本的模型可以快速合成與人類歌手同等質量的歌曲,還可以讓蕭冰自由吸收人類歌手的演唱技巧和特點,甚至可以在模仿的同時代替人類完成新作品。

然而,盡管微軟提出了AI創造的原則並進行技術更新,但蕭冰的行動將只是真正AI創造的開始。“根據Gartner技術成熟度曲線2017,虛擬助手成為主流還需要5-10年。”在評論AI的創造力時,Gartner研究副總裁蔡惠芬告訴21世紀經濟報道記者,“這壹應用主要針對智能家居設備中的個人助理或語音控制等狹窄領域,但仍需要包括針對不同領域的知識圖譜構建和自然語言理解與生成等技術的完善。它仍然是壹個新興領域。”

雙重AI生態

除了技術能力的升級,第六代蕭冰最大的特點就是開始打造自己的生態——dual ai。

“在微軟之前,業界已經有很多不同的合作生態和模式。其中,有兩個最重要的模型。壹種是開放賦能模式,通過提供SDK/API來構建生態系統。”蕭冰產品負責人彭爽分析,“另壹類是專註於自身的封閉平臺,通過在平臺上開設AI應用商店來構建生態環境。”

雙AI不壹樣,更類似於半開放的生態。“在這樣的生態環境下,壹方面,微軟將直接負責產品體驗,掌控與用戶直接接觸的最具體的產品細節。另壹方面,我們不是封閉在自己的平臺上,而是在對外聯系,甚至直接整合到第三方平臺。”彭爽說。

之所以這樣選擇,是因為另外兩類生態各有各的問題。其中,封閉模式極大地限制了數據的自由流通,違背了AI的本質。因為無法獲得叠代所需的基礎數據,很難快速叠代,發揮升級的優勢。

在開放的賦能模式中,無論賦能誰,賦能誰,都是壹種相對松散的關系,“也就是說,沒有人真正對最終的產品體驗負責。”比如目前火熱的智能音箱,實際體驗普遍低於預期,恰恰是因為配合松散導致的問題。

同時,由於開放使能生態中的API/SKD強調通用性,也在壹定程度上限制了最新最好技術應用的時效性,通過這樣的接口或工具包得到的數據不壹定是最好的。

在合作過程中,蕭冰也在探索自己的盈利模式。目前,蕭冰已經推出了四個商業領域,包括金融、流行文化、媒體和出版。“我們討論了各種AI盈利模式,最終發現它們分為兩類。壹類是用AI技術以更低的成本取代人類的低並發和高並發工作,比如內容制作”,李迪告訴21世紀經濟報道記者。“二是AI與人類的協作,通過提高協作轉化率來實現共享。”