妳可能不需要學外語,機器會幫妳和外國人交流;妳不必總是去搶電梯。辦公室的電梯會在12: 03準時停在妳的樓層。它知道妳剛走出辦公室準備午餐。通過電腦,聾啞人將可以和普通人隨意交談;妳不會懊惱新發型不適合妳,直到妳做完頭發。手機應用程序可以讓妳提前看到妳的新發型有多有效...
從這些應用中,我們可以清晰地看到,計算機底層技術的發展正在形成壹種以自然用戶界面、大數據、機器學習、雲計算和移動技術為核心的新邏輯:自然用戶界面使人和機器的輸入輸出變得更容易;再加上傳感器的應用越來越多,人們可以通過機器捕捉的數據量會大大增強,所以對大數據的需求是迫切的。大數據還會造成本地計算機的計算能力明顯不足以支撐,更加整合強大的雲計算能力成為了另壹個關鍵環節。同時,面對海量數據,什麽樣的數據是有用的,提取什麽樣的數據更為重要,但這些算法和運算模型不再是人工預先設定的,而是由基於機器智能的計算機自動提取和設定。此外,隨著移動設備的日益普及,移動技術已經成為連接本地和雲端數據交互的紐帶。
以下是微軟發布的壹些令人驚嘆的酷炫應用:
1,實時語音翻譯
想象壹下這樣的場景:妳在芬蘭赫爾辛基的壹家餐廳點餐,妳說的中文可以立刻被翻譯成芬蘭語,用妳自己的聲音發音,和當地人的語音、語調、語調壹模壹樣。是不是很神奇?我在發布會上看到類似的場景。通過這套實時語音翻譯系統,壹個說中文的中國人和壹個用英語的外國人實時交流,機器及時翻譯語言,發生了。語音語調跌宕起伏,翻譯出來的句子語音識別和語法準確率高得驚人。
應用程序看起來越簡單、越舒適,其背後的技術就越復雜。在短短三分鐘的對話中,涉及了很多技術。首先,借助深度神經網絡(DNN)技術和對人腦行為的模擬,微軟研究院開發出了比傳統技術具有更高辨別能力的語音識別器。其次,個性化語音合成可以保留用戶的個性化語音特征。再次,隨著機器翻譯的不斷積累和發展,翻譯出來的句子幾乎沒有單詞和語法錯誤,聽起來地道流暢。
我們期待著有壹天,機器能夠幫助人們打破不同語言和文化之間的障礙,人們最終能夠與世界上的任何人順利交流。這項技術的“受害者”會是誰?教育行業,有了這樣的機器,似乎真的不用再學英語了。洪小文預測,這項技術將在3-5年內正式推出。
2.基於Kinect的手語翻譯系統。
想象壹個場景,壹個聾啞人在路上用手語問壹個陌生人。即使不懂手語,這位好心人也能輕松聽懂他的話。通過計算機作為中介,這壹天正在到來,聾啞人正在實現他們通過機器“發聲”的新希望。
背後的技術邏輯是,計算機用攝像頭捕捉聾啞人的手語動作,識別為對應的語言,組織句子,然後大聲“說”出來。該系統同時支持中文手語和英文手語的識別和翻譯,可以將文本信息反向翻譯成手語。
核心技術是自然用戶界面(NUI)。所謂自然的用戶界面,是指人與計算機之間以更加自由自然的方式進行交流,計算機的輸入系統(註意不是輸入法)變得更加直觀和容易。最早的計算機輸入系統是鍵盤和鼠標。近年來,計算機已經實現了語音輸入和識別。下壹步將是體感輸入。打開電腦的攝像頭,妳將能夠通過手勢、表情甚至肢體語言來控制電腦。這項技術名為Kinnect,曾經在體感遊戲中用在微軟的Xbox上,現在越來越細膩靈敏。它不僅能識別大範圍的肢體動作,還能識別聾啞人使用手語時細微的手指動作。體感輸入不僅會使計算機更容易操作,還能使計算機進入許多新的應用領域。
除了Kinect For Windows,還包括必應詞典、微軟翻譯、語言建模和3D建模。