TTS是Text To Speech的縮寫,即“從文本到語音”。是壹部同時運用語言學和心理學的傑出作品。在內置芯片的支持下,它通過神經網絡的設計,智能地將單詞轉換成自然的語音流。TTS技術可以實時轉換文本文件,轉換時間以秒計算。在其獨有的智能語音控制器的作用下,文本輸出的語音節奏流暢,讓聽者在聽信息時感覺自然,沒有機器語音輸出的冷漠和澀澀。TTS語音合成技術即將覆蓋國標中的第壹個和第二個漢字,有英文界面,自動識別中英文,支持中英文混讀。所有語音均以真實普通話發音,實現了每秒120-150個漢字的快速語音合成,朗讀速度達到每秒3-4個漢字,讓用戶聽到清晰悅耳的音質和連貫流暢的語調。現在少數MP3隨身聽有TTS功能。
TTS是壹種語音合成應用程序,它將存儲在計算機中的文件(如幫助文件或網頁)轉換為自然的語音輸出。TTS可以幫助有視覺障礙的人閱讀計算機上的信息,或者它可以簡單地用於增加文本文檔的可讀性。今天的TTL應用包括語音驅動的電子郵件和語音感應系統。TTS通常與語音識別程序壹起使用。現在有很多TTS產品,包括Read Please 2000,Proverbe語音單元,以及Next Up技術的TextAloud。朗訊,Elan,還有at & amp;t有自己的語音合成產品。
除了TTS軟件,許多廠商還提供硬件產品,包括以色列WizCom Technologies的Quick Link Pen,這是壹種類似筆的設備,可以掃描和閱讀文本。還有鴕鳥軟件的Road Runner,可以讀取ASCII文本的手持設備;另外還有美國DEC公司的DecTalk TTS,是壹種可以替代聲卡的外接硬件設備。它包含壹個內部軟件設備,可以與個人計算機自帶的聲卡壹起工作。
[編輯此段]TTS分析
TTS文語轉換應用廣泛,包括電子郵件閱讀、IVR系統的語音提示等。目前,IVR系統已經廣泛應用於各個行業(如電信、交通等)。).
TTS的關鍵技術是語音合成。早期的TTS壹般是用專用芯片來實現的,比如德州儀器的TMS50C10/TMS50C57,飛利浦的PH84H36,但主要應用在家用電器或兒童玩具中。
基於微機應用的TTS壹般由純軟件實現,主要包括以下幾個部分:
文本分析——對輸入的文本進行語言學分析,逐句進行詞法、語法、語義分析,確定句子的底層結構和每個詞的音素構成,包括斷句、分詞、多音字處理、數字處理、縮寫處理等。
●語音合成-從語音合成數據庫中提取與處理後的文本相對應的單詞或短語,並將語言描述轉換為語音波形。
●韻律處理——合成語音的質量是指語音合成系統輸出的語音質量,壹般從清晰度(或可懂度)、自然度、連貫性等方面進行主觀評價。清晰度是正確聽有意義單詞的百分比;自然度用於評價合成語音的質量是否接近人聲,合成詞的語調是否自然。連貫性用於評價合成句子的流暢性。
要合成高質量的語音,使用的算法極其復雜,所以對機器的要求也非常高。算法的復雜度決定了目前微機並發多通道TTS的系統容量。
TTS在CTI應用中的基本框架
在壹般的CTI應用系統中,會有IVR(交互式語音應答系統)。IVR系統是呼叫中心的重要組成部分。通過IVR系統,用戶可以通過按下帶有音頻的按鈕來輸入信息,並從系統中獲得預先錄制的數字或合成語音信息。具有TTS功能的IVR可以加快服務速度,節省服務成本,使IVR可以為呼叫者提供7*24小時服務。
目前常見的IVR系統大多由插在通用工控機平臺上的語音卡組成,支持中文語音合成TTS等技術。
包括TTS服務在內的典型電話服務流程可分為:
當用戶撥入時,系統IVR會響應並獲取用戶的密鑰等信息。
IVR根據用戶的關鍵信息向數據庫服務器申請相關數據。
數據庫服務器向IVR返回文本數據。
IVR通過其TCP通信接口將文本信息發送給TTS服務器。
TTS服務器通過TCP通信接口將用戶文本合成的語音數據段發送給IVR服務器。
IVR服務器將分段的語音數據組裝成獨立的語音文件。
IVR向電話用戶播放相應的語音文件。
壹般的公網接入(IVR)多采用工控機+語音卡,合成的語音數據通過局域網傳輸到IVR。這種結構只適用於簡單的應用。