為什麽語音可以識別字？

語音識別技術的原理是將人的話音轉換成聲音信號，經過特殊處理，與計算機中已存儲的已有聲音信號進行比較，然後反饋出識別的結果。其關鍵在於將人的話音轉換成聲音信號的準確性，以及與原有聲音信號比較時的智能化程度。語音識別技術是人工智能的有機組成部分。

目前，主流的大詞匯量語音識別系統多采用統計模式識別技術。典型的基於統計模式識別方法的語音識別系統由以下幾個基本模塊所構成

信號處理及特征提取模塊。該模塊的主要任務是從輸入信號中提取特征，供聲學模型處理。同時，它壹般也包括了壹些信號處理技術，以盡可能降低環境噪聲、信道、說話人等因素對特征造成的影響。統計聲學模型。典型系統多采用基於壹階隱馬爾科夫模型進行建模。發音詞典。發音詞典包含系統所能處理的詞匯集及其發音。發音詞典實際提供了聲學模型建模單元與語言模型建模單元間的映射。語言模型。語言模型對系統所針對的語言進行建模。理論上，包括正則語言，上下文無關文法在內的各種語言模型都可以作為語言模型，但目前各種系統普遍采用的還是基於統計的N元文法及其變體。?解碼器。

為了將聲學模型建模單元串映射到符號集，就需要發音詞典發揮作用。它實際上定義了映射的映射。為了表示方便，也可以定義壹個由到U的全集的笛卡爾積，而發音詞典則是這個笛卡爾積的壹個子集。並且有：

最後，語言模型則提供了P(W)。這樣，基本公式就可以更加具體的寫成：

對於解碼器來說，就是要在由,,ui以及時間標度t張成的搜索空間中，找到上式所指明的W。

語音識別是壹門交叉學科，語音識別正逐步成為信息技術中人機接口的關鍵技術，語音識別技術與語音合成技術結合使人們能夠甩掉鍵盤，通過語音命令進行操作。語音技術的應用已經成為壹個具有競爭性的新興高技術產業。