語音識別系統的原理是什麽？

根據語音識別在實際應用中的差異，語音識別系統可以分為:特定人和非特定人的語音識別、獨立詞和連續詞的語音識別、小詞匯量和大詞匯量的語音識別、無限詞匯量的語音識別。但無論哪種語音識別系統，其基本原理和處理方法基本相同。語音識別原理語音信號輸入後，預處理和數字化是語音識別的前提。其中，預處理主要是對正常人的300 ~ 3400 Hz語音信號進行預濾波和保留；數字化是壹個A/D轉換和反走樣的過程。特征提取是語音信號訓練和識別的重要步驟。能夠反映語音信號特征的參數包括:(1)基於LPC的倒譜參數；(2)Mel系數的倒譜參數；(3)前沿數字信號處理技術的特征分析手段，如小波分析、時/頻域分析、人工神經網絡等。本文采用基於LPC的倒譜參數表示方法，將提取的特征值存儲在參考模式庫中，與待識別語音信號的特征值進行匹配。匹配計算是語音識別的核心部分。特征提取後，將待識別人的語音與系統訓練時生成的模板進行匹配。在說話人識別中，將與待識別語音相似度最大的模型對應的語音作為識別結果，這就是語音識別的整個過程。語音識別技術從應用範疇上分為特定人語音識別和非特定人語音識別。針對特定人的語音識別技術是針對特定人的語音識別，而其他人的話是玩具識別不了的。應用方式是使用前需要特定人的語音訓練過程，壹般根據玩具提示對語音詞條進行兩次訓練，然後即可使用；與說話者無關的語音識別不需要針對特定人的識別技術，無論年齡或性別，只要妳說同壹種語言。應用模式是在產品定型之前，根據十幾個語音交互詞條，采集200人左右的語音樣本，然後通過我們的PC算法處理，得到交互詞條的語音模型和特征庫，然後燒錄到我們的芯片上，使用我們芯片的玩具就會有交互功能。與說話者無關的語音識別的壹些應用是基於音素的算法。在這種模式下，不需要采集很多人的語音樣本就可以進行交互識別，但缺點是識別率不高，識別性能不穩定。在PC領域，微軟Word軟件有語音識別技術。