語音識別的技術原理是什麽?

語音識別的技術原理是將壹段語音信號轉換成相對應的文本信息，系統主要包含特征提取、聲學模型，語言模型以及字典與解碼四大部分，其中為了更有效地提取特征往往還需要對所采集到的聲音信號進行濾波、分幀等預處理工作，把要分析的信號從原始信號中提取出來。

之後，特征提取工作將聲音信號從時域轉換到頻域，為聲學模型提供合適的特征向量；聲學模型中再根據聲學特性計算每壹個特征向量在聲學特征上的得分；而語言模型則根據語言學相關的理論，計算該聲音信號對應可能詞組序列的概率；最後根據已有的字典，對詞組序列進行解碼，得到最後可能的文本表示。

作為語音識別的前提與基礎，語音信號的預處理過程至關重要。在最終進行模板匹配的時候，是將輸入語音信號的特征參數同模板庫中的特征參數進行對比，因此，只有在預處理階段得到能夠表征語音信號本質特征的特征參數，才能夠將這些特征參數進行匹配進行識別率高的語音識別。