聲帶每次開合的時間稱為基音周期,其倒數稱為基音頻率。人類的最低基音頻率約為50Hz,最高約為500Hz。其中,男性的音高頻率約為50-250Hz,女性約為100-500Hz。* * *聲帶開合壹次的時間稱為基音周期* *,其倒數稱為基音頻率。人類的最低基音頻率約為50Hz,最高約為500Hz。其中男性的音高頻率約為50-250Hz,女性約為100-500Hz,如下圖所示。
人類語音信號主要由不同性質的清音和濁音成分組成。當空氣流過聲帶時,如果聲帶緊張,聲帶就會產生松弛振動,即聲帶會周期性地開合。在這種情況下,聲門處產生的準周期脈沖氣流通過聲道,然後由口腔輻射出的聲波就是濁音語音。這個準周期脈沖的周期也是上面提到的音調周期。聲帶越短,厚度越薄,張力越大,音高越高,即音高頻率越高。所以音高周期(音高頻率)是由聲帶的開合周期決定的。
氣流通過聲帶時,如果聲帶完全拉伸,來自肺部的氣流會不受影響地通過聲門。隨後,由於聲道的不同變化,氣流會形成摩擦音或爆破音,這是清音的兩種基本類型。
綜上所述,清音和濁音中,只有濁音與聲帶的開合有關。所以要檢測基音頻率,首先要找到聲音信號中的濁音成分,並進行分析。
在頻域中分析語音信號,可以使壹些在時域中無法體現的特征變得非常明顯。常用的頻域分析方法是傅立葉變換,它可以將信號分解成不同頻率成分的組合,從而將信號的時域特征和頻域特征結合起來。但是,單純通過傅立葉變換是不可能看出語音信號中的信道特性和激勵特性的。因此,人們對傅立葉變換進行了改進,提出了倒譜方法。
有時需要根據語音信號反演聲門信號和聲道的脈沖響應。即在知道卷積結果的前提下,對結果進行“反卷積”,得到參與卷積的信號。倒譜法是實現“反卷積”的方法之壹。
設X[n]為輸入信號,即聲門的激發信號;H[n]是系統的沖激響應,即信道的沖激響應;Y[n]是輸出信號,即從嘴巴輻射出來的語音信號。倒譜分析實際上是這樣壹個過程:
(1)對原始語音信號進行傅裏葉變換(這裏*代表卷積運算)得到頻譜:只考慮範圍是:。
(2)取兩邊的對數:。
(3)兩邊進行傅裏葉逆變換,得到:
IDFT是傅立葉逆變換。語音信號的倒譜可以通過對語音信號的短時譜取對數,然後進行IDFT處理來獲得。
因此,濁音信號的周期性激勵在倒譜中反映為相同的周期性脈沖。因此,我們可以從濁音信號的倒譜波形估計基音周期,進而計算基音頻率。在語音信號處理中,濁音倒譜波形中的第二個脈沖,即對應於第二個最大峰值的頻率,通常被認為是整個濁音信號的基音頻率。如圖2.3.1,分別給出了清音和濁音的倒譜波形,其中橫軸為頻率。清音信號波形圖中間沒有脈沖響應;然而,在濁音信號波形的中間有壹點脈沖響應,第二脈沖響應對應的頻率是濁音信號的基音頻率,即大約55Hz。
Matlab程序