當前位置:成語大全網 - 漢語詞典 - 語音芯片概述

語音芯片概述

芯片是半導體元器件產品的總稱。它是集成電路(IC)的載體,由晶圓片分割而成。

矽片是壹小片含有集成電路的矽,是計算機或其他電子設備的壹部分。語音芯片的定義:通過采樣將語音信號轉換成數字,存儲在IC的ROM中,再由電路將ROM中的數字還原成語音信號。

根據語音芯片的輸出模式,可以分為兩類,壹類是PWM輸出模式,壹類是DAC輸出模式。PWM的輸出音量不是連續可調的,所以不能和普通功放連接。目前市面上大部分語音芯片都是PWM輸出模式。另壹種是DAC通過內部EQ放大,語音芯片的語音可以連續調節,數控調節,可以外接功放。

普通語音芯片的放音功能本質上是壹個DAC過程,ADC過程的數據由計算機完成,包括語音信號的采樣、壓縮和EQ處理。

錄音芯片包括ADC和DAC兩個過程,都是由芯片自己完成的,包括語音數據的采集、分析、壓縮、存儲和播放等步驟。

ADC =模擬數字轉換模數轉換

DAC=數模轉換

音質取決於ADC和DAC的位數。比如20秒到340秒,最低是10秒到340秒。從名字上看,語音芯片就是與語音相關的芯片,語音就是存儲的電子聲音。凡是能發出聲音的芯片都是語音芯片,俗稱語音芯片,英文應該叫語音IC。在語音芯片的大家族中,根據類型不同可以分為(語音IC)和(語音IC)。壹般來說,面罩制作是先把聲音燒進芯片,然後封裝,壹般需要量。

Otp制作。所謂otp,就是壹次性燒。先封裝芯片,然後用軟件燒入聲音。

語音芯片根據IC本身的物理結構有多個通道(同時發出多個通道的聲音),可以分為幾種類型:

壹、單通道:

1,單通道ic(語音IC(此語音芯片不支持音樂IC音樂存儲模式);常見的語音IC是單通道語音芯片,DKC020-OTP20秒和DKA010動物叫聲是最典型的單通道語音芯片。

2、單聲道音樂IC(Music IC),在同壹單位時間內只能發出壹種音樂,電音文件是只有壹個聲道的. Mid後綴文件。

單調是最基本的音樂ic,它的效果是由壹定時間內輸出的音符數決定的,包括64個音符,128個音符等。單調有廣泛的應用和極低的價格。最常見的單聲道是生日快樂賀卡單調。典型的有DK20S等。

嚴格來說,單聲道音樂ic的結構和單聲道平板是不壹樣的。

兩個,兩個頻道:

1,2通道語音ic,2通道和多通道語音芯片,在實際應用中,語音回放壹般會固定在某個通道播放聲音(相當於單通道),但這類產品比單通道語音IC(語音IC)貴。語音芯片廠商為了平衡產品價格和應用,壹般會在功能支持和音效方面做的更完善。

這種結構可能是由產品和解決方案的實際應用領域和價格決定的。語音芯片的輸出壹般是單聲道聲音輸出,支持立體聲的產品很少。想要高端產品,壹定要選擇MP3主控芯片等解決方案。

2、2聲道音樂芯片,俗稱音樂用雙音ic,顧名思義,兩個聲道在相同單位時間內可以發射音樂的音樂ic。電子音源文件壹般是. mid的雙通道文件,常見的聖誕系列音樂ic如下。

這裏我得再補充幾句。市面上還有壹種叫melody的音樂芯片。她的定義是什麽?簡單來說,單音片的效果比和弦音樂芯片差,所以雙音也叫旋律音樂芯片。旋律結構應該說是更高級的單聲道電影,也可以說是效果翻倍的單聲道電影。

三個或四個通道、八個或更多通道:

超過三個聲道的聲音。也稱為和弦音樂。4和弦音樂ic通常指4聲道音樂IC,如DKC040。...

壹般多聲道語音芯片同時支持ic(音樂IC和IC(語音IC功能。

(a)引入“語音芯片”:

(1)語音信號的量化

采樣率(f)、位數(n)、波特率(t)

采樣:將語音模擬信號轉換成數字信號。

采樣率:每秒的樣本數(字節)。

波特率:每秒采樣的位數。波特率直接決定了音質。Bps:比特每秒

采樣位數是指二進制條件下的位數。壹般來說,除非另有說明,聲音的采樣位數是指8位,從00H - FFH,靜音設置為80H。

(2)抽樣率

奈奎斯特定律:要從采樣信號中不失真地恢復出原始信號,采樣頻率應該是信號最高頻率的2倍以上。當采樣頻率小於頻譜最高頻率的2倍時,信號的頻譜是混疊的。當采樣頻率大於頻譜最高頻率的2倍時,信號的頻譜沒有混疊。

語音的頻帶寬度大約在20 ~ 20 kHz,普通語音大約在3KHZ以下。所以壹般來說CD的音質是44.1K,16bit。如果遇到壹些特殊的聲音,比如樂器,音質也是48K,24bit,但不是主流。

壹般來說,我們在處理普通語音IC時,采樣率高達16K,語音壹般是8K(如電話質量)或6K左右。6K以下效果差。DKC系列語音芯片可以采樣22K。

在單片機應用過程中,采樣越高,定時器中斷速度越快,會影響對其他信號的監測和檢測,所以要綜合考慮。

(3)語音壓縮技術。

由於語音數據量巨大,所以需要對語音數據進行有效的壓縮,這樣可以使我們在有限的ROM空間內輸入更多的語音內容。有幾種方法:

語音分段:把語音中可以重復的部分剪下來,通過排列組合完整的回放內容。

語音采樣:壹般我們用的喇叭頻響曲線在中頻部分,高頻很少用。因此,如果喇叭的音質可以接受,適當降低采樣頻率達到壓縮效果是不可逆的,這種壓縮稱為有損壓縮。

數學壓縮:主要是壓縮采樣位數,也是有損壓縮。比如我們經常采用的ADPCM壓縮格式是將語音數據從16bit壓縮到4bit,壓縮率是4倍。MP3壓縮數據流,涉及數據預測。其波特率壓縮比約為10倍。

通常情況下,上述壓縮方法都是壹起使用的。

(4)常見的語音格式

PCM格式:脈碼調制,對模擬聲音信號進行采樣,得到量化的語音數據,是最基本、最原始的語音格式。與之非常相似的是RAW格式和SND格式。都是純語音格式。

WAV格式:Wave Audio Files是微軟開發的壹種聲音文件格式,也稱為波形聲音文件,它被Windows平臺及其應用程序廣泛支持。WAV格式支持多種壓縮算法和多種音頻比特、采樣頻率和通道,但WAV格式需要太大的存儲空間,以方便通信和傳播。WAV文件中存儲的每壹條數據都有自己獨立的標識,可以告訴用戶是什麽數據,包括采樣頻率和位數,單聲道還是立體聲等。

ADPCM格式:它利用幾個過去的樣本值來預測當前輸入的樣本值,並使其具有自適應預測功能與實際檢測值進行比較,並隨時自動處理測量差值的量化電平差,使其保持與信號同步變化。適合中等變聲率,聲音回放過程短。其優點是對人聲的處理逼真,壹般達到90%以上,在電話通信領域得到了廣泛的應用。

MP3格式:運動圖像專家組音頻層III,縮寫為MP3。它采用了MPEG音頻層3的技術,采用了名為“感官編碼技術”的編碼算法:編碼時,首先對音頻文件進行頻譜分析,然後通過濾波器濾除噪聲水平,再對剩下的每壹位進行量化分散排列,最後形成壹個高壓縮比的mp3文件,壓縮後的文件在回放時可以達到更接近原始聲源的聲音效果。其本質是vbr(Variant Bitrate可變波特率)可以根據編碼的內容動態選擇合適的波特率,所以編碼的結果是在保證音質的同時兼顧文件大小。

Mp3壓縮比10倍甚至12倍。是首次出現的高壓縮率語音格式。

線性比例格式:根據聲音的變化率,將聲音分成若幹段,每段按線性比例壓縮,但其比例是可變的。

Logpcm格式:基本上線性壓縮整個聲音,去掉最後幾個比特。這種壓縮方式在硬件上很容易實現,但是音質比線性標度差,尤其是在音量小,聲音細膩的情況下。主要用於純言語。中間格式。中格式語音占用空間小,有時十幾首中格式音樂只需20秒就能裝入壹個芯片。

(b)引入“音樂芯片”:

(1)音樂的聲道和音色:

包絡方波(貼片)通道

包絡:合成音色的壹部分,單位時間內音符輸出的變化,俗稱“ADSR”

方波:單位時間內音符方波電流的變化,作為合成音色的壹部分。(另見三角波等。)

通道:芯片同時輸出的音符數,即“單音樂器”的數量。

PCT:壹種模擬音色,通過采樣樂器聲音的256個點來模擬每個音符的音高。(音色柔和,空間小,但不夠真實)

全波:通過采集樂器的聲音來模擬每個音符的音高。(樂器的聲音是真實的,但是占用空間大,采集的音色質量高。)

(2)音樂壓縮:

由於音樂數據量巨大,需要對音樂數據進行有效的壓縮,這樣可以使我們在有限的ROM空間內輸入更多的音樂內容。有幾種方法:

音樂分段:將音樂中可重復的部分剪切出來,通過排列組合完整地回放內容。

音色:根據音樂的豐滿度和需求,確定全波、PCT、雙音的選擇。每個音占用的空間不同,音質也不同。

數學壓縮:主要是對采樣的音色(全波)進行壓縮,也是有損壓縮。對要采集的音色進行降采樣和處理,以減小采集音色的大小(與語音類相同)。語音芯片是表達的可視化,用語音長度來表示。

a)普通語音芯片以6K采樣率作為語音長度的計算標準,最大采樣率為22K。

b)錄音IC以6K采樣率作為語音長度的計算標準。

也就是芯片在6k的采樣率下可以播放的長度。同類芯片的成本與芯片大小成正比。

a)I/O口的分配和ROM(語音秒)的大小決定了芯片成本。低秒語音芯片的I/O端口較少。

b)音質提升,采樣改善,語音秒縮短。

音質降低,采樣減少,語音秒變長M - ROM大小(bit)n * f-波特率。

聲音處理軟件介紹

1)聲音鍛造

2)酷編輯

3)金波

4)步行