專利名稱::感知加權(quán)濾波方法及感知加權(quán)濾波器的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及語(yǔ)音頻的編碼解碼技術(shù),尤其涉及一種適用于寬帶語(yǔ)音或音頻編碼解碼系統(tǒng)的感知加權(quán)濾波技術(shù)。
背景技術(shù):
:人耳對(duì)一個(gè)純音的聽(tīng)覺(jué)感受性受同時(shí)存在的另外一個(gè)純音的影響,但是人的聽(tīng)覺(jué)仍能清晰地感知前一個(gè)純音,這個(gè)現(xiàn)象稱為人耳的掩遮效應(yīng)。在進(jìn)行語(yǔ)音編碼時(shí),可以利用人耳掩遮效應(yīng)即共振峰處的噪聲相對(duì)于能量較低頻段的噪聲而言不容易被察覺(jué),通過(guò)在共振峰區(qū)域分配較大的失真,來(lái)減少共振峰谷里主觀感覺(jué)更大的噪聲,提高編碼效率,并獲得較佳的主觀聽(tīng)覺(jué)效果。這一語(yǔ)音編碼技術(shù)稱為感知加權(quán)濾波:忮術(shù)。在現(xiàn)有技術(shù)一中,傳統(tǒng)的窄帶語(yǔ)音編碼技術(shù)為了在感知加一又域?qū)崿F(xiàn)噪聲按頻譜共振峰結(jié)構(gòu)分布,采用傳統(tǒng)的感知加權(quán)濾波器,對(duì)應(yīng)的傳輸函數(shù)表達(dá)式為『(z)='2力!=1其中,=1+j]a^—'',為對(duì)原始輸入信號(hào)求得的/階線性預(yù)測(cè)編碼(LPC,LinearPredictivecoding)系數(shù);;t為力口權(quán)系tt,且0〈^〈A^1。表達(dá)式(l)所描述的感知加權(quán)濾波器形式在范圍從200Hz至3400Hz的窄帶語(yǔ)音上能夠使編碼噪聲較好的模擬信號(hào)頻譜的共振峰結(jié)構(gòu),并在G.729、AMR(自適應(yīng)多碼率)等語(yǔ)音編碼中取得較成功的應(yīng)用。隨著通信技術(shù)的發(fā)展及用戶需求的提升,要求獲得更加清晰逼真的聽(tīng)覺(jué)效果,而此時(shí),200Hz至3400Hz窄帶范圍內(nèi)的語(yǔ)音編碼已不能滿足這樣的要求。語(yǔ)音編碼帶寬擴(kuò)展到50Hz至7000Hz的寬帶范圍。在這一寬帶范圍內(nèi),由于信號(hào)的頻譜具有更大的動(dòng)態(tài)范圍,信號(hào)頻譜的譜傾斜現(xiàn)象比較明顯,而以表達(dá)式(l)為基礎(chǔ)的傳統(tǒng)的感知加權(quán)濾波器不能模擬譜傾斜比較明顯的寬帶信號(hào)頻譜的共振峰結(jié)構(gòu),不適用于寬帶語(yǔ)音編碼。現(xiàn)有技術(shù)二在傳統(tǒng)的感知加權(quán)濾波器基礎(chǔ)上給出改進(jìn)方案。該方案在表達(dá)式(l)所描述的傳統(tǒng)的感知加權(quán)濾波器基礎(chǔ)上級(jí)聯(lián)一個(gè)譜傾斜濾波器,所述的譜傾斜濾波器具有如下函數(shù)形式!=1其中,;,(/=1,2)為對(duì)原始輸入信號(hào)求得的2階LPC系數(shù),可見(jiàn),該譜傾斜濾波器為全極點(diǎn)濾波器。將表達(dá)式(1)與表達(dá)式(2)相乘,就得到現(xiàn)有技術(shù)二給出的感知加權(quán)濾波器『(z)=,(3)對(duì)應(yīng)的傳輸函數(shù)表達(dá)式為^)1+i>,,(4)其中,『(z)用于模擬語(yǔ)音信號(hào)的共振峰結(jié)構(gòu),P(z)用于消除寬帶語(yǔ)音信號(hào)頻譜的譜傾斜。將表達(dá)式(4)描述的感知加權(quán)濾波器應(yīng)用在AMR-WB(自適應(yīng)多碼率的寬帶編解碼)系統(tǒng)中,取^=0.95,4=0.8,5=0.7時(shí),能夠取得較好的模擬效果。在該編碼模式下使用表達(dá)式(4)描述的感知加權(quán)濾波器時(shí),在編碼端除需要計(jì)算構(gòu)成乂(Z)的/階LPC系數(shù)外,還需要計(jì)算構(gòu)成P(z)的2階LPC系數(shù)。但是,表達(dá)式(4)描述的感知加權(quán)濾波器并不適用于語(yǔ)音和音頻混合編碼,如目前廣泛采用的AMR-WB+(擴(kuò)展的自適應(yīng)多碼率寬帶編解碼)系統(tǒng)。其原因在于AMR-WB+采用的ACELP/TCX(代數(shù)碼激勵(lì)線性預(yù)測(cè)/變換碼激勵(lì))混合編碼模式中,除編碼端外,還需要在解碼端對(duì)信號(hào)做感知加權(quán)處理,因此若在該編碼模式下仍使用表達(dá)式(4)描述的感知加權(quán)濾波器,那么除需要在編碼端完成相應(yīng)的計(jì)算,還需要在解碼端獲得構(gòu)成戶(z)的2階LPC系數(shù)。獲得該系數(shù)的途徑有兩種一種是在編碼端將P(z)的2階LPC系數(shù)傳遞到解碼端,該方法存在的缺點(diǎn)是增加了傳輸?shù)谋忍芈剩涣硪环N是在解碼端利用編碼端傳遞的『(z)的/階LPC系數(shù)計(jì)算尸(z)的2階LPC系數(shù),而這一推導(dǎo)計(jì)算過(guò)程復(fù)雜,涉及高階非特殊矩陣的求逆運(yùn)算。可見(jiàn),該方法的缺點(diǎn)是極大的增加了解碼器的運(yùn)算復(fù)雜度。可見(jiàn),將表達(dá)式(4)描述的感知加權(quán)濾波器應(yīng)用到語(yǔ)音和音頻混合編碼模式雖然在理論上是可行的,但實(shí)際應(yīng)用中將遇到上述問(wèn)題。現(xiàn)有技術(shù)三為AMR-WB+協(xié)議中采用的感知加權(quán)濾波器,對(duì)應(yīng)傳輸函數(shù)為<formula>formulaseeoriginaldocumentpage8</formula>(5)其中u=0.68。AMR-WB+通過(guò)同一預(yù)加重濾波器減小信號(hào)的動(dòng)態(tài)范圍,以達(dá)到消除信號(hào)頻譜的譜傾斜。但是,這一處理方案并沒(méi)有依據(jù)當(dāng)前編碼頻譜本身的特點(diǎn)加以調(diào)整,因此得到的噪聲模擬信號(hào)頻譜共振峰結(jié)構(gòu)的效果并不理想。
發(fā)明內(nèi)容本發(fā)明實(shí)施例提供一種感知加權(quán)濾波方法,減少語(yǔ)音或音頻信號(hào)或其組合信號(hào)編碼系統(tǒng)在編碼解碼端的運(yùn)算復(fù)雜度,并提高主觀聽(tīng)覺(jué)效果。本發(fā)明實(shí)施例還提供一種感知加權(quán)濾波器,提高主觀聽(tīng)覺(jué)效果。所述感知加權(quán)濾波方法,對(duì)語(yǔ)音或音頻信號(hào)做感知加權(quán)濾波處理,其特征在于,包括以下步驟對(duì)輸入的語(yǔ)音或音頻信號(hào)進(jìn)行譜傾斜濾波處理;對(duì)經(jīng)過(guò)譜傾斜濾波處理后輸出的語(yǔ)音或音頻信號(hào)做感知加權(quán)濾波處理,其中根據(jù)輸入信號(hào)的i普平坦度選擇相應(yīng)的加權(quán)因子取值;將經(jīng)過(guò)傳統(tǒng)的感知加權(quán)處理的語(yǔ)音或音頻信號(hào)輸出;并且,將所述做感知加權(quán)濾波處理用到的傳輸函數(shù)的系數(shù)中的部分系數(shù)直接作為所述i普傾斜濾波處理用到的傳輸函數(shù)的系數(shù)。所述感知加權(quán)濾波器包括譜傾斜濾波單元和感知加權(quán)濾波單元;所述的譜傾斜濾波單元,用于對(duì)輸入的語(yǔ)音或音頻信號(hào)的頻譜做譜平坦處理,所述的語(yǔ)音或音頻信號(hào)經(jīng)過(guò)該單元處理后,由所述的感知加權(quán)濾波處理單元進(jìn)4于處理;所述的感知加權(quán)濾波單元,用于對(duì)輸入的原始語(yǔ)音或音頻信號(hào)進(jìn)行濾波處理,對(duì)一艮據(jù)輸入該單元的信號(hào)的共振峰結(jié)構(gòu)調(diào)整輸入該單元的信號(hào)的噪聲分布,并將經(jīng)過(guò)該單元濾波處理的信號(hào)繼續(xù)輸出,其中根據(jù)輸入信號(hào)的鐠平坦度選擇相應(yīng)的加權(quán)因子取值;并且,將所述感知加權(quán)濾波單元用到的傳輸函數(shù)的系數(shù)中的部分系數(shù)直接作為所述譜傾斜濾波單元用到的傳輸函數(shù)的系數(shù)。。在本發(fā)明實(shí)施例中,當(dāng)在語(yǔ)音或音頻信號(hào)或其組合信號(hào)的編碼解碼系統(tǒng)中,尤其是在語(yǔ)音和音頻混合編碼解碼的系統(tǒng)中運(yùn)用本發(fā)明提供的感知加權(quán)方法或感知加權(quán)濾波器,在編碼端,只要計(jì)算原先就需計(jì)算的對(duì)語(yǔ)音或音頻信號(hào)做傳統(tǒng)的感知加權(quán)濾波處理用到的傳輸函數(shù)『(z)或構(gòu)成所述的傳統(tǒng)的感知加權(quán)濾波器的傳輸函數(shù)『(z)的系數(shù),并將該系數(shù)中的部分系數(shù)直接作為對(duì)語(yǔ)音或音頻信號(hào)做譜傾斜濾波處理用到的傳輸函數(shù),(z)或構(gòu)成所述的譜傾斜濾波器的傳輸函數(shù)P'(z)的系數(shù),因此相比較現(xiàn)有技術(shù),本發(fā)明的實(shí)現(xiàn)在編碼端能夠減少計(jì)算復(fù)雜度;解碼端解碼『(z)的系數(shù),并將該系數(shù)中的部分系數(shù)直接作為構(gòu)成所述的尸'(z)的系數(shù),可見(jiàn),本發(fā)明的實(shí)現(xiàn)無(wú)需增加額外的傳輸比特率,并且在解碼端能夠極大減少算法復(fù)雜度與計(jì)算量。并且,本發(fā)明能夠在減少信號(hào)的感知加權(quán)處理環(huán)節(jié)的算法復(fù)雜度與計(jì)算量的同時(shí),達(dá)到甚至超過(guò)現(xiàn)有技術(shù)的感知加權(quán)的處理效果。并且本發(fā)明給出的感知加權(quán)濾波器和感知加權(quán)的方法適用于對(duì)語(yǔ)音或音頻信號(hào)進(jìn)行處理。另外,本發(fā)明提供的技術(shù)方案還適用于AMR-WB+編碼系統(tǒng),并且在實(shí)際應(yīng)用中能夠取得比現(xiàn)有技術(shù)更好的噪聲整形效果。當(dāng)本發(fā)明給出技術(shù)方案應(yīng)用在除AMR-WB和AMR-WB+之外的其他寬帶語(yǔ)音或音頻編碼系統(tǒng)中時(shí),通過(guò)調(diào)整參數(shù)A、^和^的值以獲得最佳感知加權(quán)處理效果。圖1是本發(fā)明具體實(shí)施給出的對(duì)輸入信號(hào)做感知加權(quán)濾波處理的流程圖2是本發(fā)明具體實(shí)施給出的感知加權(quán)濾波器的結(jié)構(gòu)示意圖3是在AMR-WB+的ACELP/TCX編碼系統(tǒng)中使用現(xiàn)有技術(shù)二和本發(fā)明給出的感知加權(quán)濾波器分別對(duì)原始的語(yǔ)音輸入信號(hào)進(jìn)行感知加權(quán)處理的實(shí)驗(yàn)結(jié)果對(duì)比圖4是在AMR-WB+的ACELP/TCX編碼系統(tǒng)中使用現(xiàn)有技術(shù)二和本發(fā)明給出的感知加權(quán)濾波器分別對(duì)原始的音頻輸入信號(hào)進(jìn)行感知加權(quán)處理的實(shí)驗(yàn)結(jié)果對(duì)比圖5是在AMR-WB+的ACELP/TCX編碼系統(tǒng)中使用現(xiàn)有4支術(shù)三和本發(fā)明給出的感知加權(quán)濾波器分別對(duì)原始的語(yǔ)音輸入信號(hào)進(jìn)行感知加權(quán)處理的實(shí)驗(yàn)結(jié)果對(duì)比圖6是在AMR-WB+的ACELP/TCX編碼系統(tǒng)中使用現(xiàn)有技術(shù)三和本發(fā)明給出的感知加權(quán)濾波器分別對(duì)原始的音頻輸入信號(hào)進(jìn)行感知加權(quán)處理的實(shí)驗(yàn)結(jié)果對(duì)比圖。具體實(shí)施例方式對(duì)
背景技術(shù):
中提及的所述的掩遮效應(yīng)作進(jìn)一步分析可知,在語(yǔ)音頻譜中,能量較高的頻段,即共振峰處的噪聲相對(duì)于能量較低頻段的噪聲而言,不易被感知。因此,在分配原始語(yǔ)音與合成語(yǔ)音之間的誤差,即噪聲時(shí),在能量比較大的共振峰區(qū)域,可以允許噪聲大一些,相應(yīng)地,在能量比較小的共振峰谷,要求噪聲小一些。本發(fā)明實(shí)施例正是基于這一原理,在寬帶語(yǔ)音編碼中,通過(guò)在感知加權(quán)域調(diào)整噪聲分布,達(dá)到提高編碼效率、增強(qiáng)語(yǔ)音編碼的主觀聽(tīng)覺(jué)質(zhì)量的目的。本發(fā)明實(shí)施例提供的感知加權(quán)濾波方法對(duì)輸入信號(hào)做感知加權(quán)濾波處理時(shí),使用的傳輸函數(shù)仍沿用
背景技術(shù):
中所述的表達(dá)式(3)的形式,即該傳輸函數(shù)仍包括兩部分傳統(tǒng)的感知加權(quán)濾波處理用到的傳輸函數(shù)與譜傾斜濾波處理用到的傳輸函數(shù),但不再重新計(jì)算推導(dǎo)譜傾斜濾波處理用到的傳輸函數(shù)的系數(shù),而是將所述做傳統(tǒng)的感知加權(quán)濾波處理用到的傳輸函數(shù)的系數(shù)中的部分系數(shù)直接作為所述譜傾斜濾波處理用到的傳輸函數(shù)的系數(shù);之后,運(yùn)用本發(fā)明實(shí)施例給出的傳輸函數(shù)對(duì)輸入信號(hào)進(jìn)行感知加權(quán)濾波處理,即進(jìn)行噪聲整形,達(dá)到掩遮噪聲的目的。首先詳細(xì)說(shuō)明本發(fā)明實(shí)施例提供的對(duì)輸入信號(hào)估文感知加權(quán)處理需要用到的傳輸函數(shù)。令本發(fā)明中,對(duì)輸入信號(hào)做感知加權(quán)處理使用的傳輸函數(shù)為『"(z),令其中傳統(tǒng)的感知加權(quán)濾波處理用到的傳輸函數(shù)仍為『0),令本發(fā)明實(shí)施例中的譜傾斜濾波處理用到的傳輸函數(shù)為,有<formula>formulaseeoriginaldocumentpage11</formula>(6)其中,『(z)為表達(dá)式(l)描述的函數(shù),若取/=16,則有<formula>formulaseeoriginaldocumentpage11</formula>其中,義為力口權(quán)系數(shù)。所述的,(z)的函數(shù)形式為:其中,~為與原始輸入信號(hào)對(duì)應(yīng)的p階LPC系數(shù)。在本發(fā)明未給出改進(jìn)方案之前,所述的階LPC系數(shù)需要從構(gòu)成爿(力的/階系數(shù)推導(dǎo)求得,該推導(dǎo)過(guò)程相當(dāng)復(fù)雜。但鑒于本發(fā)明實(shí)施例給出的改進(jìn),所述的;?階LPC系數(shù)可從所述的/階系數(shù)中直接取得,即令組成尸'(z)的一組;7階LPC系數(shù)構(gòu)成集合6={~,7'=1山對(duì)應(yīng)地,組成爿(z)的一組/階LPC系數(shù)構(gòu)成集合=1,L,/},則有6cfl,1<^</,且所述的集合6中;?個(gè)元素分別與集合g中前;?個(gè)元素——對(duì)應(yīng)并相同。可舉例說(shuō)明,設(shè);=2,/=16,那么,可取集合a中前兩個(gè)系數(shù)A、A作為與兩個(gè)系數(shù)^分別對(duì)應(yīng)的系數(shù),即"=<^、62="2。由表達(dá)式(2)與表達(dá)式(8)可知,現(xiàn)有技術(shù)中采用的譜傾斜濾波處理用到的傳輸函數(shù)尸(z)為全極點(diǎn)函數(shù);本發(fā)明實(shí)施例給出的譜傾斜濾波處理用到的為全零點(diǎn)函數(shù)。結(jié)合表達(dá)式(7)與表達(dá)式(8),得到本發(fā)明給出的對(duì)輸入信號(hào)^故感知加權(quán)處理的傳輸函數(shù)的表達(dá)式為在公式(9)中加權(quán)因子,、X2,5的選擇具體如下(l)計(jì)算譜平坦度的表征對(duì)象。在本實(shí)施例中用濾波器A(z)響應(yīng)的高低頻能量差值來(lái)表征計(jì)算譜平坦度。對(duì)量化后的A(z)系數(shù)仏^(i=1...16)補(bǔ)零進(jìn)行32點(diǎn)的快速傅立葉變換(FFT,F(xiàn)astFourierTransform);將FFT變換后得到的+'■)頻域復(fù)數(shù)序列記為(Ci)(i=1...32)。在此基礎(chǔ)上分別用^]201oglO(IC,.1)、!;201oglO(lC,.I)代表高低頻能量的分貝估計(jì)值,然后計(jì)算二者的平均差值表征i普平坦度,記為i201oglO(IC,.l)-l;201oglO(IC,.1)A=^-^-(10)8(2)根據(jù)差值A(chǔ)所在區(qū)間,查表l,選擇通過(guò)實(shí)驗(yàn)預(yù)設(shè)定的加權(quán)因子V入2,5的值。表1區(qū)間劃分及加權(quán)因子取值<table>tableseeoriginaldocumentpage13</column></row><table>然后,結(jié)合給出的傳輸函數(shù)對(duì)輸入信號(hào)做感知加權(quán)處理。參閱圖1,本發(fā)明具體實(shí)施給出的對(duì)輸入信號(hào)做感知加權(quán)濾波處理的流程圖,對(duì)具體實(shí)施方式進(jìn)行說(shuō)明。步驟101、對(duì)輸入的語(yǔ)音或音頻信號(hào)進(jìn)行譜傾4牛濾波處理;該步驟中,運(yùn)用上述本發(fā)明實(shí)施例給出的語(yǔ)傾^h慮波處理用到的傳輸函數(shù)尸'(z)對(duì)寬帶語(yǔ)音或音頻信號(hào)做濾波處理,消除所述寬帶信號(hào)的譜傾斜,使得到的輸出信號(hào)的頻譜平坦。步驟102、對(duì)經(jīng)過(guò)步驟101處理后得到的輸出信號(hào)進(jìn)一步,支傳統(tǒng)的感知加權(quán)濾波處理,調(diào)整噪聲分布;該步驟中,運(yùn)用上述傳統(tǒng)的感知加權(quán)濾波處理用到的『O)調(diào)整所述的輸出信號(hào)的噪聲分布,使得到的輸出信號(hào)的噪聲分布能夠跟隨語(yǔ)音或音頻信號(hào)頻譜共振峰變化。步驟103、將經(jīng)過(guò)感知加權(quán)處理的語(yǔ)音或音頻信號(hào)輸出。由上述內(nèi)容可知,本發(fā)明實(shí)施例給出的感知加權(quán)濾波方法通過(guò)譜傾斜濾波使寬帶信號(hào)頻譜平坦,再對(duì)信號(hào)利用傳統(tǒng)的感知加權(quán)濾波處理,使噪聲分布能夠跟隨語(yǔ)音或音頻信號(hào)頻譜共振峰變化,從而實(shí)現(xiàn)掩遮噪聲的目的。另外,在實(shí)際的應(yīng)用中,如分析合成法中計(jì)算合成語(yǔ)音信號(hào)的時(shí)候,需要將感知加權(quán)域的信號(hào)恢復(fù)到非感知加權(quán)域,這個(gè)恢復(fù)的過(guò)程即感知加權(quán)的逆過(guò)程,因此,對(duì)應(yīng)的傳輸函數(shù)為表達(dá)式(9)的倒數(shù)<formula>formulaseeoriginaldocumentpage14</formula>1本發(fā)明還提供一種如圖2所示的感知加權(quán)濾波器,該濾波器根據(jù)上述本發(fā)明給出的感知加權(quán)濾波方法而設(shè)計(jì),對(duì)輸入信號(hào)進(jìn)行濾波處理。所述的感知加權(quán)濾波器包括譜傾斜濾波單元201和感知加權(quán)濾波單元202。所述的譜傾斜濾波單元201對(duì)輸入的語(yǔ)音或音頻信號(hào)的進(jìn)行譜傾斜濾波,使輸入的語(yǔ)音或音頻信號(hào)的頻譜平坦,所述的語(yǔ)音或音頻信號(hào)經(jīng)過(guò)該單元處理后,繼續(xù)輸入所述的感知加;f又濾波處理單元;所述的感知加權(quán)濾波單元202根據(jù)原始語(yǔ)音或音頻信號(hào)的共振峰結(jié)構(gòu)調(diào)整輸入該單元的信號(hào)的噪聲分布,并將經(jīng)過(guò)該單元濾波處理的信號(hào)繼續(xù)輸出。所述的感知加權(quán)濾波單元202能夠減弱譜平坦處理后共振峰頻率區(qū)域的重要性。所述感知加權(quán)濾波單元202還包括譜平坦度計(jì)算單元,該單元用于對(duì)輸入的信號(hào)利用進(jìn)行譜平坦度計(jì)算,濾波器A(z)響應(yīng)的高低頻能量差值來(lái)表征所述譜平坦度,具體的該譜平坦度計(jì)算單元包括一第一譜平坦度計(jì)算單元,其用本實(shí)施例中公式(11)計(jì)算所述濾波器A(z)響應(yīng)的高低頻能量差值。所述感知加權(quán)濾波單元202還進(jìn)一步包括加一又因子查找單元,該查找單元根據(jù)濾波器A(z)響應(yīng)的高低頻能量差值在表l中查找相應(yīng)的加權(quán)因子取值,并確定該感知濾波器的加權(quán)因子。所述的感知加權(quán)濾波單元的傳輸函數(shù)參見(jiàn)表達(dá)式(l);所述的譜傾斜濾波單元的傳輸函數(shù)參見(jiàn)表達(dá)式(8),相應(yīng)地,所述的感知加權(quán)濾波器的傳輸函數(shù)參見(jiàn)表達(dá)式(9),其中的加權(quán)因子根據(jù)輸入信號(hào)的譜平坦度確定,通過(guò)計(jì)算譜平坦度查找相對(duì)應(yīng)的加權(quán)因子值。并且,與上述本發(fā)明給出的感知加權(quán)濾波方法相對(duì)應(yīng),將所述感知加權(quán)濾波單元用到的傳輸函數(shù)的系數(shù)中的部分系數(shù)直接作為所述譜傾^h慮波單元用到的傳輸函數(shù)的系數(shù),即令表達(dá)式(8)中組成尸'(z)的一組;?階LPC系數(shù)構(gòu)成集合Zf={~,_/=1,L,;};對(duì)應(yīng)地,表達(dá)式(l)中組成j(z)的一組/階LPC系數(shù)構(gòu)成集合『p,"、l,L,/},則有6cfl,1</</,且所述的集合6中;?個(gè)元素分別與集合a中前;?個(gè)元素——對(duì)應(yīng)并相同。可舉例說(shuō)明,_沒(méi)/=2,/=16,那么,可取集合fl中前兩個(gè)系數(shù)^、"2作為與兩個(gè)系數(shù)~分別對(duì)應(yīng)的系數(shù),即=^、62=a2。將本發(fā)明給出的感知加權(quán)濾波器、現(xiàn)有技術(shù)二給出的感知加權(quán)濾波器以及現(xiàn)有技術(shù)三,即AMR-WB+本身采用的感知加權(quán)濾波器應(yīng)用于寬帶語(yǔ)音和音頻混合編碼系統(tǒng),如AMR-WB+的ACELP/TCX語(yǔ)音和音頻的混合編碼系統(tǒng)中,結(jié)合附圖對(duì)比說(shuō)明本發(fā)明技術(shù)方案與現(xiàn)有技術(shù)對(duì)語(yǔ)音信號(hào)和音頻信號(hào)感知加權(quán)處理的效果。其中,現(xiàn)有技術(shù)二中感知加權(quán)濾波器采用的傳輸函數(shù)對(duì)應(yīng)表達(dá)式(4),該式中各參數(shù)取分別是p=2,/=16,A=0.95,^=0.8,5=0.7;現(xiàn)有技術(shù)三中感知加權(quán)濾波器采用的傳輸函數(shù)對(duì)應(yīng)表達(dá)式(5),其中,取//=0.68;式中各參數(shù)取值分別是^=2,/==16,即兩個(gè)系數(shù)^分別與前兩個(gè)a,.系數(shù)對(duì)應(yīng);A=0.91,;^=0.3,5=0.2。圖3所示為使用現(xiàn)有技術(shù)二和本發(fā)明給出的感知加權(quán)濾波器分別對(duì)原始的語(yǔ)音輸入信號(hào)進(jìn)行感知加權(quán)處理的實(shí)驗(yàn)結(jié)果。由圖3可見(jiàn),本實(shí)施例中,本發(fā)明給出的感知加權(quán)濾波器對(duì)原始語(yǔ)音信號(hào)做濾波后,得到的量化噪聲能夠纟艮好地跟隨原始信號(hào)的頻譜包絡(luò)的變化而變化;并且共振峰的頻率成分能夠很好地掩遮掉量化噪聲。經(jīng)過(guò)現(xiàn)有技術(shù)二給出的感知加權(quán)濾波器處理后得到的量化噪聲雖然也能夠跟隨原始信號(hào)的頻譜包絡(luò)的變化而變化,但是掩遮效果顯然沒(méi)有使用經(jīng)過(guò)本發(fā)明改進(jìn)的感知加權(quán)濾波器的效果好。由圖3中曲線可見(jiàn),現(xiàn)有技術(shù)二對(duì)應(yīng)的處理效果中,量化噪聲相對(duì)較高,并且在多處出現(xiàn)共振峰頻無(wú)法有效掩蔽噪聲,這樣的處理效果顯然是有待改進(jìn)的。相比較而言,本實(shí)施例給出的處理結(jié)果顯然較好,即能夠利用在共振峰區(qū)域分配比較大的量化噪聲,而在共振峰谷分配比較小的量化噪聲,因此,能夠獲得較好的主觀聽(tīng)覺(jué)效果。圖4所示為使用現(xiàn)有技術(shù)二和本發(fā)明給出的感知加權(quán)濾波器分別對(duì)原始的音頻輸入信號(hào)進(jìn)行感知加權(quán)處理的實(shí)驗(yàn)結(jié)果。對(duì)圖4的分析可參考上述對(duì)圖3中處理結(jié)果的分析。并且,由圖4可見(jiàn),現(xiàn)有技術(shù)二在低頻段給出的處理結(jié)果幾乎不能獲得共振峰的頻率成分掩遮掉量化噪聲的效果,因此主觀聽(tīng)覺(jué)效果并不理想,這一實(shí)驗(yàn)結(jié)果也跟
背景技術(shù):
中分析得出的現(xiàn)有技術(shù)二不適用于寬帶語(yǔ)音和音頻的混合編碼系統(tǒng)的結(jié)果一致。由圖4顯而易見(jiàn),本實(shí)施例中,本發(fā)明給出的處理結(jié)果相對(duì)較好。圖5所示為使用現(xiàn)有技術(shù)三和本發(fā)明給出的感知加權(quán)濾波器分別對(duì)原始的語(yǔ)音輸入信號(hào)進(jìn)行感知加權(quán)處理的實(shí)驗(yàn)結(jié)果。由圖5可見(jiàn),本實(shí)施例中,現(xiàn)有技術(shù)三給出的處理結(jié)果雖然能夠使量化噪聲低于本發(fā)明的處理結(jié)果,但是,圖5所示的實(shí)驗(yàn)結(jié)果顯示了該技術(shù)固有的缺陷,即
背景技術(shù):
中提及的這一處理方案并沒(méi)有依據(jù)當(dāng)前編碼頻譜本身的特點(diǎn)加以調(diào)整,因此得到的量化噪聲跟隨共振峰頻譜包絡(luò)變化的效果并不理想,而這一缺陷帶來(lái)的后果就是編碼效率的降低,即需要分配更多的編碼比特率以降低噪聲。而本發(fā)明處理得到的量化噪聲由于能夠很好地跟隨原始信號(hào)的頻譜包絡(luò)的變化而變化,因此,根據(jù)掩遮效應(yīng)提高編碼效率。圖6所示為使用現(xiàn)有技術(shù)三和本發(fā)明給出的感知加權(quán)濾波器分別對(duì)原始的音頻輸入信號(hào)進(jìn)行感知加權(quán)處理的實(shí)驗(yàn)結(jié)果。對(duì)圖6的分析內(nèi)容可參見(jiàn)上述對(duì)圖5的分析,不再贅述。由上述內(nèi)容可知,當(dāng)在語(yǔ)音和/或音頻的編碼解石馬系統(tǒng)中,尤其是在語(yǔ)音和音頻混合編碼解碼的系統(tǒng)中運(yùn)用本發(fā)明提供的感知力o權(quán)方法或感知加權(quán)濾波器,在編碼端,只要計(jì)算原先就需計(jì)算的對(duì)語(yǔ)音或音頻信號(hào)做傳統(tǒng)的感知加權(quán)濾波處理用到的傳輸函數(shù)『(z)或構(gòu)成所述的傳統(tǒng)的感知加權(quán)濾波器的傳輸函數(shù)『(z)的系數(shù),并將該系數(shù)中的部分系數(shù)直接作為對(duì)語(yǔ)音或音頻信號(hào)做譜傾斜濾波處理用到的傳輸函數(shù),(z)或構(gòu)成所述的鐠傾鈄濾波器的傳輸函數(shù)戶'(z)的系數(shù),因此相比較現(xiàn)有技術(shù),本發(fā)明的實(shí)現(xiàn)在編碼端能夠減少計(jì)算復(fù)雜度;解碼端解碼『(z)的系數(shù),并將該系數(shù)中的部分系數(shù)直4妾作為構(gòu)成所述的尸'(z)的系數(shù),可見(jiàn),本發(fā)明的實(shí)現(xiàn)無(wú)需增加額外的傳輸比特率,并且在解碼端能夠極大減少算法復(fù)雜度與計(jì)算量。并且,由圖3至圖6給出的實(shí)驗(yàn)結(jié)果表明,本發(fā)明能夠在減少信號(hào)的感知加權(quán)處理環(huán)節(jié)的算法復(fù)雜度與計(jì)算量的同時(shí),達(dá)到甚至超過(guò)現(xiàn)有技術(shù)的感知加權(quán)的處理效果。并且本發(fā)明給出的感知加權(quán)濾波器適用于對(duì)語(yǔ)音信號(hào)或音頻信號(hào)進(jìn)行處理。當(dāng)本發(fā)明給出的感知加一又濾波器應(yīng)用在除AMR-WB和AMR-WB+之外的其他寬帶語(yǔ)音/音頻編碼系統(tǒng)中時(shí),通過(guò)調(diào)整參數(shù)A、^和S的值以獲得最佳感知加權(quán)濾波效果。在實(shí)際的應(yīng)用中,如分析合成法中計(jì)算合成語(yǔ)奮信號(hào)的時(shí)4夷,需要將感知加權(quán)域的信號(hào)恢復(fù)到非感知加權(quán)域,這個(gè)恢復(fù)的過(guò)禾呈即感知加4又的逆過(guò)程,因此,本發(fā)明基于上述給出的感知加權(quán)濾波器還提供一種逆感知加權(quán)濾波器,該濾波器對(duì)應(yīng)所述的感知加權(quán)濾波器的逆處玉里,對(duì)應(yīng)的傳輸函數(shù)為表達(dá)式(IO)。權(quán)利要求1、一種感知加權(quán)濾波方法,對(duì)語(yǔ)音或音頻信號(hào)做感知加權(quán)濾波處理,其特征在于,包括以下步驟對(duì)輸入的語(yǔ)音或音頻信號(hào)進(jìn)行譜傾斜濾波處理;對(duì)經(jīng)過(guò)譜傾斜濾波處理后輸出的語(yǔ)音或音頻信號(hào)做感知加權(quán)濾波處理,其中根據(jù)輸入信號(hào)的譜平坦度選擇相應(yīng)的加權(quán)因子取值;將經(jīng)過(guò)傳統(tǒng)的感知加權(quán)處理的語(yǔ)音或音頻信號(hào)輸出;并且,將所述做感知加權(quán)濾波處理用到的傳輸函數(shù)的系數(shù)中的部分系數(shù)直接作為所述譜傾斜濾波處理用到的傳輸函數(shù)的系數(shù)。2、根據(jù)權(quán)利要求1所述的方法,其特征在于,令所述譜傾斜濾波處理用到的傳輸函數(shù)系數(shù)為一組p階LPC系數(shù),由該組系數(shù)構(gòu)成集合6="[~,y'=l,L,;};對(duì)應(yīng)地,所述傳統(tǒng)的感知加權(quán)處理用到的傳輸函數(shù)系數(shù)為一組/階LPC系數(shù),由該組系數(shù)構(gòu)成集合『"K,z、l,L,/},則有6c",1<P</,且所述的集合6中的;?個(gè)元素分別與集合a中前;?個(gè)元素——對(duì)應(yīng)并相同,其中,^即為/階LPC系數(shù),;?為L(zhǎng)PC系數(shù)的階數(shù),即為/階LPC系數(shù),/為L(zhǎng)PC系數(shù)的階數(shù)。3、根據(jù)權(quán)利要求2所述的方法,其特征在于,利用傳輸函數(shù)P'(z)對(duì)輸入的語(yǔ)音或音頻信號(hào)做譜傾斜濾波處理,所述傳輸函數(shù)尸'(z)表達(dá)式為乂=15為力口權(quán)系數(shù),z為復(fù)變量;所述的,(z)為全零點(diǎn)傳輸函數(shù)。4、根據(jù)權(quán)利要求3所述的方法,其特征在于,令做感知加權(quán)處理使用的傳輸函數(shù)為『"(z),則其表達(dá)式為<formula>formulaseeoriginaldocumentpage3</formula>5、根據(jù)權(quán)利要求4所述的方法,其特征在于,所述譜平坦度通過(guò)濾波器響應(yīng)的高低頻能量差值來(lái)表征,令所述高低頻能量差值為a,則其計(jì)算公式為<formula>formulaseeoriginaldocumentpage3</formula>其中(C"(i=1...32)為濾波器系數(shù){1^,.}(i=1...16)進(jìn)行補(bǔ)零32點(diǎn)的快速傅立葉變換后得到的頻域復(fù)數(shù)序列。6、根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)輸入信號(hào)的譜平坦度選擇相應(yīng)的加權(quán)因子取值具體為根據(jù)所述高低頻能量差值a的區(qū)間確定加權(quán)因子的取值;-oo〈a〈+o0,0.91^入i^0.91,0.25^入2^0.7,0.1^5^0.5。7、根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述高低頻能量差值△的區(qū)間確定加權(quán)因子的取值具體為當(dāng)誦oo〈a^一25時(shí),X產(chǎn)0.91、X2=0.25、5=0.2;當(dāng)-25〈a^-20時(shí),X產(chǎn)0.91、X2=0.45、5=0.2;當(dāng)-20〈a^國(guó)10時(shí),X產(chǎn)0.95、X2=0.5、5=0.1;當(dāng)-l(ka^0時(shí),入尸0.95、入2=0.7、5=0.1;當(dāng)(ka^+0°時(shí),入尸0.96、入2=0.6、5=0.5。8、根據(jù)權(quán)利要求4所述的方法,其特征在于,所述的方法將感知加權(quán)域的信號(hào)變換到非感知加權(quán)域,使用的傳輸函數(shù)的表達(dá)式為<formula>formulaseeoriginaldocumentpage3</formula>9、一種感知加權(quán)濾波器,對(duì)輸入的語(yǔ)音或音頻信號(hào)做感知加權(quán)濾波處理,其特征在于,包括-潛傾斜濾波單元和感知加權(quán)濾波單元;所述的i普傾斜濾波單元,用于對(duì)輸入的語(yǔ)音或音頻信號(hào)的頻譜做譜平坦處理,所述的語(yǔ)音或音頻信號(hào)經(jīng)過(guò)該單元處理后,由所述的感知加權(quán)濾波處理單元進(jìn)行處理;所述的感知加權(quán)濾波單元,用于對(duì)輸入的原始語(yǔ)音或音頻信號(hào)進(jìn)行濾波處理,對(duì)根據(jù)輸入該單元的信號(hào)的共振峰結(jié)構(gòu)調(diào)整輸入該單元的信號(hào)的噪聲分布,并將經(jīng)過(guò)該單元濾波處理的信號(hào)繼續(xù)輸出,其中根據(jù)輸入信號(hào)的譜平坦度選擇相應(yīng)的加4又因子取值;并且,將所述感知加權(quán)濾波單元用到的傳輸函數(shù)的系數(shù)中的部分系數(shù)直接作為所述譜傾斜濾波單元用到的傳輸函數(shù)的系數(shù)。10、根據(jù)權(quán)利要求9所述的感知加權(quán)濾波器,其特征在于,所述感知加權(quán)濾波單元還包括譜平坦度計(jì)算單元,用于計(jì)算濾波器響應(yīng)的高低頻能量差值,所述高低頻能量差值用于表征輸入信號(hào)的譜平坦度;加權(quán)因子查找單元,用于根據(jù)所述濾波器響應(yīng)的高低頻能量差值確定相應(yīng)的加權(quán)因子取值。11、根據(jù)權(quán)利要求IO所述的感知加權(quán)濾波器,其特征在于,所屬譜平坦度計(jì)算單元具體為第一譜平坦度計(jì)算單元,該第一譜平坦度計(jì)算單元用于根據(jù)下述公式來(lái)計(jì)算高低頻能量差值,所述公式為<formula>formulaseeoriginaldocumentpage4</formula>其中(Q)(i=1...32)為濾波器系數(shù){1,^}(i=1...16)進(jìn)行補(bǔ)零32點(diǎn)的快速傅立葉變換后得到的頻域復(fù)數(shù)序列。12、根據(jù)權(quán)利要求11所述的感知加權(quán)濾波器,其特征在于,令所述的譜傾斜濾波單元用到的傳輸函數(shù)為尸'(z),則其表達(dá)式為^為力口權(quán)系數(shù),z為復(fù)變量,^即為;?階LPC系數(shù);令所述感知加權(quán)濾波單元用到的傳輸函數(shù)為『(z),且其中,A與A為加權(quán)系數(shù),且(x;^;i^i;并令6={~,_/=l,L,;},"={^.,/=1山,/},則有6ca,1</<Z,且所述的集合6中;?個(gè)元素分別與集合a中前p個(gè)元素——對(duì)應(yīng)并相同。13、根據(jù)權(quán)利要求9或IO所述的感知加權(quán)濾波器,其特征在于,令所述的感知加權(quán)濾波器用到的傳輸函數(shù)為『"(z),則其表達(dá)式為(l+土W)p『'(z)=釅(z)尸'(z)=——^-(l+乞&,z力,■=全文摘要本發(fā)明實(shí)施例公開(kāi)了一種感知加權(quán)濾波方法,主要包括對(duì)輸入的語(yǔ)音或音頻信號(hào)進(jìn)行譜傾斜濾波處理;對(duì)經(jīng)過(guò)譜傾斜濾波處理后輸出的語(yǔ)音或音頻信號(hào)做感知加權(quán)濾波處理,其中根據(jù)輸入信號(hào)的譜平坦度選擇相應(yīng)的加權(quán)因子取值;將經(jīng)過(guò)傳統(tǒng)的感知加權(quán)處理的語(yǔ)音或音頻信號(hào)輸出;并且,將所述做感知加權(quán)濾波處理用到的傳輸函數(shù)的系數(shù)中的部分系數(shù)直接作為所述譜傾斜濾波處理用到的傳輸函數(shù)的系數(shù)。同時(shí)本發(fā)明實(shí)施例還提供一種感知加權(quán)濾波器。本發(fā)明實(shí)施例的實(shí)現(xiàn)能夠在無(wú)需增加額外的編碼比特率及減少計(jì)算復(fù)雜度的同時(shí),較好地模擬輸入寬帶語(yǔ)音或音頻信號(hào)頻譜的共振峰結(jié)構(gòu),充分利用人耳聽(tīng)覺(jué)的掩蔽效應(yīng),達(dá)到提高編碼效率、增強(qiáng)主觀聽(tīng)覺(jué)效果的目的。文檔編號(hào)G10L19/04GK101320565SQ200710074930公開(kāi)日2008年12月10日申請(qǐng)日期2007年6月8日優(yōu)先權(quán)日2007年6月8日發(fā)明者偉張,勇張,楊玉紅,王庭紅,胡瑞敏,馬付偉申請(qǐng)人:華為技術(shù)有限公司;武漢大學(xué)