发明名称 一种低比特率语音编码器
摘要 本发明公开了一种语音编码器,特别涉及一种基于局部余弦变换的低比特率语音编码器,适用于要求低比特率语音编码的通信系统中。它应用了一个可以灵活调整的整形函数,利用这个整形函数对Donoho采用的钟函数进行整形,得到一个能够提高谱能量聚集性的新的钟函数;对局部余弦变换系数的编码,采用分维量化方法,对于每一维矢量,均采用LGB方法设计码书;编码中码书的搜索采用树形结构搜索方法,实现了一种在局部余弦变换域内具有优良的低比特语音编码器。经客观参数评价和非正式听力测试表明,该编码器比LPC-10e编码器具有更好的自然度和可理解性。
申请公布号 CN1327408C 申请公布日期 2007.07.18
申请号 CN200410103219.0 申请日期 2004.12.31
申请人 苏州大学 发明人 董恩清
分类号 G10L19/00(2006.01) 主分类号 G10L19/00(2006.01)
代理机构 苏州创元专利商标事务所有限公司 代理人 陶海锋
主权项 1.一种低比特率语音编码器,它基于局部余弦变换,由高通滤波预处理器对输入编码器的原始语音信号进行处理,然后进行局部余弦变换处理,其特征在于:所述的局部余弦变换中的钟函数b<sub>new</sub>(n)符合如下条件:<maths num="001"><![CDATA[ <math> <mrow> <msub> <mi>b</mi> <mi>new</mi> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mi>sin</mi> <mo>[</mo> <mi>&pi;x</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>/</mo> <mn>2</mn> <mo>]</mo> <mo>&CenterDot;</mo> <msub> <mi>&xi;</mi> <mrow> <mo>[</mo> <mi>n</mi> <mo>]</mo> </mrow> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </mtd> <mtd> <mn>1</mn> <mo>&le;</mo> <mi>n</mi> <mo>&le;</mo> <mi>m</mi> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mi>m</mi> <mo>+</mo> <mn>1</mn> <mo>&le;</mo> <mi>n</mi> <mo>&le;</mo> <mn>3</mn> <mi>m</mi> </mtd> </mtr> <mtr> <mtd> <msup> <mrow> <mo>{</mo> <mn>1</mn> <mo>-</mo> <mo>[</mo> <mi>sin</mi> <mrow> <mo>(</mo> <mi>&pi;x</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>3</mn> <mi>m</mi> <mo>)</mo> </mrow> <mo>/</mo> <mn>2</mn> <mo>)</mo> </mrow> <mo>&CenterDot;</mo> <msub> <mi>&xi;</mi> <mrow> <mo>[</mo> <mi>n</mi> <mo>]</mo> </mrow> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>3</mn> <mi>m</mi> <mo>)</mo> </mrow> <mo>]</mo> <mo>}</mo> </mrow> <mrow> <mn>1</mn> <mo>/</mo> <mn>2</mn> </mrow> </msup> </mtd> <mtd> <mn>3</mn> <mi>m</mi> <mo>+</mo> <mn>1</mn> <mo>&le;</mo> <mi>n</mi> <mo>&le;</mo> <mn>4</mn> <mi>m</mi> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow> </math> ]]></maths>其中m=80,ξ<sub>[n]</sub>(n)为采用的整形函数,符合条件<maths num="002"><![CDATA[ <math> <mrow> <msub> <mi>&xi;</mi> <mrow> <mo>[</mo> <mi>n</mi> <mo>+</mo> <mn>1</mn> <mo>]</mo> </mrow> </msub> <mover> <mo>=</mo> <mi>def</mi> </mover> <msub> <mi>&xi;</mi> <mrow> <mo>[</mo> <mi>n</mi> <mo>]</mo> </mrow> </msub> <mo>[</mo> <mi>sin</mi> <mrow> <mo>(</mo> <mi>&pi;t</mi> <mo>/</mo> <mn>2</mn> <mo>)</mo> </mrow> <mo>]</mo> </mrow> </math> ]]></maths>和<maths num="003"><![CDATA[ <math> <mrow> <msub> <mi>&xi;</mi> <mrow> <mo>[</mo> <mn>0</mn> <mo>]</mo> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mover> <mo>=</mo> <mi>def</mi> </mover> <mi>&xi;</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </math> ]]></maths>其中:<maths num="004"><![CDATA[ <math> <mrow> <mi>&xi;</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mi>t</mi> <mo>&le;</mo> <mo>-</mo> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mi>sin</mi> <mo>&lsqb;</mo> <mi>&pi;</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>/</mo> <mn>4</mn> <mo>&rsqb;</mo> </mtd> <mtd> <mo>-</mo> <mn>1</mn> <mo>&lt;</mo> <mi>t</mi> <mo>&lt;</mo> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mi>t</mi> <mo>&GreaterEqual;</mo> <mn>1</mn> </mtd> </mtr> </mtable> </mfenced> </mrow> </math> ]]></maths>下标n为该整形函数的迭代次数;钟函数在1~4m的宽度上取值;对获得的局部余弦变换系统进行分维矢量量化处理,每一帧经过局部余弦变换后的局部余弦变换系数,先按从低频到高频分别40、40、40、20进行分维矢量维数的划分,再利用四个不同的分维矢量量化码书进行分维矢量量化,从第一维矢量到第四维矢量分配的比特位分别依次为12、12、8、8比特,每一帧的增益量化采用8比特标量量化,按照从第一分维矢量比特位到第四分维矢量比特位、增益量化比特位的顺序输出比特位为48比特,用6个字节表示每一帧输出的比特流。
地址 215006江苏省苏州市沧浪区十梓街1号