一种低比特率语音编码器,申请号CN200410103219.0-传众专利搜索

发明名称	一种低比特率语音编码器
摘要	本发明公开了一种语音编码器，特别涉及一种基于局部余弦变换的低比特率语音编码器，适用于要求低比特率语音编码的通信系统中。它应用了一个可以灵活调整的整形函数，利用这个整形函数对Donoho采用的钟函数进行整形，得到一个能够提高谱能量聚集性的新的钟函数；对局部余弦变换系数的编码，采用分维量化方法，对于每一维矢量，均采用LGB方法设计码书；编码中码书的搜索采用树形结构搜索方法，实现了一种在局部余弦变换域内具有优良的低比特语音编码器。经客观参数评价和非正式听力测试表明，该编码器比LPC-10e编码器具有更好的自然度和可理解性。
申请公布号	CN1327408C	申请公布日期	2007.07.18
申请号	CN200410103219.0	申请日期	2004.12.31
申请人	苏州大学	发明人	董恩清
分类号	G10L19/00(2006.01)	主分类号	G10L19/00(2006.01)
代理机构	苏州创元专利商标事务所有限公司	代理人	陶海锋
主权项	1.一种低比特率语音编码器，它基于局部余弦变换，由高通滤波预处理器对输入编码器的原始语音信号进行处理，然后进行局部余弦变换处理，其特征在于：所述的局部余弦变换中的钟函数b<sub>new</sub>(n)符合如下条件：<maths num="001"><![CDATA[ <math> <mrow> <msub> <mi>b</mi> <mi>new</mi> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mi>sin</mi> <mo>[</mo> <mi>πx</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>/</mo> <mn>2</mn> <mo>]</mo> <mo>·</mo> <msub> <mi>ξ</mi> <mrow> <mo>[</mo> <mi>n</mi> <mo>]</mo> </mrow> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </mtd> <mtd> <mn>1</mn> <mo>≤</mo> <mi>n</mi> <mo>≤</mo> <mi>m</mi> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mi>m</mi> <mo>+</mo> <mn>1</mn> <mo>≤</mo> <mi>n</mi> <mo>≤</mo> <mn>3</mn> <mi>m</mi> </mtd> </mtr> <mtr> <mtd> <msup> <mrow> <mo>{</mo> <mn>1</mn> <mo>-</mo> <mo>[</mo> <mi>sin</mi> <mrow> <mo>(</mo> <mi>πx</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>3</mn> <mi>m</mi> <mo>)</mo> </mrow> <mo>/</mo> <mn>2</mn> <mo>)</mo> </mrow> <mo>·</mo> <msub> <mi>ξ</mi> <mrow> <mo>[</mo> <mi>n</mi> <mo>]</mo> </mrow> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>3</mn> <mi>m</mi> <mo>)</mo> </mrow> <mo>]</mo> <mo>}</mo> </mrow> <mrow> <mn>1</mn> <mo>/</mo> <mn>2</mn> </mrow> </msup> </mtd> <mtd> <mn>3</mn> <mi>m</mi> <mo>+</mo> <mn>1</mn> <mo>≤</mo> <mi>n</mi> <mo>≤</mo> <mn>4</mn> <mi>m</mi> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> </mrow> </math> ]]></maths>其中m＝80，ξ<sub>[n]</sub>(n)为采用的整形函数，符合条件<maths num="002"><![CDATA[ <math> <mrow> <msub> <mi>ξ</mi> <mrow> <mo>[</mo> <mi>n</mi> <mo>+</mo> <mn>1</mn> <mo>]</mo> </mrow> </msub> <mover> <mo>=</mo> <mi>def</mi> </mover> <msub> <mi>ξ</mi> <mrow> <mo>[</mo> <mi>n</mi> <mo>]</mo> </mrow> </msub> <mo>[</mo> <mi>sin</mi> <mrow> <mo>(</mo> <mi>πt</mi> <mo>/</mo> <mn>2</mn> <mo>)</mo> </mrow> <mo>]</mo> </mrow> </math> ]]></maths>和<maths num="003"><![CDATA[ <math> <mrow> <msub> <mi>ξ</mi> <mrow> <mo>[</mo> <mn>0</mn> <mo>]</mo> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mover> <mo>=</mo> <mi>def</mi> </mover> <mi>ξ</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </math> ]]></maths>其中：<maths num="004"><![CDATA[ <math> <mrow> <mi>ξ</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mi>t</mi> <mo>≤</mo> <mo>-</mo> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mi>sin</mi> <mo>[</mo> <mi>π</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>/</mo> <mn>4</mn> <mo>]</mo> </mtd> <mtd> <mo>-</mo> <mn>1</mn> <mo><</mo> <mi>t</mi> <mo><</mo> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mi>t</mi> <mo>&GreaterEqual;</mo> <mn>1</mn> </mtd> </mtr> </mtable> </mfenced> </mrow> </math> ]]></maths>下标n为该整形函数的迭代次数；钟函数在1～4m的宽度上取值；对获得的局部余弦变换系统进行分维矢量量化处理，每一帧经过局部余弦变换后的局部余弦变换系数，先按从低频到高频分别40、40、40、20进行分维矢量维数的划分，再利用四个不同的分维矢量量化码书进行分维矢量量化，从第一维矢量到第四维矢量分配的比特位分别依次为12、12、8、8比特，每一帧的增益量化采用8比特标量量化，按照从第一分维矢量比特位到第四分维矢量比特位、增益量化比特位的顺序输出比特位为48比特，用6个字节表示每一帧输出的比特流。
地址	215006江苏省苏州市沧浪区十梓街1号