发明名称 固定码本搜索装置
摘要 公开了固定码本搜索装置,即使声源脉冲所通过的滤波器具有无法用下三角矩阵表示的特性,也将运算量的增加抑制得较小,从而实现次优的固定码本搜索。在该固定码本搜索装置中,包括:卷积运算单元,向在负的时间具有非零值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有非零值的第二脉冲响应矢量;矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵;以及搜索单元,使利用了所述特普利茨型的卷积矩阵的数式最大,以进行码本搜索,所述第二脉冲响应矢量的负的时间分量的时间长度比非负的时间分量的时间长度短。
申请公布号 CN102194462B 申请公布日期 2013.02.27
申请号 CN201110187734.1 申请日期 2007.03.08
申请人 松下电器产业株式会社 发明人 江原宏幸;吉田幸司
分类号 G10L19/107(2013.01)I 主分类号 G10L19/107(2013.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 邸万奎
主权项 1.一种固定码本搜索装置,包括:卷积运算单元,向在负的时间具有非零值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有非零值的第二脉冲响应矢量;以及矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵H′,所述第二脉冲响应矢量的负的时间分量的时间长度比非负的时间分量的时间长度短,搜索使利用了所述特普利茨型的卷积矩阵H′的以下式(1)为最大的索引k,<maths num="0001"><![CDATA[<math><mrow><mfrac><msubsup><mi>C</mi><mi>k</mi><mn>2</mn></msubsup><msubsup><mi>E</mi><mi>k</mi><mn>2</mn></msubsup></mfrac><mo>=</mo><mfrac><msup><mrow><mo>(</mo><msubsup><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></msubsup><msup><mi>d</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><msub><mi>c</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mrow><msubsup><mi>c</mi><mi>k</mi><mi>t</mi></msubsup><msup><mi>&Phi;</mi><mo>&prime;</mo></msup><msub><mi>c</mi><mi>k</mi></msub></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中,上标t表示其为转置矩阵,C<sub>k</sub>为听觉加权合成信号s和对象矢量x之间的内积,E<sub>k</sub>为听觉加权合成信号s的能量,c<sub>k</sub>为以索引k指定的脉冲声源矢量,c<sub>k</sub>(n)为脉冲声源矢量c<sub>k</sub>的第n个元素,n=0,...,N-1,<maths num="0002"><![CDATA[<math><mrow><msup><mi>d</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><munderover><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mo>-</mo><mi>i</mi></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn><mo>-</mo><mi>i</mi></mrow></munderover><mi>x</mi><mrow><mo>(</mo><mi>n</mi><mo>+</mo><mi>i</mi><mo>)</mo></mrow><msup><mi>h</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>,</mo></mtd><mtd><mi>where</mi></mtd><mtd><mi>i</mi><mo>=</mo><mn>0</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>m</mi><mo>-</mo><mn>1</mn></mtd></mtr><mtr><mtd><munderover><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mo>-</mo><mi>m</mi></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn><mo>-</mo><mi>i</mi></mrow></munderover><mrow><mi>x</mi><mrow><mo>(</mo><mi>n</mi><mo>+</mo><mi>i</mi><mo>)</mo></mrow><msup><mi>h</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>,</mo></mrow></mtd><mtd><mi>where</mi></mtd><mtd><mi>i</mi><mo>=</mo><mi>m</mi><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>N</mi><mo>-</mo><mn>1</mn></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>x(n)为对象矢量x的第n个元素,n=0,...,N-1,<img file="FDA00001934927400013.GIF" wi="211" he="37" /><img file="FDA00001934927400014.GIF" wi="1775" he="333" />h<sup>(0)</sup>(n)为在负的时间具有非零值的第二脉冲响应矢量的第n个元素,n=-m,...,0,...,N-1,N为表示声源信号的编码的处理单位时间的帧或者子帧的长度的自然数,m为1至N-1的整数。
地址 日本大阪府