发明名称 固定码本搜索装置以及固定码本搜索方法
摘要 公开了固定码本搜索装置,即使声源脉冲所通过的滤波器具有无法用下三角矩阵表示的特性,也将运算量的增加抑制得较小,从而实现次优的固定码本搜索。该装置包括:卷积运算单元,向在负的时间具有值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有值的第二脉冲响应矢量;以及矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵。
申请公布号 CN102201239B 申请公布日期 2014.01.01
申请号 CN201110188743.2 申请日期 2007.03.08
申请人 松下电器产业株式会社 发明人 江原宏幸;吉田幸司
分类号 G10L19/107(2013.01)I 主分类号 G10L19/107(2013.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 邸万奎
主权项 1.一种固定码本搜索装置,包括:卷积运算单元,向在负的时间具有值的脉冲响应矢量上卷积听觉加权合成滤波器的脉冲响应,以生成在负的时间具有值的第二脉冲响应矢量;以及矩阵生成单元,利用由所述卷积运算单元生成的第二脉冲响应矢量生成特普利茨型的卷积矩阵H′,所述第二脉冲响应矢量的、负的时间的构成要素的能量比非负的时间的构成要素的能量小,搜索使利用了所述特普利茨型的卷积矩阵H′的以下式(1)为最大的索引k,<maths num="0001"><![CDATA[<math><mrow><mfrac><msubsup><mi>C</mi><mi>k</mi><mn>2</mn></msubsup><msubsup><mi>E</mi><mi>k</mi><mn>2</mn></msubsup></mfrac><mo>=</mo><mfrac><msup><mrow><mo>(</mo><msubsup><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></msubsup><msup><mi>d</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><msub><mi>c</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mrow><msubsup><mi>c</mi><mi>k</mi><mi>t</mi></msubsup><msup><mi>&Phi;</mi><mo>&prime;</mo></msup><msub><mi>c</mi><mi>k</mi></msub></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中,上标t表示其为转置矩阵,C<sub>k</sub>为使以索引k指定的脉冲声源矢量c<sub>k</sub>通过卷积滤波器F和听觉加权合成滤波器H而得到的听觉加权合成信号s与目标矢量x的内积,E<sub>k</sub>为所述听觉加权合成信号s的能量,c<sub>k</sub>为以索引k指定的脉冲声源矢量,c<sub>k</sub>(n)为脉冲声源矢量c<sub>k</sub>的第n元素,n=0,...,N-1,<maths num="0002"><![CDATA[<math><mrow><msup><mi>d</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><munderover><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mo>-</mo><mi>i</mi></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn><mo>-</mo><mi>i</mi></mrow></munderover><mi>x</mi><mrow><mo>(</mo><mi>n</mi><mo>+</mo><mi>i</mi><mo>)</mo></mrow><msup><mi>h</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>,</mo></mtd><mtd><mi>where</mi></mtd><mtd><mi>i</mi><mo>=</mo><mn>0</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>m</mi><mo>-</mo><mn>1</mn></mtd></mtr><mtr><mtd><munderover><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mo>-</mo><mi>m</mi></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn><mo>-</mo><mi>i</mi></mrow></munderover><mi>x</mi><mrow><mo>(</mo><mi>n</mi><mo>+</mo><mi>i</mi><mo>)</mo></mrow><msup><mi>h</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msup><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mtext>,</mtext></mtd><mtd><mi>where</mi></mtd><mtd><mi>i</mi><mo>=</mo><mi>m</mi><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>N</mi><mo>-</mo><mn>1</mn></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>x(n)为目标矢量x的第n元素,n=0,...,N-1,<img file="FDA00003375756300013.GIF" wi="219" he="45" /><img file="FDA00003375756300014.GIF" wi="1783" he="341" />h<sup>(0)</sup>(n<sub>x</sub>)为在负的时间具有值的第二脉冲响应矢量的第n<sub>x</sub>元素,n<sub>x</sub>=-m,...,0,...,N-1,N为表示声源信号的编码的处理单位时间的帧或者子帧的长度的自然数,m表示非因果的元素的长度。
地址 日本大阪府