发明名称 有背景杂讯存在时增强语音之方法及装置
摘要 本发明提供一种用于语音信号之杂讯抑制的方法,该方法包含下列步骤:对于频域表示法可以分割成多个频段(bin)的语音信号,对于该频段中至少某些频段,决定一比例调整增益(Scaling gain)数值;以及计算平整化的比例调整增益数值,包含对于该等频段的至少某些频段结合该比例调整增益中现在决定的数值及平整化比例调整增益中先前决定的数值。在本发明另提供一方法,分割多个频段,将多个频段分为第一相邻的频段,及第二组相邻的频段,其间包含边界频率,在杂讯抑制技术上该边界频率使用不同的技术;以及改变边界频率的值,其为语音信号之频谱内容的函数。
申请公布号 TWI279776 申请公布日期 2007.04.21
申请号 TW093140706 申请日期 2004.12.27
申请人 诺基亚股份有限公司 发明人 米兰詹利尼克
分类号 G10L21/02(2006.01) 主分类号 G10L21/02(2006.01)
代理机构 代理人 杜汉淮 台北市中山区吉林路24号9楼之6
主权项 1.一种语音信号之杂讯的抑制方法,包括: -实行频率分析以产生含有多个频段(bin)之语音信 号之频谱域显示; -集合该等频段成为若干频带, 其特征在于当有声音(voiced)之语音活动以语音信 号方式被侦测到时,依据每频段(per-frequency-bin),对 该等频带之第一组实行杂讯抑制,及依据每频带( per-frequency-band),对该等频带之第二组实行杂讯抑 制。 2.如申请专利范围第1项之方法,其中该第一组频带 是依据发声之频带之数目来决定。 3.如申请专利范围第1项之方法,其中该第一组频带 之决定系与声音截止频率有关,语音信号低于该截 止频率被考虑为有声音的。 4.如申请专利范围第3项之方法,其中该第一组频带 包括具有不超出截止频率之上部频率之语音信号 之所有频率带。 5.如申请专利范围第1项之方法,其中该第一组频带 是预定之固定数目。 6.如申请专利范围第1项之方法,若有声音之语音信 号之频带不存在,则对所有频带之杂讯抑制之实行 是以每频带为基础。 7.如申请专利范围第1项之方法,其中该语音信号包 括包含若干样本之语音讯框及该申请专利范围第1 项之方法是用于抑制该语音框内之杂讯。 8.如申请专利范围第7项之方法,包括实行申请专利 范围第1项之频率分析,此系使用相对第1语音讯框 样本偏移m样本之分析视窗。 9.如申请专利范围第7项之方法,包括使用相对第1 语音讯框样本偏移m样本之第1分析视窗来实行第1 频率分析,及使用相对第1语音讯框样本偏移p样本 之第2分析视窗来实行第2频率分析。 10.如申请专利范围第9项之方法,其中m=24及p=128。 11.如申请专利范围第9项之方法,其中该第2分析视 窗包括一前置(look-ahead)部分,其之范围是由该语音 讯框至该语音信号之随后语音讯框。 12.如申请专利范围第1项之方法,包括藉使用对频 段及/或频带之比例调整增益(scaling gain)来实行杂 讯抑制。 13.如申请专利范围第1项之方法,其中当杂讯抑制 之实行是以每频段为基础时,该方法进一步包括决 定用于频段之频段指定比例调整增益。 14.如申请专利范围第1项之方法,其中当杂讯抑制 之实行是以每频带为基础时,该方法进一步包括决 定用于频带之频带指定比例调整增益。 15.如申请专利范围第6项之方法,包括藉使用对所 有频带之固定比例调整增益来实行杂讯抑制。 16.如申请专利范围第13项之方法,包括基于为该频 段所定之信号杂讯比(SNR),决定频段之频段指定比 例调整增益値。 17.如申请专利范围第14项之方法,包括基于为该频 带所定之信号杂讯比(SNR),决定频带之频带指定比 例调整增益値。 18.如申请专利范围第16项之方法,包括实行申请专 利范围第16项之步骤于该第1及第2频率分析。 19.如申请专利范围第17项之方法,包括实行申请专 利范围第17项之步骤于该第1及第2频率分析。 20.如申请专利范围第12,13或14项之任一方法,其中 该比例调整增益是平整化比例调整增益。 21.如申请专利范围第12,13或14项之任一方法,包括 使用一具有与特定频段或特定频带之比例调整增 益成反比关系之平整化参数値,以计算应用于特定 频段或特定频带之平整化比例调整增益。 22.如申请专利范围第12,13或14项之任一方法,包括 使用一使得平整化对于较小之比例调整增益値是 较强之平整化参数値,以计算应用于特定频段或特 定频带之平整化比例调整增益。 23.如申请专利范围第13或14项之任一方法,其中决 定该比例调整增益値之次数是各语音讯框发生n次 ,其中n大于1。 24.如申请专利范围第23项之方法,其中n=2。 25.如申请专利范围第13或14项之任一方法,其中决 定该比例调整增益之次数是各语音讯框发生n次, 其中n大于1,且其中该有声音之截止频率至少部分 是先前语音讯框内之语音信号之函数。 26.如申请专利范围第13之方法,其中以每频段为基 础之杂讯抑制是实行于对应17频带之最大74频段。 27.如申请专利范围第13之方法,其中以每频段为基 础之杂讯抑制是实行于对应3700Hz频率之最大频段 数。 28.如申请专利范围第16项之方法,其中对于第1个SNR 値,该比例调整增益是设定为最小値,对于大于该 第1个SNR値之第2个SNR値,该比例调整增益是设定为 单位元。 29.如申请专利范围第28项之方法,其中该第1个SNR値 大约等于1dB,及其中该第2个SNR値大约等于45dB。 30.如申请专利范围第20项之方法,进一步包括不包 含活动语音之该语音信号之区段之侦测。 31.如申请专利范围第30项之方法,进一步包括重新 设定该平整化比例调整增益为最小値,以回应侦测 不包含活动语音之语音信号区段。 32.如申请专利范围第7项之方法,其中当多数频带 之最大杂讯能量是小于一个阈値时,杂讯抑制不实 行。 33.如申请专利范围第7项之方法,进一步包括,为反 应短暂时滞语音讯框之发生,对于最初之x频带,以 使用以每频带为基础所决定之比例调整增益来实 行杂讯抑制,以及对于剩余之频带,以使用比例调 整增益之单一値来实行杂讯抑制。 34.如申请专利范围第33项之方法,其中该最初之x频 带对应之频率可高达1700Hz。 35.如申请专利范围第20项之方法,其中对于窄频语 音信号,该方法进一步包括,对于最初对应高达3700 Hz之x频带,以使用以每频带为基础所决定之平整化 比例调整增益来实行杂讯抑制,以使用对应3700Hz之 频段之比例调整增益値于介于3700Hz与4000Hz之频段 来实行杂讯抑制,以及将该语音信号之频谱之剩余 频带归零。 36.如申请专利范围第35项之方法,其中窄频语音信 号是向上取样至12800Hz之语音信号。 37.如申请专利范围第3项之方法,进一步包括使用 计算之声音测量以决定有声音之截止频率。 38.如申请专利范围第37项之方法,进一步包括决定 若干具有不超过有声音之截止频率之上部频率之 临界频带,其中界限之设定使得以每频段为基础之 杂讯抑制是实行于最少x频带及最多y频带。 39.如申请专利范围第38项之方法,其中x=3及y=17。 40.如申请专利范围第37项之方法,其中该有声音之 截止频率之界限是设定等于或大于325Hz及等于或 小于3700Hz。 41.一种抑制语音信号之杂讯之装置,该装置系用以 : -实行频率分析以产生包括多个频段(bin)之语音信 号之频谱域显示; -集合该等频段成为若干频带; 其特征在于该装置用以侦测有声音之语音活动及 当该有声音之语音活动以语音信号方式被侦测到 时,对于该等频带之第一组,实行依每频段为基础 之杂讯抑制,及对于该等频带之第二组,实行依每 频带为基础之杂讯抑制。 42.如申请专利范围第41项之装置,其中该第一组频 带是依据发声之频带之数目来决定。 43.如申请专利范围第41项之装置,其中该装置是用 以决定与声音截止频率有关之该第一组频带,其中 语音信号低于该截止频率被考虑为有声音的。 44.如申请专利范围第43项之装置,其中该第一组频 带包括具有不超出截止频率之上部频率之语音信 号之所有频率带。 45.如申请专利范围第41项之装置,其中该第一组频 带是预定之固定数目。 46.如申请专利范围第41项之装置,其中若有声音之 语音信号之频带不存在,该装置对所有频带之杂讯 抑制之实行是以每频带为基础。 47.如申请专利范围第41项之装置,其中该语音信号 包括含有若干样本之语音讯框及该装置用于抑制 语音框内之杂讯。 48.如申请专利范围第47项之装置,其中该装置用于 实行该频率分析且使用相对第1语音讯框样本偏移 m样本之分析视窗。 49.如申请专利范围第47项之装置,其中该装置使用 相对第1语音讯框样本偏移m样本之第1分析视窗来 实行第1频率分析,及使用相对第1语音讯框样本偏 移p样本之第2分析视窗来实行第2频率分析。 50.如申请专利范围第49项之装置,其中m=24及p=128。 51.如申请专利范围第49项之装置,其中该第2分析视 窗包括一前置(look-ahead)部分,其范围是由该语音讯 框至该语音信号之随后语音讯框。 52.如申请专利范围第41项之装置,其中该装置藉使 用对频段及/或频带之比例调整增益(scaling gain)来 实行杂讯抑制。 53.如申请专利范围第41项之装置,其中当杂讯抑制 之实行是以每频段为基础时,该装置进一步用于决 定频段之频段指定比例调整增益。 54.如申请专利范围第41项之装置,其中当杂讯抑制 之实行是以每频带为基础时,该装置进一步用于决 定频带之频带指定比例调整增益。 55.如申请专利范围第46项之装置,其中该装置藉使 用对所有频带之固定比例调整增益来实行杂讯抑 制。 56.如申请专利范围第53项之装置,其中该装置基于 为该频段所定之信号杂讯比(SNR),决定频段之频段 指定比例调整增益値。 57.如申请专利范围第54项之装置,其中该装置基于 为该频带所定之信号杂讯比(SNR),决定频带之频带 指定比例调整增益値。 58.如申请专利范围第56项之装置,其中该装置用以 实行申请专利范围第56项之步骤于该第1及第2频率 分析。 59.如申请专利范围第57项之装置,其中该装置用以 实行申请专利范围第57项之步骤于该第1及第2频率 分析。 60.如申请专利范围第52,53或54项之任一装置,其中 该比例调整增益是平整化比例调整增益。 61.如申请专利范围第52,53或54项之任一装置,其中 该装置使用一具有与特定频段或特定频带之比例 调整增益成反比关系之平整化参数値,以计算应用 于特定频段或特定频带之平整化比例调整增益。 62.如申请专利范围第52,53或54项之任一装置,其中 该装置使用一使得平整化对于较小之比例调整增 益値是较强之平整化参数値,以计算应用于特定频 段或特定频带之平整化比例调整增益。 63.如申请专利范围第53或54项之任一装置,其中决 定该比例调整增益値之次数是各语音讯框发生n次 ,其中n大于1。 64.如申请专利范围第63项之方法,其中n=2。 65.如申请专利范围第53或54项之任一装置,其中该 装置用以决定该比例调整增益値之次数是各语音 讯框发生n次,其中n大于1,且其中该有声音之截止 频率至少部分是先前语音讯框内之语音信号之函 数。 66.如申请专利范围第53之装置,其中该装置以每频 段为基础之杂讯抑制是实行于对应17频带之最大74 频段。 67.如申请专利范围第53之装置,其中该装置以每频 段为基础之杂讯抑制是实行于对应3700Hz频率之最 大频段数。 68.如申请专利范围第56项之装置,其中对于第1个SNR 値,该比例调整增益是设定为最小値,对于大于该 第1个SNR値之第2个SNR値,该比例调整增益是设定为 单位元。 69.如申请专利范围第68项之装置,其中该第1个SNR値 大约等于1dB,及其中该第2个SNR値大约等于45dB。 70.如申请专利范围第60项之装置,其中该装置用以 侦测不包含活动语音之该语音信号之区段。 71.如申请专利范围第70项之装置,其中该装置用以 重新设定该平整化比例调整增益为最小値,以回应 侦测不包含活动语音之语音信号区段。 72.如申请专利范围第47项之装置,其中当多数频带 之最大杂讯能量是小于一个阈値时,杂讯抑制不实 行。 73.如申请专利范围第47项之装置,其中为反应短暂 时滞语音讯框之发生,对于最初之x频带,该装置以 使用基于每频带所决定之比例调整增益来实行杂 讯抑制,以及对于剩余之频带,该装置以使用比例 调整增益之单一値来实行杂讯抑制。 74.如申请专利范围第73项之装置,其中该最初之x频 带对应之频率高达1700Hz。 75.如申请专利范围第60项之装置,其中对于窄频语 音信号,该装置,对于最初对应高达3700Hz之x频带,以 使用以每频带为基础所决定之平整化比例调整增 益来实行杂讯抑制,以使用对应3700Hz之频段之比例 调整增益値于介于3700Hz与4000Hz之频段来实行杂讯 抑制,以及将该语音信号之频谱之剩余频带归零。 76.如申请专利范围第75项之装置,其中窄频语音信 号是向上取样至12800Hz之语音信号。 77.如申请专利范围第43项之装置,其中该装置以使 用计算之声音测量来决定有声音之截止频率。 78.如申请专利范围第77项之装置,其中该装置用以 决定若干具有不超过有声音之截止频率之上部频 率之临界频带,其中界限之设定使得基于频段之杂 讯抑制是实行于最少x频带及最多y频带。 79.如申请专利范围第78项之装置,其中x=3及y=17。 80.如申请专利范围第77项之装置,其中该有声音之 截止频率之界限是设定等于或大于325Hz及等于或 小于3700Hz。 81.一种包括杂讯抑制装置之语音编码器,该装置系 用以: -实行频率分析以产生含有多个频段(bin)之语音信 号之频谱域显示; -集合该等频段成为若干频带, 其特征在于该装置用以侦测有声音之语音活动及 当该有声音之语音活动以语音信号方式被侦测到 时,对于该等频带之第一组,实行依每频段为基础 之杂讯抑制,及对于该等频带之第二组,实行依每 频带为基础之杂讯抑制。 82.一种包括杂讯抑制装置之自动化语音辨识系统, 该装置用以: -实行频率分析以产生包括多个频段(bin)之语音信 号之频谱域显示; -集合该等频段成为若干频带, 其特征在于该装置用以侦测有声音之语音活动及 当该有声音之语音活动以语音信号方式被侦测到 时,对于该等频带之第一组,实行依每频段为基础 之杂讯抑制,及对于该等频带之第二组,实行依每 频带为基础之杂讯抑制。 83.一种包括杂讯抑制装置之行动电话,该装置用以 : -实行频率分析以产生包括多个频段(bin)之语音信 号之频谱域显示; -集合该等频段成为若干频带, 其特征在于该装置用以侦测有声音之语音活动及 当该有声音之语音活动以语音信号方式被侦测到 时,对于该等频带之第一组,实行依每频段为基础 之杂讯抑制,及对于该等频带之第二组,实行依每 频带为基础之杂讯抑制。 图式简单说明: 图1示本发明中包含杂讯减低之语音通讯系统的示 意方块图; 图2示在频谱分析中之视窗的说明; 图3示杂讯减低演算法之说明实施例的概略图;以 及 图4为特定分类之杂讯减低说明实施例的示意方块 图,其中该减低的演算法系依据将处理之语音讯框 的特性。
地址 芬兰