发明名称 频率域音调估算器之计算效率的强化
摘要 藉由以下步骤来估算一语音讯号音调频率;判定一包括多个具有个别线振幅及频率之频谱线的语音讯号讯框线频谱;选择一预定数目之具有最高振幅的频谱线,该数目少于该等频谱线之总数;在一音调频率范围上计算一初步效用函数来为每一音调频率提供该范围中之用于量测所选择的频谱线与该音调频率之相容性的一初步效用函数值;至少部分地回应于该初步效用函数来识别一预定数目之初步音调频率候选物,其中每一候选物为该初步效用函数之局部最大值;为每一候选物计算最终效用得分;并至少部分地回应于该等最终效用得分中之任一个来选择该等候选物中之任一个成为语音讯号之估算的音调频率。
申请公布号 TWI282972 申请公布日期 2007.06.21
申请号 TW093104139 申请日期 2004.02.19
申请人 万国商业机器公司 发明人 亚历山大 索利
分类号 G01L19/00(2006.01) 主分类号 G01L19/00(2006.01)
代理机构 代理人 陈长文 台北市松山区敦化北路201号7楼
主权项 1.一种用于估算一语音讯号之一音调频率之方法, 其包含: 判定一语音讯号之一讯框之一线频谱,该频谱包含 具有个别线振幅及线频率之复数个频谱线; 在该等频谱线中选择一预定数目之具有最高振幅 的该等频谱线,其中所选择的频谱线之数目少于该 等复数个频谱线之总数; 在一音调频率范围上计算一初步效用函数,藉此为 该范围中之每一音调频率提供一能量测该等所选 择的频谱线与该音调频率之一相容性的初步效用 函数値; 至少部分地回应于该初步效用函数以识别一预定 数目之初步音调频率候选物,其中每一初步音调频 率候选物为该初步效用函数之一局部最大値; 为该等初步音调频率候选物中之每一个计算一最 终效用得分;且 至少部分地回应于该等最终效用得分中之任一个, 选择该等复数个初步音调频率候选物中之任一个 作为该语音讯号之一估算的音调频率。 2.如申请专利范围第1项之方法,其中该计算一初步 效用函数步骤包含: 计算一关于该等所选择的频谱线中之每一个的影 响函数,其中该影响函数在该频谱线之频率与任何 音调频率之一比率中系呈周期性;且 计算该等影响函数之一叠加。 3.如申请专利范围第2项之方法,其中该计算一影响 函数步骤包含计算该比率之一函数,其在该比率之 整数値处具有最大値,且在该比率之整数値之间具 有最小値。 4.如申请专利范围第3项之方法,其中该计算一影响 函数步骤包含计算一分段线性函数c(f)之値,其在 一围绕f=0之第一间隔中具有一最大値,在一围绕f=1 /2之第二间隔中具有一最小値,及在该等第一间隔 与第二间隔之间的一过渡间隔中具有一呈分段线 性变化的値。 5.如申请专利范围第2项之方法,其中该等影响函数 为分段线性函数,且其中该计算一叠加之步骤包含 计算该等影响函数在其各断点处之値,使得藉由该 等断点之间的内插以判定该初步效用函数。 6.如申请专利范围第5项之方法,其中该计算该影响 函数步骤包含为来自该等所选择的频谱线中之第 一及第二频谱线接连地计算至少第一及第二影响 函数,且其中该计算一初步效用函数步骤包含: 计算一包括该第一影响函数之部分效用函数;及 藉由计算该第二影响函数在该初步效用函数之该 等断点处之该等値,并计算该初步效用函数在该第 二影响函数之该等断点处之该等値,将该第二影响 函数添加至该初步效用函数。 7.如申请专利范围第6项之方法,其中该判定一音调 频率候选物步骤包含择优地选择该初步效用函数 之一局部最大値,其频率靠近该语音讯号之一先前 讯框之一预先估算的音调频率。 8.如申请专利范围第1项之方法,其中该计算一最终 效用得分步骤包含: 计算一关于该等频谱线中之每一个的影响函数,其 中该影响函数在该频谱线之该频率与任何音调频 率之一比率中系呈周期性;及 计算该等影响函数之一和。 9.如申请专利范围第8项之方法,其中该计算一影响 函数步骤包含计算该比率之一函数,其在该比率之 整数値处具有最大値,且在该比率之整数値之间具 有最小値。 10.如申请专利范围第9项之方法,其中该计算该比 率之函数的步骤包含计算一分段线性函数c(f)之各 値,其在一围绕f=0之第一间隔中具有一最大値,在 一围绕f=1/2之第二间隔中具有一最小値,及在该等 第一间隔与第二间隔之间的一过渡间隔中具有一 呈分段线性变化的値。 11.如申请专利范围第1项之方法,其中该选择一音 调频率步骤包含择优地选择该等初步音调频率候 选物的其中一个,其具有一高于该等初步音调频率 候选物中之另一个的最终效用得分。 12.如申请专利范围第1项之方法,其中该选择一音 调频率步骤包含择优地来选择该等初步音调频率 候选物的其中一个,其具有一高于该等初步音调频 率候选物中另一个的频率。 13.如申请专利范围第1项之方法,其中该选择一音 调频率步骤包含择优地选择该等初步音调频率候 选物的其中一个,其频率靠近该语音讯号之一先前 讯框之一预先估算的音调频率。 14.如申请专利范围第1项之方法,其进一步包含藉 由将该所估算的音调频率之该最终效用得分与一 预定临限値进行比较以判定该语音讯号是有声还 是无声。 15.如申请专利范围第1项之方法,其进一步包含回 应于该估算的音调频率以对该语音讯号进行编码 。 16.一种用于估算一语音讯号之一音调频率的装置, 其包含: 用于判定一语音讯号之一讯框之一线频谱的构件, 该频谱包含具有个别线振幅及线频率之复数个频 谱线; 用于在该等频谱线中选择一预定数目之具有最高 振幅的该等频谱线的构件,其中所选择的频谱线之 数目系少于该等复数个频谱线之总数; 用于在一音调频率范围上计算一初步效用函数的 构件,藉此为该范围中之每一音调频率提供一能量 测该等所选择的频谱线与该音调频率之一相容性 的初步效用函数値; 用于至少部分地回应于该初步效用函数以识别一 预定数目之初步音调频率候选物的构件,其中每一 初步音调频率候选物为该初步效用函数之一局部 最大値; 用于为该等初步音调频率候选物中之每一个计算 一最终效用得分的构件;及 用于至少部分地回应于该等最终效用得分中之任 一个,选译该等复数个初步音调频率候选物中之任 一个可成为该语音讯号之一估算的音调频率的构 件。 17.如申请专利范围第16项之装置,其中可操作该用 于计算一初步效用函数之构件,以: 计算一关于该等所选择的频谱线中之每一个的影 响函数,其中该影响函数在该频谱线之该频率与任 何音调频率之一比率中系呈周期性;及 计算该等影响函数之一叠加。 18.如申请专利范围第17项之装置,其中可操作该用 于计算一影响函数之构件,以计算该比率之一函数 ,其在该比率之整数値处具有最大値,且在该比率 之整数値之间具有最小値。 19.如申请专利范围第18项之装置,其中可操作该用 于计算一影响函数之构件,以计算一分段线性函数 c(f)之各値,其在一围绕f=0之第一间隔中具有一最 大値,在一围绕f=1/2之第二间隔中具有一最小値,及 在该等第一间隔与第二间隔之间的一过渡间隔中 具有一呈分段线性变化的値。 20.如申请专利范围第17项之装置,其中该等影响函 数为分段线性函数,且其中可操作该用于计算一叠 加之构件,以计算该等影响函数在其各断点处之値 ,使得藉由该等断点之间的内插以判定该初步效用 函数。 21.如申请专利范围第20项之装置,其中可操作该用 于计算该影响函数之构件,以为来自该等所选择的 频谱线中之第一及第二频谱线接连地计算至少第 一及第二影响函数,且其中可操作该用于计算一初 步效用函数之构件,以: 计算一包括该第一影响函数之部分效用函数;及 藉由计算该第二影响函数在该初步效用函数之该 等断点处之该等値,并计算该初步效用函数在该第 二影响函数之该等断点处之该等値,将该第二影响 函数添加至该初步效用函数。 22.如申请专利范围第21项之装置,其中可操作该用 于判定一音调频率候选物之构件,以择优地选择该 初步效用函数之一局部最大値,其频率靠近该语音 讯号之一先前讯框之一预先估算的音调频率。 23.如申请专利范围第16项之装置,其中可操作该用 于计算一最终效用得分之构件,以: 计算一关于该等频谱线中之每一个之影响函数,其 中该影响函数在该频谱线之频率与任何音调频率 之一比率中系呈周期性;及 计算该等影响函数之一和。 24.如申请专利范围第23项之装置,其中可操作该用 于计算一影响函数之构件,以计算该比率之一函数 ,其在该比率之整数値处具有最大値,且在该比率 之整数値之间具有最小値。 25.如申请专利范围第24项之装置,其中可操作该用 于计算该比率之函数的构件,以计算一分段线性函 数c(f)之各値,其在一围绕f=0之第一间隔中具有一 最大値,在一围绕f=1/2之第二间隔中具有一最小値, 及在该等第一间隔与第二间隔之间的一过渡间隔 中具有一呈分段线性变化的値。 26.如申请专利范围第16项之装置,其中可操作该用 于选择一音调频率之构件,以择优地选择该等初步 音调频率候选物的其中一个,其具有一高于该等初 步音调频率候选物中另一个之最终效用得分。 27.如申请专利范围第16项之装置,其中可操作该用 于选择一音调频率之构件,以择优地选择该等初步 音调频率候选物的其中一个,其具有一高于该等初 步音调频率候选物中另一个之频率。 28.如申请专利范围第16项之装置,其中可操作该用 于选择一音调频率之构件,以择优地选择该等初步 音调频率候选物的其中一个,其频率靠近该语音讯 号之一先前讯框之一预先估算的音调频率。 29.如申请专利范围第16项之装置,其进一步包含用 于藉由将该估算的音调频率之该最终效用得分与 一预定临限値进行比较以判定该语音讯号是有声 还是无声之构件。 30.如申请专利范围第16项之装置,其进一步包含用 于回应于该估算的音调频率以对该语音讯号进行 编码的构件。 31.一电脑可读取媒体,其上具有一电脑程式,该电 脑程式包含: 一第一程式码区块,可操作以判定一语音讯号之一 讯框的一线频谱,该频谱包含具有个别线振幅及线 频率之复数个频谱线; 一第二程式码区块,可操作以在该等频谱线中选择 一预定数目之具有最高振幅之该等频谱线,其中所 选择的频谱线之数目系少于该等复数个频谱线之 总数; 一第三程式码区块,可操作以在一音调频率范围上 计算一初步效用函数,藉此为该范围中之每一音调 频率提供一能量测该等所选择的频谱线与该音调 频率之一相容性的初步效用函数値; 一第四程式码区块,可操作以至少部分地回应于该 初步效用函数以识别一预定数目之初步音调频率 候选物,其中每一初步音调频率候选物为该初步效 用函数之一局部最大値; 一第五程式码区块,可操作以为该等初步音调频率 候选物中之每一个来计算最终效用得分;及 一第六程式码区块,可操作以至少部分地回应于该 等最终效用得分中之任一个,选择该等复数个初步 音调频率候选物中之任一个可成为该语音讯号之 一估算的音调频率。 图式简单说明: 图1为根据本发明之一较佳实施例之一用于语音分 析及编码的系统的示意性图示说明; 图2为一流程图,其示意性地说明了根据本发明之 一较佳实施例之一用于音调判定及语音编码的方 法; 图3为一流程图,其示意性地说明了根据本发明之 一较佳实施例之一用于为语音讯号提取线频谱并 发现候选物音调値的方法; 图4为一方块图,其示意性地说明了根据本发明之 一较佳实施例之一用于经长时间间隔与短时间间 隔同时来提取线频谱的方法; 图5为一流程图,其示意性地说明了根据本发明之 一较佳实施例之一用于在线频谱中发现峰値的方 法; 图6A、6B、6C及6D为流程图,其皆示意性地说明了根 据本发明之一较佳实施例之一用于基于一输入线 频谱来评估候选物音调频率的方法; 图7为根据图6A-6D之方法之一用于评估候选物音调 频率的影响函数之循环(cycle)曲线; 图8为根据本发明之一较佳实施例之一藉由将图7 之影响函数应用于线频谱之一成分而导出的部分 效用函数之曲线; 图9A及9B为流程图,其示意性地说明了根据本发明 之一较佳实施例之一用于自复数个候选物音调频 率来为语音之讯框选择一估算的音调频率的方法; 及 图10为一流程图,其示意性地说明了根据本发明之 一较佳实施例之一用于判定语音之讯框是有声还 是无声的方法。
地址 美国