发明名称 用于语音信号的组合频域和时域音高提取的系统和方法
摘要 本发明公开一种系统、计算机可读介质和方法,用于对语音信号进行采样;将采样语音信号划分成重叠帧;使用频域分析从帧提取第一音高信息;从第一音高信息提供至少一个音高候选值,其中每一个音高候选值与频谱得分相结合,所述至少一个音高候选值中的每一个表示该帧的可能音高估计值;使用时域分析从该帧提取第二音高信息;从第二音高信息提供所述至少一个音高候选值的相关得分;以及选择所述至少一个音高候选值中的一个来表示该帧的音高估计值。该系统、计算机可读介质和方法适于语音编码和分布式语音识别。
申请公布号 CN100589178C 申请公布日期 2010.02.10
申请号 CN200480008861.9 申请日期 2004.03.31
申请人 国际商业机器公司;摩托罗拉公司 发明人 腾卡斯·V.·拉玛巴德拉恩;亚历山大·索里恩
分类号 G10L11/04(2006.01)I 主分类号 G10L11/04(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 康建峰
主权项 1.一种用于从语音信号提取音高信息的方法,包括:对语音信号进行采样;将采样语音信号划分成重叠帧;使用频域分析从帧提取第一音高信息;从第一音高信息提供至少一个音高候选值,其中每一个音高候选值与频谱得分相结合,所述至少一个音高候选值中的每一个表示该帧的可能音高估计值;使用时域分析从该帧提取第二音高信息;从第二音高信息提供所述至少一个音高候选值的相关得分;以及选择所述至少一个音高候选值中的一个来表示该帧的音高估计值,其中使用时域分析从该帧提取第二音高信息包括:将该帧与前一帧组合在一起成为扩展帧;以及通过对扩展帧进行低通滤波和下采样来计算下采样扩展帧。
地址 美国纽约