发明名称 一种自动嗓音谐噪比分析方法
摘要 本发明提供一种自动嗓音谐噪比分析方法,包括:1)从录音中切分出进行谐噪比分析的有效语音段;2)基于听觉模型,对所述语音段进行滤波处理,然后计算听觉模型中各滤波器通道中的在时域和频域二维的能量相关系数;3)设定所述相关系数的阈值,当步骤2)得出的相关系数大于该阈值时,则该相关系数所对应的时域和频域坐标点为谐波成份,否则,该相关系数所对应的时域和频域坐标点为噪音成份,最后计算谐波成份与噪音成份的比值得出谐噪比。本发明使用自相关图表征的时域和耳蜗谱域通道之间相关性来判断谐波成份,不受基频检测位置的影响,能够更准确更鲁棒的检测出谐波成份。由于使用耳蜗谱,本发明与人耳的真实听觉更加匹配。
申请公布号 CN101452698B 申请公布日期 2011.06.22
申请号 CN200710178362.X 申请日期 2007.11.29
申请人 中国科学院声学研究所;中国科学院物理研究所 发明人 颜永红;王迪;张建平
分类号 G10L11/00(2006.01)I 主分类号 G10L11/00(2006.01)I
代理机构 北京泛华伟业知识产权代理有限公司 11280 代理人 王勇
主权项 一种自动嗓音谐噪比分析方法,包括如下步骤:1)从录音中切分出进行谐噪比分析的有效语音段;2)基于听觉模型,对所述语音段进行滤波处理,然后计算听觉模型中各滤波器通道中的在时域和频域二维的能量相关系数;3)设定所述相关系数的阈值,当步骤2)得出的相关系数大于该阈值时,则该相关系数所对应的时域和频域坐标点为谐波成份,否则,该相关系数所对应的时域和频域坐标点为噪音成份;然后再计算谐波成份与噪音成份的比值得出谐噪比;所述步骤1)包括下列子步骤:步骤11)利用基于能量语音活动检测技术找出多段语音的起始点和终止点位置;步骤12)对每段语音分别进行分帧,对于每一帧,计算该帧能量值;计算该帧的能量变化率;步骤13)计算每段语音中各帧能量值的平均值;计算每段语音中各帧的能量变化率的平均值;步骤14)找出其能量值在所述能量值的平均值周围一定阈值范围内,且其能量变化率在所述能量变化率的平均值周围一定阈值范围内的帧,这些帧中的第一帧和最后一帧分别为所述有效语音段的起始帧和终止帧。
地址 100080 北京市海淀区北四环西路21号