发明名称 一种利用短时时频值的自适应端点检测方法
摘要 一种利用短时时频值的自适应端点检测方法,涉及说话人识别系统中的语音检测技术。语音信号输入后,解析语音文件并提取采样值,对获取到的语音采样序列进行预处理;将预处理后的信号分成了固定长度的帧,并形成一个帧序列,针对每一帧数据提取短时能量、短时信息熵和短时幅度相对值三个语音信号特征参数;根据三个语音信号特征参数计算每一帧信号的短时时频值,并形成一个短时时频值序列;从信号第一帧开始,分析短时时频值序列,寻找语音的起点和终点,并输出语音端点检测结果。可在复杂的背景噪声下,较为准确检测出语音的起点和终点,提高系统的识别准确率,减少识别时间,提高复杂环境下的说话人识别系统的性能。
申请公布号 CN104021789A 申请公布日期 2014.09.03
申请号 CN201410292519.1 申请日期 2014.06.25
申请人 厦门大学 发明人 洪青阳;雷文钿;童峰
分类号 G10L17/02(2013.01)I 主分类号 G10L17/02(2013.01)I
代理机构 厦门南强之路专利事务所(普通合伙) 35200 代理人 马应森
主权项 一种利用短时时频值的自适应端点检测方法,其特征在于包括如下步骤:1)语音信号输入后,解析语音文件并提取采样值,对获取到的语音采样序列进行预处理;2)将步骤1)预处理后的信号分成了固定长度的帧,并形成一个帧序列,针对每一帧数据提取短时能量、短时信息熵和短时幅度相对值三个语音信号特征参数;3)根据步骤2)中的三个语音信号特征参数计算每一帧信号的短时时频值,并形成一个短时时频值序列;4)从信号第一帧开始,分析短时时频值序列,寻找语音的起点和终点,并输出语音端点检测结果。
地址 361005 福建省厦门市思明南路422号