发明名称 | 一种利用短时时频值的自适应端点检测方法 | ||
摘要 | 一种利用短时时频值的自适应端点检测方法,涉及说话人识别系统中的语音检测技术。语音信号输入后,解析语音文件并提取采样值,对获取到的语音采样序列进行预处理;将预处理后的信号分成了固定长度的帧,并形成一个帧序列,针对每一帧数据提取短时能量、短时信息熵和短时幅度相对值三个语音信号特征参数;根据三个语音信号特征参数计算每一帧信号的短时时频值,并形成一个短时时频值序列;从信号第一帧开始,分析短时时频值序列,寻找语音的起点和终点,并输出语音端点检测结果。可在复杂的背景噪声下,较为准确检测出语音的起点和终点,提高系统的识别准确率,减少识别时间,提高复杂环境下的说话人识别系统的性能。 | ||
申请公布号 | CN104021789A | 申请公布日期 | 2014.09.03 |
申请号 | CN201410292519.1 | 申请日期 | 2014.06.25 |
申请人 | 厦门大学 | 发明人 | 洪青阳;雷文钿;童峰 |
分类号 | G10L17/02(2013.01)I | 主分类号 | G10L17/02(2013.01)I |
代理机构 | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人 | 马应森 |
主权项 | 一种利用短时时频值的自适应端点检测方法,其特征在于包括如下步骤:1)语音信号输入后,解析语音文件并提取采样值,对获取到的语音采样序列进行预处理;2)将步骤1)预处理后的信号分成了固定长度的帧,并形成一个帧序列,针对每一帧数据提取短时能量、短时信息熵和短时幅度相对值三个语音信号特征参数;3)根据步骤2)中的三个语音信号特征参数计算每一帧信号的短时时频值,并形成一个短时时频值序列;4)从信号第一帧开始,分析短时时频值序列,寻找语音的起点和终点,并输出语音端点检测结果。 | ||
地址 | 361005 福建省厦门市思明南路422号 |