发明名称 |
基于基音频率的快速音频分割方法 |
摘要 |
本发明涉及一种基于基音频率的快速音频分割方法,首先用基音频率从音频中检测语音,然后用能量将非语音部分分成静音和非静音,最后在语音片段之间检测说话人改变,由说话人改变点得到最终分割结果。本发明有益的效果是:利用韵律特征基音频率实现静音、语音和非语音的分割,消除非语音对说话人分割的不利影响;而基音频率较倒谱特征更节省计算时间。 |
申请公布号 |
CN100485780C |
申请公布日期 |
2009.05.06 |
申请号 |
CN200510061358.6 |
申请日期 |
2005.10.31 |
申请人 |
浙江大学 |
发明人 |
杨莹春;吴朝晖;杨旻 |
分类号 |
G10L15/28(2006.01)I;G10L15/00(2006.01)I;G10L15/08(2006.01)I;G10L17/00(2006.01)I |
主分类号 |
G10L15/28(2006.01)I |
代理机构 |
杭州九洲专利事务所有限公司 |
代理人 |
陈继亮 |
主权项 |
1、一种基于基音频率的快速音频分割方法,其特征在于:首先依据基音频率特征从音频中进行语音检测,检测方法为:对音频逐帧提取基音频率,将基音频率连续取值为0的若干帧归为非语音片段,将基音频率连续取值不为0的若干帧归为语音片段;然后根据能量特征将非语音片段分成静音和非静音;最后在语音片段之间检测说话人改变,由说话人改变点得到最终分割结果。 |
地址 |
310027浙江省杭州市西湖区浙大路38号浙江大学计算机学院曹光彪东楼505室 |