发明名称 基于基音频率的快速音频分割方法
摘要 本发明涉及一种基于基音频率的快速音频分割方法,首先用基音频率从音频中检测语音,然后用能量将非语音部分分成静音和非静音,最后在语音片段之间检测说话人改变,由说话人改变点得到最终分割结果。本发明有益的效果是:利用韵律特征基音频率实现静音、语音和非语音的分割,消除非语音对说话人分割的不利影响;而基音频率较倒谱特征更节省计算时间。
申请公布号 CN100485780C 申请公布日期 2009.05.06
申请号 CN200510061358.6 申请日期 2005.10.31
申请人 浙江大学 发明人 杨莹春;吴朝晖;杨旻
分类号 G10L15/28(2006.01)I;G10L15/00(2006.01)I;G10L15/08(2006.01)I;G10L17/00(2006.01)I 主分类号 G10L15/28(2006.01)I
代理机构 杭州九洲专利事务所有限公司 代理人 陈继亮
主权项 1、一种基于基音频率的快速音频分割方法,其特征在于:首先依据基音频率特征从音频中进行语音检测,检测方法为:对音频逐帧提取基音频率,将基音频率连续取值为0的若干帧归为非语音片段,将基音频率连续取值不为0的若干帧归为语音片段;然后根据能量特征将非语音片段分成静音和非静音;最后在语音片段之间检测说话人改变,由说话人改变点得到最终分割结果。
地址 310027浙江省杭州市西湖区浙大路38号浙江大学计算机学院曹光彪东楼505室