发明名称 一种基于说话人分割的会议主持人语音提取方法
摘要 本发明公开了一种基于说话人分割的会议主持人语音提取方法,包括如下步骤:S1、读入记录有会议语音的音频文件;S2、说话人分割:检测上述会议语音中的说话人改变点,将相邻两个改变点之间的语音样点作为一个语音段,将音频文件分成多个语音段;S3、语音段距离比较:将说话人分割之后的第一个语音段作为会议主持人的语音,并比较该语音段与其他语音段的距离,将距离小于门限的语音段也判为会议主持人语音,从而得到会议主持人的所有语音段。本发明为会议语音的快速浏览、主题提取、说话人检索等奠定了基础,具有能快速有效地提取出会议主持人的语音等优点。
申请公布号 CN103559882B 申请公布日期 2016.08.10
申请号 CN201310479266.4 申请日期 2013.10.14
申请人 华南理工大学 发明人 李艳雄;金海;贺前华
分类号 G10L17/02(2013.01)I 主分类号 G10L17/02(2013.01)I
代理机构 广州市华学知识产权代理有限公司 44245 代理人 蔡茂略
主权项 一种基于说话人分割的会议主持人语音提取方法,其特征在于,包括如下步骤:S1、读入记录有会议语音的音频文件;S2、对会议上说话人的语音进行分割:检测上述会议语音中的说话人改变点,将相邻两个改变点之间的语音样点作为一个语音段,将音频文件分成若干个语音段,所述语音段的个数等于改变点个数加1;S3、语音段距离比较:将说话人的语音进行分割之后的第一个语音段作为会议主持人的一部分语音,并比较该语音段与其他语音段的距离,并将距离小于门限的语音段也判为会议主持人的另一部分语音,根据分割后的第一个语音段和距离小于门限的语音段,得到会议主持人的全部语音段。
地址 510640 广东省广州市天河区五山路381号