发明名称 重叠语音检测方法和系统
摘要 本发明提供了一种重叠语音的自动检测方法和系统,该方法采用贝叶斯信息准则确定重叠语音的多个语音片段中仅仅包含单独说话人语音的语音片段,并为属于同一说话人的语音片段赋予同一个标识。从各个属于同一类语音片段中随机选择各类语音片段的采样数据进行合并获得能够体现所有语音重叠的可能的各种合并结果。然后基于所获得单人说话的语音片段和通过合并获得的多人说话的重叠语音片段建立单人语音片段模型和重叠语音片段模型,最后采用单人语音片段模型和重叠语音片段模型来检测各个语音片段,并基于检测结果来标注所述语音片段。
申请公布号 CN102682760A 申请公布日期 2012.09.19
申请号 CN201110053946.0 申请日期 2011.03.07
申请人 株式会社理光 发明人 尹悦燕;鲁耀杰;王磊;史达飞;郑继川
分类号 G10L11/00(2006.01)I 主分类号 G10L11/00(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 黄小临
主权项 一个重叠语音的自动检测方法,包括:输入语音;将所输入的语音分割为多个语音片段;丢弃所述多个语音片段中仅仅包含静音或噪声的非语音片段;基于贝叶斯信息准则,从丢弃了非语音片段的剩余多个语音片段中确定其中仅仅包含单独说话人语音的语音片段;基于至底向上聚类法,为属于同一说话人的语音片段赋予同一个标识,从而将多个属于同一说话人的语音片段聚类为一类;从各个属于同一说话人的同一类语音片段中随机选择各类语音片段的采样数据并进行合并处理,使得所获得的各种合并结果能够体现所有语音重叠的可能;基于所获得单人说话的语音片段和通过合并获得的多人说话的语音重叠片段建立单人语音片段模型和重叠语音片段模型;采用所获得的单人语音片段模型和重叠语音片段模型来检测所输入语音的多个分割的语音片段,并基于检测结果来标注所述多个分割语音片段。
地址 日本东京都