发明名称 节目制作中的说话人声音自动跟踪变调系统和方法
摘要 本发明节目制作中的说话人声音自动跟踪变调系统和方法,包括:声音采集单元(11),采集指定说话人的声音片断和待处理声音;声学模型设立单元(12),从采集的指定说话人声音片断求解最佳参数作为声学模型;声音过滤分割单元(13),将待处理声音过滤分割成说话音和非说话音;声音存贮单元(14),存贮声学模型、非说话音和非指定说话人声音;声音特征矢量提取单元(15),从说话音中提取声音特征矢量;说话音相似匹配过滤单元(16),将说话音的声音特征矢量与存储器中的声学模型的声音特征矢量比较。声音变调单元(17),将指定说话人声音变调;声音拼接单元(18),将变调后的说话人声音与未变调的其它声音按声音在时间上的先后顺序拼接成处理后的声音。
申请公布号 CN1967657B 申请公布日期 2011.06.08
申请号 CN200510022095.8 申请日期 2005.11.18
申请人 成都索贝数码科技股份有限公司 发明人 欧阳睿章;潘巧海;龚俊杰
分类号 G10L17/00(2006.01)I;G10L15/00(2006.01)I;G10L15/28(2006.01)I;G10L19/00(2006.01)I;G06F3/16(2006.01)I 主分类号 G10L17/00(2006.01)I
代理机构 成都立信专利事务所有限公司 51100 代理人 冯忠亮
主权项 节目制作中的说话人声音自动跟踪变调系统,包括:声音采集单元(11),采集指定说话人的声音片断和待处理声音;声学模型设立单元(12),从采集的指定说话人声音片断提取声音特征矢量并求解最佳参数作为声学模型;声音过滤分割单元(13),将待处理声音过滤分割成说话音和非说话音;声音存贮单元(14),存贮声学模型、非说话音和非指定说话人声音;声音特征矢量提取单元(15),从说话音中提取声音特征矢量;说话音相似匹配过滤单元(16),将说话音的声音特征矢量与声音存贮单元中的声学模型的声音特征矢量比较,匹配的则过滤出为指定说话人声音,不匹配的非指定说话人声音存贮待后合成;声音变调单元(17),将指定说话人声音变调;声音拼接单元(18),将变调后的说话人声音与包括非说话音的未变调的声音按声音在时间上的先后顺序拼接成处理后的声音,系统由N个指定说话人声音自动跟踪变调系统串行组成,上一个系统的声音拼接单元的输出接下一个系统的声音采集单元的输入,在每个系统中,对当前系统指定的说话人声音完成声学模型设立,声音过滤分割,声音特征矢量提取,指定说话人声音,声音变调,声音拼接的整个过程。
地址 610041 四川省成都市高新区新加坡工业园区新元大道南二路二号