发明名称 声音分段设备和方法以及说话者识别系统
摘要 本发明提供一种声音分段设备和方法以及说话者识别系统。该声音分段方法包括多级分段步骤,所述多级分段步骤包括当前声音段分段步骤。所述当前声音段分段步骤包括:确定步骤,确定当前声音段关于分割分数序列是否满足规定条件,所述分割分数序列指示每个候选分割点的信息熵;以及分割步骤,如果确定所述当前声音段满足所述规定条件,则将所述当前声音段分割为至少两个下一级声音段。通过将通过所述分割步骤获得的所述下一级声音段中的每一个作为所述下一级中的当前声音段,以迭代方式执行所述当前声音段分段步骤,直到每一级中的未被分割的声音段都不满足所述规定条件为止。得益于本发明,不必设置固定的观察窗并且可以降低计算量。
申请公布号 CN102915728A 申请公布日期 2013.02.06
申请号 CN201110217652.7 申请日期 2011.08.01
申请人 佳能株式会社 发明人 郭莉莉;穆向禹;刘贺飞
分类号 G10L15/02(2006.01)I;G10L15/14(2006.01)I;G10L17/14(2013.01)I 主分类号 G10L15/02(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 魏小薇
主权项 一种声音分段方法,包括:多级分段步骤,所述多级分段步骤包括:当前声音段分段步骤,所述当前声音段分段步骤包括:确定步骤,确定当前声音段关于分割分数序列是否满足规定条件,所述分割分数序列指示每个候选分割点的信息熵;以及分割步骤,如果确定所述当前声音段满足所述规定条件,则将所述当前声音段分割为至少两个下一级声音段,其中,通过将通过所述分割步骤获得的所述下一级声音段中的每一个作为所述下一级中的当前声音段,以迭代方式执行所述当前声音段分段步骤,直到每一级中的未被分割的声音段都不满足所述规定条件为止。
地址 日本东京