发明名称 语音处理中基于高斯模型的动态时间弯曲系统和方法
摘要 高斯动态时间弯曲模型提供了一种表示声音图形的分级统计模型。模型的第一层代表普通的声音空间;第二层代表每个讲话者空间而第三层代表包含在每个注册语音发音中的临时结构信息,所述临时结构信息以相等区间的时间间隔为基础。这三层是分级构筑的:第二层从第一层中得出,第三层从第二层中得出。该模型在语音处理应用领域,特别是在用定位识别模式的词汇和讲话者识别领域非常有用。
申请公布号 CN1514432A 申请公布日期 2004.07.21
申请号 CN200310121247.0 申请日期 2003.12.15
申请人 松下电器产业株式会社 发明人 杰-弗朗索瓦·波纳斯特雷;菲利蒲·摩林;杰-克劳德·约库阿
分类号 G10L15/14 主分类号 G10L15/14
代理机构 北京律诚同业知识产权代理有限公司 代理人 徐金国;陈红
主权项 1.一种用于构建语音模型的方法,包括:用从多个讲话者获得的多个发音构建声音空间模型;通过用从至少一个讲话者得到的注册语音与声音空间模型适配构建讲话者模型;识别与所述注册语音相关的临时结构;和以所述讲话者的注册语音为基础构建语音模型,同时将所述注册语音的临时结构保存在所述的语音模型中。
地址 日本大阪