发明名称 语音数据检索装置、语音数据检索方法、语音数据检索程序和包含有语音数据检索程序的计算机可用介质
摘要 一种语音数据检索装置(10)包括语音数据库(1)、语音识别单元(2)、混淆网络创建单元(3)、反转索引表创建单元(4)、反转索引表存储单元(5)、查询输入单元(6)、查询转换单元(7)和标签串对照单元(8)。语音识别单元(2)从语音数据库读取语音数据,执行关于所读取的语音数据的语音识别处理,和输出作为点阵的语音识别处理的结果,在所述点阵中音素、音节或单词是基本单位。混淆网络创建单元(3)基于输出的点阵来创建混淆网络并输出作为混淆网络的语音识别处理的结果。反转索引表创建单元(4)基于输出的混淆网络来创建反转索引表。查询输入单元(6)接收来自用户的查询输入,执行关于所接收的查询的语音识别处理,和输出作为字符串的语音识别处理结果。查询转换单元(7)将输出的字符串转换为标签串,在所述标签串中音素、音节或单词是基本单位。标签串对照单元(8)检查标签串和反转索引表,并检索标签串和语音数据库(1)中都包括的语音数据。
申请公布号 CN101647021B 申请公布日期 2013.03.27
申请号 CN200880010728.5 申请日期 2008.04.11
申请人 麻省理工学院;日本电信电话株式会社 发明人 堀贵明;I·李·赫瑟琳顿;蒂莫西·J.·黑曾;詹姆斯·R.·格拉斯
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京银龙知识产权代理有限公司 11243 代理人 许静
主权项 一种语音数据检索装置,包括:语音数据库,包括多条语音数据;语音识别单元,用于从所述语音数据库读取语音数据,执行关于所读取的语音数据的语音识别处理,并将语音识别处理的结果作为点阵输出,在所述点阵中音素、音节或单词是基本单位;混淆网络创建单元,用于基于来自语音识别单元的点阵来创建混淆网络并将所述语音识别处理的结果作为所述混淆网络输出;反转索引表创建单元,用于基于来自所述混淆网络创建单元的混淆网络来创建反转索引表;查询输入单元,用于接收用户的查询输入,执行关于所接收的查询的语音识别处理,并将该语音识别处理的结果作为字符串输出;查询转换单元,用于将来自所述查询输入单元的字符串转换为标签串,在所述标签串中音素、音节或单词是基本单位;以及标签串对照单元,用于:参考反转索引表来创建由指派给标签串中包括的一个或多个标签的一个或多个弧形成的部分混淆网络,用一维阵列图表示标签串,向一维阵列图中的每个节点指派返回到每个节点的弧以创建查询的图,计算部分混淆网络和查询的图之间的交叉以创建图,计算从图中的开始节点到结束节点的所有路径的出现概率的和的值,将计算的值作为查询的标签串的出现概率,从包括查询的标签串的混淆网络的反转索引表中读取发声ID号,将标签串的发声ID号和出现概率的对注册到检索结果列表中,并且基于检索结果列表来输出一个或多个指针的列表,所述一个或多个指针的列表指示在语音数据库中的一个或多个地址,在所述语音数据库中存储了和查询的标签串相对应的一条或多条语音数据。
地址 美国马萨诸塞州