发明名称 语音数据检索装置、语音数据检索方法、语音数据检索程序和包含有语音数据检索程序的计算机可用介质
摘要 一种语音数据检索装置(10)包括语音数据库(1)、语音识别单元(2)、混淆网络创建单元(3)、反转索引表创建单元(4)、反转索引表存储单元(5)、查询输入单元(6)、查询转换单元(7)和标签串对照单元(8)。语音识别单元(2)从语音数据库读取语音数据,执行关于所读取的语音数据的语音识别处理,和输出作为点阵的语音识别处理的结果,在所述点阵中音素、音节或单词是基本单位。混淆网络创建单元(3)基于输出的点阵来创建混淆网络并输出作为混淆网络的语音识别处理的结果。反转索引表创建单元(4)基于输出的混淆网络来创建反转索引表。查询输入单元(6)接收来自用户的查询输入,执行关于所接收的查询的语音识别处理,和输出作为字符串的语音识别处理结果。查询转换单元(7)将输出的字符串转换为标签串,在所述标签串中音素、音节或单词是基本单位。标签串对照单元(8)检查标签串和反转索引表,并检索标签串和语音数据库(1)中都包括的语音数据。
申请公布号 CN101647021A 申请公布日期 2010.02.10
申请号 CN200880010728.5 申请日期 2008.04.11
申请人 麻省理工学院;日本电信电话株式会社 发明人 堀贵明;I·李·赫瑟琳顿;蒂莫西·J.·黑曾;詹姆斯·R.·格拉斯
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京银龙知识产权代理有限公司 代理人 许 静
主权项 1.一种语音数据检索装置,包括:语音数据库,包括多条语音数据;语音识别单元,用于从所述语音数据库读取语音数据,执行关于所读取的语音数据的语音识别处理,并将语音识别处理的结果作为点阵输出,在所述点阵中音素、音节或单词是基本单位;混淆网络创建单元,用于基于来自语音识别单元的点阵来创建混淆网络并将所述语音识别处理的结果作为所述混淆网络输出;反转索引表创建单元,用于基于来自所述混淆网络创建单元的混淆网络来创建反转索引表;查询输入单元,用于接收用户的查询输入,执行关于所接收的查询的语音识别处理,并将该语音识别处理的结果作为字符串输出;查询转换单元,用于将来自所述查询输入单元的字符串转换为标签串,在所述标签串中音素、音节或单词是基本单位;以及标签串对照单元,用于对照来自所述反转索引表创建单元的反转索引表和来自查询转换单元的标签串,检索所述标签串和语音数据库中都包括的语音数据,以及输出指针列表,所述指针列表指示所检索的语音数据在语音数据库中存储的地址。
地址 美国马萨诸塞州