发明名称 声音检索装置
摘要 现有的基于声音的文本数据检索在输入声音中的被识别为单词的位置,将单词作为索引词进行全文检索,因此如果在被识别为单词的位置有错误识别,则检索精度低下。在本发明的声音检索装置中,参照根据由学数据分割单元分割为语言单位的检索对象文本数据而由语言模型作成单元作成的语言模型、对声音特征进行了模型化后的音响模型,由声音识别单元进行输入声音的声音识别,输出音素标记,由对照单位变换单元按照与用比语言模型小的单位分割了的文本检索辞典相同的单位对检索对象文本数据进行分割,使用分割结果,由文本检索单元进行文本检索辞典的检索。
申请公布号 CN101286170A 申请公布日期 2008.10.15
申请号 CN200810091710.4 申请日期 2008.04.09
申请人 三菱电机株式会社 发明人 花沢利行;冈登洋平
分类号 G06F17/30(2006.01);G10L15/08(2006.01);G10L15/14(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 吴丽丽
主权项 1.一种声音检索装置,其特征在于包括:将检索对象的文书等文本数据分割为规定的语言单位并输出的学习数据分割单元;根据上述分割结果,作成声音识别用的语言模型的语言模型作成单元;按照比上述学习数据分割单元中的分割单位小的单位,对上述检索对象的文书等文本数据进行分割,作成文本检索辞典的文本辞典作成单元;使用上述语言模型识别输入声音,并作为文本输出声音识别结果的声音识别单元;将上述声音识别结果分割为与上述文本辞典作成单元一样的分割单位并输出的对照单位变换单元;将上述对照单位变换单元的输出作为输入,使用上述文本检索辞典,进行文本检索的文本检索单元。
地址 日本东京