发明名称 |
索引和搜索带有文本元数据的语音 |
摘要 |
通过获得语音数据的词语的出现概率和词语的位置信息并且将它与文本元数据中该词语的至少位置信息组合来创建用于搜索具有语音数据和文本元数据的口语文档的索引。可以创建单个索引,因为语音数据和文本元数据被同样处理并仅被视为不同的类别。 |
申请公布号 |
CN101305360A |
申请公布日期 |
2008.11.12 |
申请号 |
CN200680041464.0 |
申请日期 |
2006.10.31 |
申请人 |
微软公司 |
发明人 |
A·阿塞罗;C·I·克尔伯;J·S·F·桑彻斯 |
分类号 |
G06F17/20(2006.01);G06F17/28(2006.01);G06F17/30(2006.01) |
主分类号 |
G06F17/20(2006.01) |
代理机构 |
上海专利商标事务所有限公司 |
代理人 |
陈斌 |
主权项 |
1.一种索引包含语音数据(52)和文本元数据(54)的口头文档(50)的方法,所述方法包括:生成(305)有关来自语音数据(52)的经识别语音的信息,所述信息包含所述经识别语音中词语的出现概率和所述词语的位置信息;以与所述有关经识别语音的信息实质上相同的格式生成(313)有关文本元数据(54)中词语的至少位置信息的信息;以及基于所述有关经识别语音的信息和所述有关文本元数据的信息构造(314)索引。 |
地址 |
美国华盛顿州 |