发明名称 |
定位和检索以压缩数字格式存储的数据内容的方法和装置 |
摘要 |
一种在数据库中定位和检索特定数据内容的方法,该数据从记录的语音得到。数据包括与记录的语音关联的压缩数字音频或视频数据文件时,检索特定内容要求只解压部分压缩数据。在定位上述类型特定内容的方法中,将包括所记录语音的压缩音频文件转换为对应文本文件,其被划分为多个文本文件分段,每个分段具有唯一标识符。从文本文件构造包括若干索引元素的可搜索索引,每个索引元素与一个或多个文本文件分段中定位的特定信息关联。使用一个或多个特定搜索变量搜索可搜索索引的各元素,以便检测一个或多个文本分段,每个包含至少一些特定内容。然后使用各检测的分段的标识符在音频文件中定位特定内容。只需解压包含特定内容的部分音频文件以检索内容。 |
申请公布号 |
CN1983276A |
申请公布日期 |
2007.06.20 |
申请号 |
CN200610160375.X |
申请日期 |
2006.11.15 |
申请人 |
国际商业机器公司 |
发明人 |
奥利弗·K·班恩;安东尼·C·斯皮尔伯格;蒂莫西·A·迪茨 |
分类号 |
G06F17/30(2006.01) |
主分类号 |
G06F17/30(2006.01) |
代理机构 |
北京市柳沈律师事务所 |
代理人 |
黄小临;王志森 |
主权项 |
1.一种用于定位在存储的数据中包含的特定内容的方法,其与所存储的从记录的一个或多个发言者的语音得到的所存储数据相关联,其中,所述方法包括步骤:将包括至少一些所述记录的语音的音频文件转换为对应的文本文件,其中,所述文本文件包括多个文本分段,每个文本分段配备有唯一标识符;从所述文本文件构造包括若干索引元素的可搜索索引,所述索引元素的每个与在一个或多个所述文本分段中定位的特定信息相关联;使用一个或多个特定搜索变量来搜索所述可搜索索引的所述索引元素,以便检测所述文本文件的一个或多个文本分段,每个文本分段各自包含至少一些所述特定内容;并且使用各个检测文本分段的标识符,在所述音频文件中定位所述特定内容。 |
地址 |
美国纽约阿芒克 |