发明名称 进行非结构化信息管理和自动文本分析的系统和方法
摘要 本发明涉及进行非结构化信息管理和自动文本分析的系统和方法。具体地,本发明公开了一种用于非结构化信息管理系统(UIMS)的系统架构、部件和搜索技术。UIMS可以作为中间件提供,用于在信息源的广泛阵列上有效地管理和交换非结构化信息。所述架构通常包括一个搜索引擎、数据存储器以及包含流水线化文档标注器和各种适配器的分析引擎。该搜索技术利用二级搜索技术。一个搜索查询包括一个搜索操作符,该操作符包括多个搜索子表达式,每一个子表达式具有相关的权重值。搜索引擎将权重值和大于权重值和阈值的文档返回。所述搜索操作符被实现为按照加权与(WAND)工作的布尔判定。
申请公布号 CN1573744A 申请公布日期 2005.02.02
申请号 CN200410045899.5 申请日期 2004.05.25
申请人 国际商业机器公司 发明人 安德雷·Z·布拉德;戴维·卡梅尔;迈克尔·赫斯克维奇;阿雅·索弗;贾森·泽恩
分类号 G06F17/30;G06F17/27 主分类号 G06F17/30
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 李春晖
主权项 1.一种用于处理存储的数据的数据处理系统,包括:用于存储数据单元的集合的数据存储器;和连接到该数据存储器的搜索引擎,该搜索引擎对用于从所述数据存储器中检索至少一个数据单元的查询作出响应;其中所述查询包括一个搜索操作符,该操作符由多个搜索子表达式构成,每一个子表达式有一个相关的权重值,并且,其中,所述搜索引擎将权重值和大于一个权重值和阈值的数据单元返回。
地址 美国纽约