发明名称 用于多语言信息检索的系统、方法、软件和界面
摘要 本发明人已经设计出了一种或多种新颖的方法、系统和界面用于帮助实现多语言搜索。一种示范方法需要为文档总集创建多个语言专有索引,每个索引包括来自文档的项的词干化和未词干化的版本。用户提交与一组一个或多个目标语言相关联的查询。查询处理需要使用产生一组可能的等价查询项的一种或多种技术将查询中的每个项的初始版本和词干化版本翻译成各个目标语言。然后使用传统的单语言搜索技术,例如布尔或自然语言查询,针对相应的语言专有索引处理每组可能的等价查询项以从该总集中识别出文档。得到的文档被按语言分组或按计算出的相关性呈现给用户。
申请公布号 CN100492364C 申请公布日期 2009.05.27
申请号 CN200680001792.8 申请日期 2006.01.04
申请人 汤姆森环球资源公司 发明人 I·穆利尼耶;E·S·伦德
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中国专利代理(香港)有限公司 代理人 王 岳;王忠忠
主权项 1、一种方法,包括:为文档总集定义一组一个或多个语言专有索引,每个索引包括文档中包含的项的词干化版本和未词干化版本;从用户接收查询,该查询与一组一个或多个目标语言相关联;将该查询解析成一个或多个项,而每个项与相应的语言标识符和该项的词干化版本相关联;将查询的每个项的初始版本和词干化版本翻译成各个目标语言,以定义各自的一个或多个等价查询项的集合;并从文档总集中为每个目标语言识别出一文档集合,而该集合是为相应的目标语言根据等价查询项识别出的。
地址 瑞士祖格