发明名称 全文查询和搜索系统及其使用方法
摘要 本发明粗略地描述了一种用以搜索数据库的数据库搜索方法,其中根据命中文件和查询的共有信息元的信息数值对命中文件进行评级。该信息数值可以是Shannon信息分值,或是另一种显示了共有信息元的信息值的数值。一个信息元可以是一个单词或其它符号,或是多个单词的短语,而且可以互相重叠。查询中的信息元可以用同义词代替,代替的信息元的信息数值会根据预设的同义词相似性数值被降低。间接搜索方法是这样被描述的:根据共有信息元的信息数值重新对来自其它搜索引擎的命中文件评级。可以搜索结构化的和完全非结构化的数据库,其中命中文件被动态划界。命中文件可以基于信息数值加权的距离空间中的距离被聚类。
申请公布号 CN101535945A 申请公布日期 2009.09.16
申请号 CN200780023220.4 申请日期 2007.04.25
申请人 英孚威尔公司 发明人 元华·汤姆·唐;胡前进;永红·格蕾丝·杨;陈春暖;梅明华
分类号 G06F7/00(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F7/00(2006.01)I
代理机构 上海智信专利代理有限公司 代理人 薛 琦;朱水平
主权项 1、一种搜索一数据库的方法,包含如下步骤:响应于一第一查询,在数据库上开始一第一搜索,该第一搜索生成多个命中文件;基于该命中文件和该第一查询的共有信息元的信息数值对命中文件评级;并且,向用户识别出至少一个根据该评级选择的该命中文件。
地址 美国加利福尼亚州