发明名称 电子文本处理与检索的方法和系统
摘要 本发明提供一种计算机及搜索引擎关于电子文本处理与检索的技术,在用户经过交互界面进行关键词检索而面对海量的搜索结果时,通过原关键词结合邻接词段形成关键语句的搜索技术及其形成的数据分布多级子集体系和目录体系,能在不需明显增加服务器容量的情况下,帮助用户迅速而严密地缩小搜索范围,或剔除各类无关信息或核心内容重复的信息,完整准确地得到所期望的查询结果。
申请公布号 CN101063975A 申请公布日期 2007.10.31
申请号 CN200710087104.0 申请日期 2007.03.21
申请人 刘二中 发明人 刘二中
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 代理人
主权项 1、一种计算机执行的对多个含有同样关键词的电子文本进行处理的方法,包括:获得多个含有同样关键词的电子文本;规定邻接词段所含字词数量或邻接词段截取方式;根据部分或全部文本中的每个文本内容中所述关键词的邻接词段或间接邻接词段与其他文本相同还是不同,将该文本与其他文本划分入同一或不同子集或者进行相应的相同或不同处理;所述的相应的相同或不同处理可以包括:相应文本具有相同或不同的分布位置或存储方式,或者得到相同或不同的子集标记,或者使得其索引具有相同或不同的标记或索引项,或者具有相同或不同的编排方式,或者在交互界面具有相同或不同的显示方式或位置,或者允许至少部分子集各有一个或多个邻接词段或文本进行跨子集组合或排序或在交互界面展示;所述的文本可以是电子文件或网页或者它们的摘要或索引或题录或题目。
地址 100089北京市海淀区北洼西里中海雅园2D