主权项 |
1、一种计算机执行的对多个含有同样关键词的电子文本进行处理的方法,包括:获得多个含有同样关键词的电子文本;规定邻接词段所含字词数量或邻接词段截取方式;根据部分或全部文本中的每个文本内容中所述关键词的邻接词段或间接邻接词段与其他文本相同还是不同,将该文本与其他文本划分入同一或不同子集或者进行相应的相同或不同处理;所述的相应的相同或不同处理可以包括:相应文本具有相同或不同的分布位置或存储方式,或者得到相同或不同的子集标记,或者使得其索引具有相同或不同的标记或索引项,或者具有相同或不同的编排方式,或者在交互界面具有相同或不同的显示方式或位置,或者允许至少部分子集各有一个或多个邻接词段或文本进行跨子集组合或排序或在交互界面展示;所述的文本可以是电子文件或网页或者它们的摘要或索引或题录或题目。 |