发明名称 |
一种分布式并行信息检索系统及其方法 |
摘要 |
采用本发明所述的一种分布式并行信息检索系统及其方法,其数据采集单元从internet上采集数据,索引单元对采集到的数据进行加工和组织,建立起适合检索的数据结构和存储方式,检索单元对用户提交的查询进行分析处理,进行相似度计算和排名,并对查询结果进行整理,利用并行处理和分布式处理技术进行海量数据检索。 |
申请公布号 |
CN102200979A |
申请公布日期 |
2011.09.28 |
申请号 |
CN201010132955.4 |
申请日期 |
2010.03.26 |
申请人 |
上海市浦东科技信息中心 |
发明人 |
鲍英;郑修虹;孔佳薇;叶青;程三艳 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海集信知识产权代理有限公司 31254 |
代理人 |
周成 |
主权项 |
一种分布式并行信息检索系统,其特征在于包括数据采集单元,索引单元和检索单元,所述数据采集单元从internet上采集数据,所述索引单元对采集到的数据进行加工和组织,建立起适合检索的数据结构和存储方式,所述检索单元对用户提交的查询进行分析处理,进行相似度计算和排名,并对查询结果进行整理。 |
地址 |
201203 上海市浦东新区张江春晓路350号南楼406室 |