发明名称 一种专利信息处理及检索方法
摘要 本发明公开了一种对海量专利信息进行处理并实现优化检索的方法,包括以下步骤:对专利数据进行处理并设置必要的优化检索字段;将处理后的专利数据导入到基于MongoDB的数据库集群中并实现数据的存储和调用;将处理后的专利数据导入到基于SolrCloud的全文检索系统中并建立分布式索引;建立结合优化检索字段并用于优化检索结果排序的专利向量计算和调整体系。本发明在低服务器资源利用率的前提下实现了检索结果根据专利内容和用户反馈的优化排序。
申请公布号 CN106372079A 申请公布日期 2017.02.01
申请号 CN201510434166.9 申请日期 2015.07.22
申请人 中国化工信息中心 发明人 武春亮;蔡志勇;胡静
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京金富邦专利事务所有限责任公司 11014 代理人 孙伯庆
主权项 一种专利信息处理及检索方法,其特征在于,具体按照如下步骤实施:步骤1,对专利源数据设置若干个优化检索字段;步骤2,将处理后的专利数据导入到基于MongoDB的数据库集群中;步骤3,将处理后的专利数据导入到基于SolrCloud的全文检索系统中,并建立分布式索引;步骤4,建立基于优化检索字段的专利向量计算公式;步骤5,建立基于用户在Web页面中互动的对专利向量进行调整的体系;步骤6,建立基于步骤4中所述专利向量的排序规则;步骤7,将检索获得的专利按照步骤6中所述排序规则进行排序,并通过Web页面输出至用户屏幕。
地址 100029 北京市朝阳区安外小关街53号