发明名称 一种情报收集处理和检索系统
摘要 本发明涉及一种情报收集处理和检索系统,其包括情报收集模块、情报处理模块、检索模块以及情报库,还包括知识库,所述的知识库包括兴趣模型库、专业领域知识库、权威网址列表以及阈值库;所述情报收集模块包括搜索器和兴趣制定模块,所述兴趣制定模块,为用户制定兴趣定制与文档相关度模型;通过用户定义以及兴趣相关度计算的方式,实现了下载信息的过滤与分类,并能够较好地实现互联网上公开情报信息的收集、处理与管理问题。
申请公布号 CN103530398B 申请公布日期 2016.06.01
申请号 CN201310502517.6 申请日期 2013.10.23
申请人 合山市科学技术情报研究所 发明人 江彩莲
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京轻创知识产权代理有限公司 11212 代理人 杨立
主权项 一种情报收集处理和检索系统,其包括情报收集模块、情报处理模块、检索模块以及情报库,其特征在于:还包括知识库,所述的知识库包括兴趣模型库、专业知识库、挖掘规则库、权威网址列表以及阈值库;所述情报收集模块包括搜索器和兴趣制定模块;所述兴趣制定模块,为用户制定兴趣定制与文档相关度模型;所述专业知识库包括专业同义词库、专业异义词库、地理信息库和人名库;所述兴趣制定模块的工作步骤如下:步骤一,情报用户以专题来表达并提交他的兴趣;步骤二,将所述专题名称经过地名、人名专用名词的抽取处理后作为关键词的一个最重要部分,抽取出来的专用名词加入所述专题的关键词列表;步骤三,设置所述专题为T、关键词为K1,K2,…,Kn,所述关键词K1,K2,…,Kn的字符长度分别为l1,l2,…,ln,文档D中出现K1,K2,…,Kn的频率分别为f1,f2,…,fn,文档D的字符数为L;步骤四,令所述关键词Ki的权重wi为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>w</mi><mi>i</mi></msub><mo>=</mo><mfenced open = '{' close = ''><mtable><mtr><mtd><mfrac><mn>1</mn><msup><mn>2</mn><mi>i</mi></msup></mfrac></mtd><mtd><mrow><mn>1</mn><mo>&le;</mo><mi>i</mi><mo>&lt;</mo><mi>n</mi><mo>,</mo><mi>n</mi><mo>&gt;</mo><mn>1</mn></mrow></mtd></mtr><mtr><mtd><mfrac><mn>1</mn><msup><mn>2</mn><mrow><mi>i</mi><mo>-</mo><mn>1</mn></mrow></msup></mfrac></mtd><mtd><mrow><mi>i</mi><mo>=</mo><mi>n</mi><mi> </mi><mi>o</mi><mi>r</mi><mi> </mi><mi>n</mi><mo>=</mo><mn>1</mn></mrow></mtd></mtr></mtable></mfenced><mo>;</mo></mrow>]]></math><img file="FDA0000927762680000011.GIF" wi="1748" he="339" /></maths>步骤五,定义所述文档D与所述专题T的相关度为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>S</mi><mi>i</mi><mi>m</mi><mrow><mo>(</mo><mi>T</mi><mo>,</mo><mi>D</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>f</mi><mi>i</mi></msub><mo>*</mo><msub><mi>l</mi><mi>i</mi></msub><mo>*</mo><msub><mi>w</mi><mi>i</mi></msub><mo>*</mo><mo>/</mo><mi>L</mi><mo>)</mo></mrow><mo>*</mo><msub><mi>f</mi><mn>1</mn></msub><mo>*</mo><msub><mi>f</mi><mn>2</mn></msub><mo>;</mo></mrow>]]></math><img file="FDA0000927762680000012.GIF" wi="1613" he="228" /></maths>步骤六,对互联网上公开情报的收集,通过设计主动式专题搜索引擎来完成,该引擎以知识库为基础,由用户定制兴趣专题、信息收集的方向与内容以及网址列表和下载信息的格式进行进一步的浏览、检索与查询。
地址 546500 广西壮族自治区来宾市合山市人民南路122号