发明名称 |
一种面向实时大数据搜索引擎的实现方法 |
摘要 |
本发明公开了一种面向实时大数据搜索引擎的实现方法,涉及搜索引擎技术领域。基于HTTP和Apache Lucene,构建ROSE搜索引擎系统;创建ROSE搜索引擎系统的索引,索引创建好后,用户可以输入查询条件对文件信息进行检索,当用户输入查询条件时,首先进行文本分析,然后从索引数据库查询索引,最后将得到的结果返回给用户。该方法能够很好的完成实时流数据的全文搜索功能,并和分布式系统共同完成计算任务,充分利用集群的高速运算和存储,提高数据分析处理的响应速度。 |
申请公布号 |
CN106294695A |
申请公布日期 |
2017.01.04 |
申请号 |
CN201610640922.8 |
申请日期 |
2016.08.08 |
申请人 |
深圳市网安计算机安全检测技术有限公司 |
发明人 |
张剑 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种面向实时大数据搜索引擎的实现方法,其特征在于:包括以下实现步骤:1)基于HTTP和Apache Lucene,构建ROSE搜索引擎系统;2)创建ROSE搜索引擎系统的索引,通过对各种格式的文档信息以及数据库数据进行信息抽取,并根据文件类型选择不同的文本分析器进行文本分析,创建索引,生成索引数据库;3)索引创建好后,用户可以输入查询条件对文件信息进行检索,当用户输入查询条件时,首先进行文本分析,然后从索引数据库查询索引,最后将得到的结果返回给用户。 |
地址 |
518000 广东省深圳市南山区学苑大道1001号南山智园C1栋13楼 |