发明名称 |
一种互联网信息采集系统 |
摘要 |
本发明涉及互联网领域,尤其涉及一种互联网信息采集系统。信息源识别单元,用于根据用户输入的关键字,识别关联于关键字的信息源,获取信息源的路径;信息采集单元用于根据路径获取关联于信息源的信息;过滤分析单元用于对采集的信息进行识别分析,过滤与关键字无关联关系的信息;语义分析单元用于对存储的信息进行语义解析;数据分析单元用于获取经过语义解析的信息,并对信息进行分析,获得分析结果。本发明的有益效果是,能够通过对信息源的识别,在获取信息前首先通过筛选到符合用户要求的信息源,通过信息源能够较系统和全面的获取需要的信息,进而为需要的用户提供数据参考以及决策支持。 |
申请公布号 |
CN105447202A |
申请公布日期 |
2016.03.30 |
申请号 |
CN201511032832.2 |
申请日期 |
2015.12.31 |
申请人 |
宁波公众信息产业有限公司 |
发明人 |
方净 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海申新律师事务所 31272 |
代理人 |
党蕾 |
主权项 |
一种互联网信息采集系统,其特征在于,包括:信息源识别单元,用于根据用户输入的关键字,识别关联于所述关键字的信息源,获取所述信息源的路径;信息采集单元,连接所述信息源识别单元,用于根据所述路径获取关联于所述信息源的信息;过滤分析单元,连接所述信息采集单元,用于对采集的所述信息进行识别分析,过滤与所述关键字无关联关系的所述信息;语义分析单元,连接所述过滤分析单元,用于对存储的所述信息进行语义解析;数据分析单元,连接所述语义分析单元,用于获取经过所述语义解析的所述信息,并对所述信息进行分析,获得分析结果。 |
地址 |
315000 浙江省宁波市高新区创苑路750号D座5楼 |