摘要 |
本发明涉及大数据并行数据挖掘,尤其是一种基于社交网络海量的数据信息挖掘兴趣人员的地理信息的模型。该模型包括海量数据存储与挖掘模块和软件功能模块,所述的数据存储与挖掘模块由前端服务器、地理信息位置配置库、数据预处理、大数据处理平台构成,软件功能模块加载在地理信息挖掘模型上。前端服务器用于抓取网络信息,数据预处理包含日志搜集和格式清洗两步,用于去掉一些记录不完全的坏数据,保证数据的格式统一,信息完整。大数据处理平台包含有1个名称节点处理单元和2个数据流多重处理器,进行快速、并行的数据挖掘,使数据信息在极短的时间内展现在用户面前。本发明将社交网络与大数据处理相结合,有效提高了地理信息提取的可靠性和速度。 |