发明名称 基于拓扑网络的大数据分析方法
摘要 本发明涉及网络技术领域,具体地说是一种能够有效提高检索准确度和全面性、降低漏检率的基于拓扑网络的大数据分析方法,其特征在于包括从数据库中抽取样本数据进行预处理,设定检索顺序,建立检索子模型,索子模型对输入的样本数据进行运算,当具有外部参数时,构建网络拓扑图并通过检索子模型在数据库中基于网络拓扑图进行挖掘,本发明与现有技术相比,采用高效的优化方法和抽样方法,使得大数据集合在存储和运算挖掘过程中更高效,具有漏检率低、检索全面等显著的优点。
申请公布号 CN104731851A 申请公布日期 2015.06.24
申请号 CN201410783095.9 申请日期 2014.12.16
申请人 芜湖乐锐思信息咨询有限公司 发明人 刘焰龙;殷晋
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于拓扑网络的大数据分析方法,其特征在于包括以下步骤:步骤1:从数据库中抽取样本数据进行预处理,先对每个样本数据赋唯一的id编号,并设定对该样本数据的检索类型T<sub>i</sub>,然后根据样本数据归属的数据检索类型对样本数据进行初步分类;步骤2:设定检索顺序,即获取所述样本数据的id编号以及检索类型;步骤3:建立检索子模型,按照不同的检索顺序依次将样本数据送入多个检索子模型中;步骤4:检索子模型对输入的样本数据进行运算,同时判断本次输入的样本数据是否有外部参数,外部参数指用于向该样本数据的变量传递数据的参数,如果具有外部参数,则调用该外部参数后执行当前检索子模型,其中当具有外部参数时,首先对外部参数进行一致化处理,然后提取处理后的外部参数,将其与预先存储的购买词进行相关性匹配,获得预先存储的相关词与检索需求数据之间至少一个相关性数据源,对所获的相关性数据构建网络拓扑图,并通过检索子模型在数据库中基于网络拓扑图进行挖掘;步骤5:输出检索结果。
地址 241000 安徽省芜湖市镜湖区莲塘新村瑞丰园B幢07号