发明名称 一种少数类用户网络访问特征的选取方法
摘要 本发明公开了一种少数类用户网络访问特征的选取方法,涉及大数据分析领域,包括如下步骤:首先,从网关服务器下载日志,统计真实用户的网络访问数据,并组成初始数据集;其次,创建N名少数类的虚拟用户,构建虚拟数据集;再次,对虚拟数据集进行相关性分析,选取出与少数类用户显著相关的访问特征;最后,进行因子分析,进一步降低特征维数。本发明通过创建虚拟用户,自动平衡少数类用户的比例,使得在目标用户人数占比很小时,依然可以提取的网络访问特征。
申请公布号 CN105956187A 申请公布日期 2016.09.21
申请号 CN201610394392.3 申请日期 2016.06.03
申请人 重庆大学 发明人 牟超;周庆;胡月;孙启亮;孟瑶;全文君;廖凤露;尹春梅
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京康盛知识产权代理有限公司 11331 代理人 蔡智
主权项 一种少数类用户网络访问特征的选取方法,其特征在于,包括如下步骤:步骤一、从网关服务器下载日志,统计真实用户的网络访问数据,并组成初始数据集;其中,所述初始数据集的维数是m×d,m是总人数,d是特征数目,所述初始数据集的数据包含有符合指数分布的数据;步骤二、创建N名少数类的虚拟用户,构建虚拟数据集;其中,所述虚拟数据集的维度为(m+N)×d,所述虚拟数据集与初始数据集的数据满足概率同分布;步骤三、对虚拟数据集进行相关性分析,选取出与少数类用户显著相关的访问特征。
地址 400045 重庆市沙坪坝区沙正街174号