发明名称 一种基于用户真实流量数据补全App的Host/Url特征集的方法
摘要 本发明公开了一种基于用户真实流量数据补全App的Host/Url特征集的方法,该方法首先从初始Host/Url特征集中选取种子。然后在不同用户的流量数据中分别提取出候选特征集,并对这些候选特征集进行关联分析,将提取的频繁项补全到该App的Host/Url特征集中。由于补全特征直接来源于用户的流量数据,本发明提出的方法不仅实现较为便捷,还更能贴近用户的对App的真实使用。
申请公布号 CN106534081A 申请公布日期 2017.03.22
申请号 CN201610928649.9 申请日期 2016.10.31
申请人 浙江大学 发明人 王程浩;杜歆;钱秀莹
分类号 H04L29/06(2006.01)I;H04L29/08(2006.01)I;G06F17/30(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 邱启旺
主权项 一种基于用户真实流量数据补全App的Host/Url特征集的方法,其特征在于,该方法包括以下步骤:(1)从某个App的初始Host/Url特征集中选取种子特征集,记为{url<sub>seed</sub>}。(2)对种子特征集{url<sub>seed</sub>}中的每个成员,都在多用户的真实流量数据中进行特征补全。(3)从补全后的特征集中选取新的种子,构成新的种子特征集,迭代地进行特征补全,直到不再得到新的种子为止。
地址 310058 浙江省杭州市西湖区余杭塘路866号