发明名称 一种移动广告平台寻找相似用户的方法
摘要 本发明公开的一种移动广告平台寻找相似用户的方法,包含以下步骤:首先根据训练用户过滤之后的安装列表以及标签训练出一个L2正则的逻辑回归模型。对于一个新的用户安装列表,利用训练出的逻辑回归模型得到一个[0,1]之间的预测值,表示其为相似用户的概率。接着计算该用户安装列表中付费应用数,基本应用占比,平均付费价格特征,将这些特征与上一步的逻辑回归模型结果组合在一起,再训练出一个GBDT模型,最终预测用户是否为相似用户。本发明的方法,在较小计算量下,根据客户提供的种子用户,准确的将相似用户扩展出来。
申请公布号 CN106204103A 申请公布日期 2016.12.07
申请号 CN201610488630.7 申请日期 2016.06.24
申请人 有米科技股份有限公司 发明人 李百川;陈第;李展铿;蔡锐涛;甄勇
分类号 G06Q30/02(2012.01)I;G06K9/62(2006.01)I 主分类号 G06Q30/02(2012.01)I
代理机构 广州市华学知识产权代理有限公司 44245 代理人 黄磊;陈宏升
主权项 一种移动广告平台寻找相似用户的方法,其特征在于,包含以下步骤:(1)目标App的开发者提交目标App现有的种子用户设备号列表;(2)获取目标App的非相似用户设备号列表;(3)利用系统级别的API获取到移动用户的App安装包列表;(4)安装包过滤:计算移动用户每个App的设备覆盖率,将设备覆盖率大于阈值M或者小于阈值N的App从App安装包列表里面剔除;其中阈值M、N根据实际需求设定,M大于N;(5)采用bag‑of‑words方法将移动用户安装包列表中剩下的app表达成1/0特征;(6)根据用户特征、种子用户设备号列表和非相似客户设备号列表,训练一个逻辑回归模型;(7)计算移动用户的三种特征:安装的基本应用比例、付费应用数、平均付费价格;(8)将逻辑回归模型的输出以及所述移动用户的三种特征作为输入,再训练出GBDT分类模型;(9)对候选集的每个移动用户,通过获取该移动用户的App安装列表,并将App安装列表表达成一个bag‑of‑words向量,先输入到逻辑回归模型中进行一遍预测,再加入用户安装的基本应用比例、付费应用数、平均付费价格这三个特征输入到GBDT模型中进行预测,从而预测该用户是否为种子用户的相似用户。
地址 510006 广东省广州市番禺区小谷围街外环东路232号13栋B232
您可能感兴趣的专利