发明名称 |
一种移动广告平台寻找相似用户的方法 |
摘要 |
本发明公开的一种移动广告平台寻找相似用户的方法,包含以下步骤:首先根据训练用户过滤之后的安装列表以及标签训练出一个L2正则的逻辑回归模型。对于一个新的用户安装列表,利用训练出的逻辑回归模型得到一个[0,1]之间的预测值,表示其为相似用户的概率。接着计算该用户安装列表中付费应用数,基本应用占比,平均付费价格特征,将这些特征与上一步的逻辑回归模型结果组合在一起,再训练出一个GBDT模型,最终预测用户是否为相似用户。本发明的方法,在较小计算量下,根据客户提供的种子用户,准确的将相似用户扩展出来。 |
申请公布号 |
CN106204103A |
申请公布日期 |
2016.12.07 |
申请号 |
CN201610488630.7 |
申请日期 |
2016.06.24 |
申请人 |
有米科技股份有限公司 |
发明人 |
李百川;陈第;李展铿;蔡锐涛;甄勇 |
分类号 |
G06Q30/02(2012.01)I;G06K9/62(2006.01)I |
主分类号 |
G06Q30/02(2012.01)I |
代理机构 |
广州市华学知识产权代理有限公司 44245 |
代理人 |
黄磊;陈宏升 |
主权项 |
一种移动广告平台寻找相似用户的方法,其特征在于,包含以下步骤:(1)目标App的开发者提交目标App现有的种子用户设备号列表;(2)获取目标App的非相似用户设备号列表;(3)利用系统级别的API获取到移动用户的App安装包列表;(4)安装包过滤:计算移动用户每个App的设备覆盖率,将设备覆盖率大于阈值M或者小于阈值N的App从App安装包列表里面剔除;其中阈值M、N根据实际需求设定,M大于N;(5)采用bag‑of‑words方法将移动用户安装包列表中剩下的app表达成1/0特征;(6)根据用户特征、种子用户设备号列表和非相似客户设备号列表,训练一个逻辑回归模型;(7)计算移动用户的三种特征:安装的基本应用比例、付费应用数、平均付费价格;(8)将逻辑回归模型的输出以及所述移动用户的三种特征作为输入,再训练出GBDT分类模型;(9)对候选集的每个移动用户,通过获取该移动用户的App安装列表,并将App安装列表表达成一个bag‑of‑words向量,先输入到逻辑回归模型中进行一遍预测,再加入用户安装的基本应用比例、付费应用数、平均付费价格这三个特征输入到GBDT模型中进行预测,从而预测该用户是否为种子用户的相似用户。 |
地址 |
510006 广东省广州市番禺区小谷围街外环东路232号13栋B232 |