发明名称 |
一种基于用户行为的特征提取、个性化推荐的方法和系统 |
摘要 |
本申请实施例提供了一种基于用户行为的特征提取方法,包括:收集用户的原始行为信息,依据所述用户的原始行为信息生成用户行为数据点;所述用户行为数据点包括用户标识、维度标识及对应的维度分值;按照所述维度标识采用维度分值对所述用户行为数据点进行聚类,形成多个聚类空间;分别针对所述多个聚类空间中用户行为数据点的维度分值进行二值化;依据二值化的结果提取满足预设要求的一个或多个维度标识作为聚类空间的特征维度。本申请实施例采用了分布式计算,总体运算时间大幅减少。针对海量数据输入的条目超多和条目维度超多的问题,采用对数据分块计算的方法,对中间结果分块表达,解决了I/O过大问题。 |
申请公布号 |
CN104239324A |
申请公布日期 |
2014.12.24 |
申请号 |
CN201310239508.2 |
申请日期 |
2013.06.17 |
申请人 |
阿里巴巴集团控股有限公司 |
发明人 |
张旭;杨志雄;李波;苏煜 |
分类号 |
G06F17/30(2006.01)I;G06Q30/02(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
赵娟 |
主权项 |
一种基于用户行为的特征提取方法,其特征在于,包括:收集用户的原始行为信息,依据所述用户的原始行为信息生成用户行为数据点;所述用户行为数据点包括用户标识、维度标识及对应的维度分值;按照所述维度标识采用维度分值对所述用户行为数据点进行聚类,形成多个聚类空间;分别针对所述多个聚类空间中用户行为数据点的维度分值进行二值化;依据二值化的结果提取满足预设要求的一个或多个维度标识作为聚类空间的特征维度。 |
地址 |
英属开曼群岛大开曼资本大厦一座四层847号邮箱 |