发明名称 一种基于共现的广告标签聚类的方法及系统
摘要 本发明公开一种基于共现的广告标签聚类的方法及系统,该方法包括:获取用户标签信息及广告的标签信息;根据所述用户标签信息及广告的标签信息计算出对应的用户标签信息与广告标签信息的相似度;根据所述相似度获取所述用户与所述广告的标签词共现语料,并将所获取的各个标签词共现语料构建成标签词共现语料对;根据标签词在语料中出现的次数计算出各个共现语料对中标签词的置信度;判断到所述置信度满足预先设定阈值时,结合已有标签词簇信息将所述标签词共现语料对中的标签词进行标签词簇的聚类。本发明节约了广告标签聚类的数据计算、处理过程中的计算资源。
申请公布号 CN105825396A 申请公布日期 2016.08.03
申请号 CN201610139776.0 申请日期 2016.03.11
申请人 合一网络技术(北京)有限公司 发明人 袁树仑;章岑;杨田;周盛;潘柏宇;王冀
分类号 G06Q30/02(2012.01)I;G06K9/62(2006.01)I 主分类号 G06Q30/02(2012.01)I
代理机构 北京市天玺沐泽专利代理事务所(普通合伙) 11532 代理人 鲍晓
主权项 一种基于共现的广告标签聚类的方法,其特征在于,包括:获取用户标签信息及广告的标签信息;根据所述用户标签信息及广告的标签信息计算出对应的用户标签信息与广告标签信息的相似度;根据所述相似度获取所述用户与所述广告的标签词共现语料,并将所获取的各个标签词共现语料构建成标签词共现语料对;根据标签词在语料中出现的次数计算出各个共现语料对中标签词的置信度;判断到所述置信度满足预先设定阈值时,结合已有标签词簇信息将所述标签词共现语料对中的标签词进行标签词簇的聚类。
地址 100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区