发明名称 一种目标数据排序方法及装置
摘要 本发明公开了一种目标数据排序方法及装置。其中,方法具体包括:获取所述目标数据的七个属性值;根据所述七个属性值,计算得到所述目标数据的排序值;判断所述排序值是否符合预设条件,若符合,则提交所述目标数据至排序系统进行排序;其中,七个属性值依次为目标数据的关键词点击率、关键词在搜索引擎中设置的匹配模式示性值、目标数据中是否包含通配符、目标数据的网页地址URL的分类编号、目标数据的标题与所述关键词的匹配度、目标数据的描述2与所述关键词的匹配度、关键词所在单元的规模示性值。利用本发明,可以提高提交目标数据至排序系统的效率,从而提高排序系统对目标数据的排序效率。
申请公布号 CN103034718B 申请公布日期 2016.07.06
申请号 CN201210536908.5 申请日期 2012.12.12
申请人 北京博雅立方科技有限公司 发明人 王汉生;常莹;裴向宇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王宝筠
主权项 一种目标数据排序方法,其特征在于,所述方法包括:获取所述目标数据的七个属性值;根据所述七个属性值,计算得到所述目标数据的排序值;判断所述排序值是否符合预设条件,若符合,则提交所述目标数据至排序系统进行排序;其中,所述获取所述目标数据的七个属性值包括:获取所述目标数据的关键词点击率;获取所述关键词在搜索引擎中设置的匹配模式示性值;其中,所述匹配模式体现为广泛匹配、短语匹配、精确匹配;判断所述目标数据中是否包含通配符并生成判断结果的示性值;获取所述目标数据的网页地址URL的分类编号;获取所述目标数据的标题与所述关键词的匹配度;获取所述目标数据的第二描述部分与所述关键词的匹配度,所述第二描述是指描述广告的文字;获取所述关键词所在单元的规模示性值;所述获取所述关键词所在单元的规模示性值包括:获得所述关键词所在单元的相似关键词个数;判断所述个数是否超过一定阈值;若超过,则确定所述规模示性值为0,若未超过,则确定所述规模示性值为1;所述根据所述属性值,计算得到所述目标数据的排序值包括:将所述七个属性值输入定序回归模型,求解所述定序回归模型,计算得到所述目标数据取不同排序等级k<sub>1</sub>、k<sub>2</sub>、k<sub>3</sub>时的概率值;其中,所述定序回归模型具体为:<img file="FDA0000970848560000011.GIF" wi="1053" he="226" />Y、k表示所述目标数据的排序等级,p(Y=k|X)表示Y取k值的概率;Φ(x)为标准正态分布的分布密度函数,c<sub>1</sub>、c<sub>2</sub>为所述模型的阈值,β=(β<sub>0</sub>,β<sub>1</sub>,...,β<sub>7</sub>)为所述模型的回归系数;X=(x<sub>1</sub>,x<sub>2</sub>,x<sub>3</sub>,x<sub>4</sub>,x<sub>5</sub>,x<sub>6</sub>,x<sub>7</sub>),所述x<sub>1</sub>,x<sub>2</sub>,x<sub>3</sub>,x<sub>4</sub>,x<sub>5</sub>,x<sub>6</sub>,x<sub>7</sub>分别表示所述关键词点击率、所述匹配模式、所述判断结果、所述分类编号、所述目标数据的标题与所述关键词的匹配度、所述目标数据的第二描述部分与所述关键词的匹配度以及所述关键词所在单元的规模示性值,X'表示X的转置;确定最大的概率值对应的排序等级为所述目标数据的排序值。
地址 100027 北京市朝阳区东三环北路甲2号京信大厦13层1328室