发明名称 基于决策树的搜索结果排序方法及其装置
摘要 本发明涉及数据搜索技术领域,公开了一种基于决策树的搜索结果排序方法及其装置。本发明中排序方法包括以下步骤:获取建立至少一棵用于排序的决策树所需的训练集;将决策树的计算系统分为N个特征进程组,该N个特征进程组分别对应N个训练特征;通过特征进程组计算每棵决策树的最优分裂结点和对应最优分裂结点的最优分裂值,并根据最优分裂结点和最优分裂值建立每棵决策树;基于所有决策树对搜索结果进行排序。本发明的排序方法可在排序训练集中训练数据量极大时,如亿万级别的,极大程度的降低计算所消耗的时间。尤其是在搜索引擎对应的数据库数据量庞大的情况下,可快速准确训练出优质的用于排序的决策树模型。
申请公布号 CN105718493A 申请公布日期 2016.06.29
申请号 CN201410742828.4 申请日期 2014.12.05
申请人 阿里巴巴集团控股有限公司 发明人 王志伟;潘晓彤;刘忠义;魏虎
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海一平知识产权代理有限公司 31266 代理人 须一平;成春荣
主权项 一种基于决策树的搜索结果排序方法,其特征在于,包括以下步骤:获取建立至少一棵用于排序的决策树所需的训练集,所述训练集包括N个训练特征,其中,N大于等于2;将所述决策树的计算系统分为N个特征进程组,该N个特征进程组分别对应所述N个训练特征;通过所述特征进程组计算每棵所述决策树的最优分裂结点和对应所述最优分裂结点的最优分裂值,并根据所述最优分裂结点和最优分裂值建立每棵所述决策树;基于所有所述决策树对搜索结果进行排序。
地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱