发明名称 并行处理机器学决策树训练
摘要 本发明涉及并行处理机器学决策树训练。此处所公开的各实施例涉及通过基于图形处理单元(GPU)的机器学来生成决策树。例如,一个实施例提供了一种方法,包括,对于决策树的每个层级:在并行处理流水线的每个GPU处对示例集中的每个示例执行针对特征集中的一个特征的特征测试。方法进一步包括将特征测试的结果累积在本地存储器块中。该方法还包括,将累积的结果从每个本地存储器块的写入到全局存储器,以生成层级中的每个节点的特征的直方图,并且对于层级中的每个节点,根据直方图将具有最低熵的特征分配给该节点。
申请公布号 CN102566981B 申请公布日期 2015.01.14
申请号 CN201110443208.7 申请日期 2011.12.14
申请人 微软公司 发明人 M·菲诺齐奥;R·E·摩尔;R·M·盖斯;J·肖顿
分类号 G06F9/38(2006.01)I;G06N5/00(2006.01)I 主分类号 G06F9/38(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 蔡悦
主权项 一种用于从包括多个处理块的并行处理流水线生成决策树的方法(500),所述决策树包括组织为多个层级的多个节点,每个处理块包括多个图形处理单元(GPU),在同一处理块中的所述多个GPU的每一个共享一存储器块,该存储器块不由来自其它处理器块的GPU所使用,并且来自所述并行处理流水线的所有存储器块的所有GPU共享全局存储器,所述方法包括,对于所述决策树的每一层级:在所述并行处理流水线的每个GPU处对示例集中的每个示例执行(502)针对特征集中的特征的特征测试,其中所述示例集经由增强操作来生成,所述增强操作接收并分析输入数据以选择性地增加特定示例在所述示例集中的比例;在每个存储器块处累积(504)对由共享所述存储器块的多个GPU所处理的每个示例执行的每个特征测试结果的结果;将所累积的结果从每个存储器块写入(510)到所述全局存储器以生成所述层级中的每个节点的特征的直方图;以及对于层级中的每个节点,根据所述直方图将具有最低熵的特征分配(514)给该节点。
地址 美国华盛顿州