发明名称 |
用于计算类别比例的系统和方法 |
摘要 |
提供了用于基于语言来分类文本的系统和方法。计算机实现的方法包括接收元素的训练集合,在训练集合中的每个元素被分配给多个类别之一并具有与其相关的多个内容简档之一;接收元素的总体集合,在总体集合中的每个元素具有与其相关的多个内容简档之一;以及使用堆叠回归算法、偏差公式算法、噪声消除算法以及由多个算术方法组成的汇总方法中的至少一个基于与训练集合中的元素相关的内容简档和分配到训练集合中的元素的类别以及与总体集合中的元素相关的内容简档来计算总体集合的元素在类别上的分布,其中,所述多个算术方法的结果被平均化。 |
申请公布号 |
CN104364781A |
申请公布日期 |
2015.02.18 |
申请号 |
CN201380026232.8 |
申请日期 |
2013.05.22 |
申请人 |
克雷姆森海科斯康有限公司 |
发明人 |
A·菲拉特;M·布鲁克斯;C·宾汉姆;A·赫德安格迪伦;G·金 |
分类号 |
G06F17/00(2006.01)I |
主分类号 |
G06F17/00(2006.01)I |
代理机构 |
北京泛华伟业知识产权代理有限公司 11280 |
代理人 |
王勇;李科 |
主权项 |
一种由计算机处理器执行的计算机实现的方法,包括:(a)由所述计算机处理器接收元素的训练集合,在所述训练集合中的每个元素被分配给多个类别之一并具有与其相关的多个内容简档之一;(b)由所述计算机处理器接收元素的总体集合,在所述总体集合中的每个元素具有与其相关的所述多个内容简档之一;以及(c)由所述计算机处理器应用堆叠回归方法基于与所述训练集合中的元素相关的内容简档和分配到所述训练集合中的元素的类别以及与所述总体集合中的元素相关的内容简档来计算所述总体集合的元素在所述类别上的分布。 |
地址 |
美国马萨诸塞州 |