发明名称 用于分类文本以及构造文本分类器的方法和装置
摘要 一种文本分类器,以及通过确定用于该文本分类器的适当参数,构造该分类器的方法。
申请公布号 CN1310825A 申请公布日期 2001.08.29
申请号 CN99808930.3 申请日期 1999.06.22
申请人 微软公司 发明人 苏姗·T·杜迈斯;戴维·海克曼;埃里克·霍尔维茨;约汉·C·普拉特;梅兰·萨哈米
分类号 G06F17/30 主分类号 G06F17/30
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 酆迅
主权项 1.一种用于根据文本信息对象训练集生成分类器之参数以便确定文本信息对象是否属于该种类的方法,其中各文本信息对象或者属于某个种类,或者不属于某个种类,该方法包括以下步骤:a)从文本信息对象中抽取特征,以便为训练集的各文本信息对象,生成具有许多特征的关联特征向量;b)精简各特征向量的特征数目,以便为训练集的各文本信息对象,生成关联的精简特征向量;c)通过训练支持向量机,确定该分类器的权重向量;以及d)确定该分类器使用的单调函数。
地址 美国华盛顿