发明名称 一种基于特征子空间的新闻分类方法及系统
摘要 本发明公开了一种基于特征子空间的新闻分类方法及系统,该方法包括:将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对若干个不相交的特征子空间中各个特征子空间进行训练,得到与各个特征子空间对应的子分类器;利用训练得到的子分类器对未标注样本进行分类,得到未标注样本的情绪倾向类别,并将已知情绪倾向类别的未标注样本更新至标注样本集中;利用标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到待分类新闻的情绪倾向类别。当获知待分类新闻的情绪倾向类别后,可以将待分类新闻划分到其含有的情绪倾向类别对应的新闻中,从而提高了用户浏览新闻时的体验度。
申请公布号 CN105022845A 申请公布日期 2015.11.04
申请号 CN201510530700.6 申请日期 2015.08.26
申请人 苏州大学张家港工业技术研究院 发明人 李寿山;张栋;刘欢欢;周国栋
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 罗满
主权项 一种基于特征子空间的新闻分类方法,其特征在于,包括:将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对若干个不相交的特征子空间中各个特征子空间进行训练,得到与所述各个特征子空间对应的子分类器;其中,所述已标注样本为已知情绪倾向类别的样本;利用训练得到的子分类器对未标注样本进行分类,得到所述未标注样本的情绪倾向类别,并将已知情绪倾向类别的所述未标注样本更新至标注样本集中;利用所述标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到所述待分类新闻的情绪倾向类别;其中,所述情绪倾向类别包括积极情绪类别和消极情绪类别。
地址 215600 江苏省苏州市张家港市长泾路10号