发明名称 文本特征提取策略制定方法及装置、文本分类方法及装置
摘要 本发明公开了一种自适应文本分类方法。该方法包括步骤:将策略数据库中的文本特征提取策略之一映射到基于文本特征的文本分类器,并对于待分类语料进行文本分类;当所述策略数据库中的任意一个文本特征提取策略均不适用于所述待分类语料时,对于所述待分类语料进行全局样式分析,得到全局样式分析结果;对于经过所述全局样式分析的所述待分类语料进行局部样式分析,得到局部样式分析结果;将所述全局样式分析结果及所述局部样式分析结果整合成文本特征提取策略,并存储到策略数据库中;将所述文本特征提取策略映射到基于文本特征的文本分类器,并进行所述待分类语料的文本分类。
申请公布号 CN102163190A 申请公布日期 2011.08.24
申请号 CN201010120134.9 申请日期 2010.02.20
申请人 三星电子(中国)研发中心;三星电子株式会社 发明人 姜赢;王进;彭鸽;刘思培;胡晨
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京铭硕知识产权代理有限公司 11286 代理人 韩明星;王艳娇
主权项 一种用于文本分类的文本特征提取策略制定方法,包括步骤:对于待分类语料进行全局样式分析,得到全局样式分析结果;对经过全局样式分析的待分类语料进行局部样式分析,得到局部样式分析结果;将所述全局样式分析结果及所述局部样式分析结果整合成文本特征提取策略,并存储到策略数据库中。
地址 210008 江苏省南京市中山路268号汇杰广场8楼