发明名称 一种文本分类方法及装置
摘要 本发明实施例涉及通信领域一种文本分类方法,对待分类文本进行分句,对每个句子进行依存句法分析,抽取出所有依存对作为抽取的决策单元;从知识库检索所述抽取的决策单元所属的类别;所述知识库中存储有作为分类依据的决策单元及所属的类别及权值;按类别累加所述抽取的决策单元权值之和;将所述权值之和最大的类别作为待分类文本的类别。本发明实施例还提供一种对应的文本分类装置。本发明实施例提供的文本分类方法及装置分类精确度高,冗余度小,且能够利用句法距离有效的进行冲突消解。
申请公布号 CN101937436A 申请公布日期 2011.01.05
申请号 CN200910088411.X 申请日期 2009.06.29
申请人 华为技术有限公司 发明人 张翼;陈儒;王震;高立琦;刘桂平
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京凯特来知识产权代理有限公司 11260 代理人 郑立明
主权项 一种文本分类方法,其特征在于,包括:对待分类文本进行分句,对每个句子进行依存句法分析,抽取出所有依存对作为抽取的决策单元;从知识库检索所述抽取的决策单元所属的类别,所述知识库中存储有作为分类依据的决策单元及所属的类别及权值;按类别累加所述抽取的决策单元权值之和;将所述权值之和最大的类别作为待分类文本的类别。
地址 518129 广东省深圳市龙岗区坂田华为总部办公楼