发明名称 |
一种文本分类方法及装置 |
摘要 |
本发明实施例涉及通信领域一种文本分类方法,对待分类文本进行分句,对每个句子进行依存句法分析,抽取出所有依存对作为抽取的决策单元;从知识库检索所述抽取的决策单元所属的类别;所述知识库中存储有作为分类依据的决策单元及所属的类别及权值;按类别累加所述抽取的决策单元权值之和;将所述权值之和最大的类别作为待分类文本的类别。本发明实施例还提供一种对应的文本分类装置。本发明实施例提供的文本分类方法及装置分类精确度高,冗余度小,且能够利用句法距离有效的进行冲突消解。 |
申请公布号 |
CN101937436A |
申请公布日期 |
2011.01.05 |
申请号 |
CN200910088411.X |
申请日期 |
2009.06.29 |
申请人 |
华为技术有限公司 |
发明人 |
张翼;陈儒;王震;高立琦;刘桂平 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京凯特来知识产权代理有限公司 11260 |
代理人 |
郑立明 |
主权项 |
一种文本分类方法,其特征在于,包括:对待分类文本进行分句,对每个句子进行依存句法分析,抽取出所有依存对作为抽取的决策单元;从知识库检索所述抽取的决策单元所属的类别,所述知识库中存储有作为分类依据的决策单元及所属的类别及权值;按类别累加所述抽取的决策单元权值之和;将所述权值之和最大的类别作为待分类文本的类别。 |
地址 |
518129 广东省深圳市龙岗区坂田华为总部办公楼 |