发明名称 |
文本表示方法和装置 |
摘要 |
本发明涉及文本分析,其公开一种文本表示方法,包括:利用知识库识别文本中的概念并确定概念之间的关系;利用所述概念之间的关系生成概念图;确定所述概念图的连通分量;计算所述连通分量的权重;根据连通分量的权重确定表示该文本的概念。根据本发明实施例的方法利用了知识库中概念之间的相关性,根据图的连通分量理论,找出最能够代表文本主题的一组概念,而将和主题无关的概念去除掉,提高了文本表达的准确度,减少了噪音。 |
申请公布号 |
CN105701083A |
申请公布日期 |
2016.06.22 |
申请号 |
CN201410705205.X |
申请日期 |
2014.11.28 |
申请人 |
国际商业机器公司 |
发明人 |
倪渊;祝慧佳;许琼恺;曹锋 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京市中咨律师事务所 11247 |
代理人 |
于静;张亚非 |
主权项 |
一种文本表示方法,包括:利用知识库识别文本中的概念并确定概念之间的关系;利用所述概念之间的关系生成概念图;确定所述概念图的连通分量;计算所述连通分量的权重;根据所述连通分量的权重确定表示该文本的概念。 |
地址 |
美国纽约 |