发明名称 文本表示方法和装置
摘要 本发明涉及文本分析,其公开一种文本表示方法,包括:利用知识库识别文本中的概念并确定概念之间的关系;利用所述概念之间的关系生成概念图;确定所述概念图的连通分量;计算所述连通分量的权重;根据连通分量的权重确定表示该文本的概念。根据本发明实施例的方法利用了知识库中概念之间的相关性,根据图的连通分量理论,找出最能够代表文本主题的一组概念,而将和主题无关的概念去除掉,提高了文本表达的准确度,减少了噪音。
申请公布号 CN105701083A 申请公布日期 2016.06.22
申请号 CN201410705205.X 申请日期 2014.11.28
申请人 国际商业机器公司 发明人 倪渊;祝慧佳;许琼恺;曹锋
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京市中咨律师事务所 11247 代理人 于静;张亚非
主权项 一种文本表示方法,包括:利用知识库识别文本中的概念并确定概念之间的关系;利用所述概念之间的关系生成概念图;确定所述概念图的连通分量;计算所述连通分量的权重;根据所述连通分量的权重确定表示该文本的概念。
地址 美国纽约