发明名称 |
文本语义的可视化表示与获取方法 |
摘要 |
本发明涉及一种文本语义的可视化表示与获取方法,它是将文本语义划分为三个层次:离散的关键词的集合构成的文本低层语义、文本段落构成的文本主题作为文本的中层语义和由文本主题之间相互链接而构成文本篇章的高层语义;通过提取关键词和基于关键词权重的矩阵运算生成文本主题的语义矩阵,再通过文本主题的链接形成文本篇章语义。本发明能有效地利用文本数据中的上下文依赖关系进行更有效的语义提取,从而能有效提高复杂数据对象的语义提取的准确率;通过根据数据对象的内部结构将其分解为具有不同粒度结点的多层描述,通过建模结点间的上下文结构来刻画结点间的主题相关关系;用权重来度量关键词之间、关键词对文本主题之间、以及文本主题之间的相关程度。该方法可以分层次、简捷高效地获取和表示文本的语义,便于计算机掌握和进行理解处理。 |
申请公布号 |
CN101067807A |
申请公布日期 |
2007.11.07 |
申请号 |
CN200710041147.5 |
申请日期 |
2007.05.24 |
申请人 |
上海大学 |
发明人 |
骆祥峰;方宁;徐炜民 |
分类号 |
G06F17/27(2006.01);G06F17/30(2006.01) |
主分类号 |
G06F17/27(2006.01) |
代理机构 |
上海上大专利事务所 |
代理人 |
何文欣 |
主权项 |
1.一种文本语义的可视化表示与获取方法,其特征在于将文本语义划分为三个层次:离散的关键词的集合构成的文本低层语义、文本段落构成的文本主题作为文本的中层语义和由文本主题之间相互链接而构成文本篇章的高层语义;通过提取关键词和基于关键词权重的矩阵运算生成文本主题的语义矩阵,再通过文本主题的链接形成文本篇章语义。 |
地址 |
200444上海市宝山区上大路99号 |