发明名称 文本可理解性的度量方法
摘要 本发明涉及一种文本可理解性的度量方法,它是通过定义单篇文本为一个若干关键词和句子组成的矩阵;再对矩阵中句子之间的关联关系进行计算来度量该文本的可理解性。本发明其核心是把文本的理解过程看作是对该文本中句子之间关联关系的提取和计算过程,从而来度量文本的可理解性。该方法可以计算文本中句子之间的逻辑关系,从而便于计算机进行处理。本发明可以为实现基于机器的文本理解提供技术解决方案。
申请公布号 CN101520774A 申请公布日期 2009.09.02
申请号 CN200910048310.X 申请日期 2009.03.26
申请人 上海大学 发明人 骆祥峰;方宁;徐炜民;刘方方
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 上海上大专利事务所(普通合伙) 代理人 何文欣
主权项 1. 一种文本可理解性的度量方法,其特征在于操作步骤如下:(1)统计一篇文本中的关键词和句子,所述关键词就是该文本中具有重要含义的名词和动词;(2)根据所述关键词是否在相应的句子上出现来计算每两个句子之间的关联关系权重;(3)根据多个相连句子之间的逻辑结构来计算多个相连句子之间的关联关系权重,从而度量该文本的可理解性。
地址 200444上海市宝山区上大路99号