发明名称 一种基于词共现的汉语实体关系提取的控制方法及装置
摘要 本发明提供基于词共现的实体关系提取的控制方法,包括步骤:a.通过统计语料库中词语的共现频率计算词语相关度;b.根据所述词语相关度计算词语相似度;c.根据所述词语相似度确定实体关系。还提供相应的控制装置。本方法应用的语料库是新闻语料库,可以直接通过现有成熟的网页分析技术提取新闻正文和标题来构建语料库,不用太多人工参与去构建语料库,本方法应用自然语言处理中的浅语言规则如分词、词性标注和简单的统计技术便可以得到计算词语相关度时应用的词语频率,以及计算匹配相似度时考虑的词语位置、词语的词性和词语是不是动词等信息,将词语的语义信息和传统的模式匹配方法相结合。
申请公布号 CN102591862A 申请公布日期 2012.07.18
申请号 CN201110001355.9 申请日期 2011.01.05
申请人 华东师范大学 发明人 杨静;王晶;周凌琛;刘金盼;陈超;贺樑
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 隆天国际知识产权代理有限公司 72003 代理人 吴世华;冯志云
主权项 一种基于词共现和模式匹配的汉语实体关系提取的控制方法,其特征在于,包括如下步骤:b.基于语料库中词语的共现指标计算词语相关度;c.根据所述词语相关度计算词语间的相似度;g.根据所述词语相似度和模式匹配确定实体关系。
地址 200241 上海市东川路500号
您可能感兴趣的专利