发明名称 一种基于模糊认知图的文档语义自动生成方法
摘要 本发明涉及一种文档语义自动生成方法,特别是涉及一种基于模糊认知图的文档语义自动生成方法。通过模糊认知图对文档的段落进行语义表示,基于模糊认知图的合并实现整个文档的语义表示。其步骤包括:首先对文档进行预处理:包括文档分段、分句及分词处理;其次,将各个具有原子语义的段落都转化为对应的原子认知图;第三,将各个具有原子语义的段落原子认知图组合成段落认知图;第四,由同一篇文档的原子认知图和段落认知图组合成文档认知图,从而实现文档知识的表示。本发明的方法能提高文档语义表示的自动化程度,并能方便应用于Web环境下海量网页文本的语义表示,进而提高web搜索的查准率。
申请公布号 CN102135955A 申请公布日期 2011.07.27
申请号 CN201110093326.X 申请日期 2011.04.14
申请人 上海红神信息技术有限公司;中国人民解放军信息工程大学 发明人 邬江兴;罗兴国;刘超;魏晓;曹伟;骆祥峰;斯雪明;雷咏梅;贾云杰
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 郑州大通专利商标代理有限公司 41111 代理人 白毅明
主权项 一种基于模糊认知图的文档语义自动生成方法,其特征是:首先,对文档进行预处理:包括文档分段、分句及分词处理;其次,将各个具有原子语义的段落都转化为对应的原子认知图;第三,将各个具有原子语义的段落原子认知图组合成段落认知图;第四,由同一篇文档的原子认知图和段落认知图组合成文档认知图,从而实现文档知识的表示。
地址 上海市闵行区联航路1588号3A业务楼5楼