发明名称 |
一种基于模糊认知图的文档语义自动生成方法 |
摘要 |
本发明涉及一种文档语义自动生成方法,特别是涉及一种基于模糊认知图的文档语义自动生成方法。通过模糊认知图对文档的段落进行语义表示,基于模糊认知图的合并实现整个文档的语义表示。其步骤包括:首先对文档进行预处理:包括文档分段、分句及分词处理;其次,将各个具有原子语义的段落都转化为对应的原子认知图;第三,将各个具有原子语义的段落原子认知图组合成段落认知图;第四,由同一篇文档的原子认知图和段落认知图组合成文档认知图,从而实现文档知识的表示。本发明的方法能提高文档语义表示的自动化程度,并能方便应用于Web环境下海量网页文本的语义表示,进而提高web搜索的查准率。 |
申请公布号 |
CN102135955A |
申请公布日期 |
2011.07.27 |
申请号 |
CN201110093326.X |
申请日期 |
2011.04.14 |
申请人 |
上海红神信息技术有限公司;中国人民解放军信息工程大学 |
发明人 |
邬江兴;罗兴国;刘超;魏晓;曹伟;骆祥峰;斯雪明;雷咏梅;贾云杰 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
郑州大通专利商标代理有限公司 41111 |
代理人 |
白毅明 |
主权项 |
一种基于模糊认知图的文档语义自动生成方法,其特征是:首先,对文档进行预处理:包括文档分段、分句及分词处理;其次,将各个具有原子语义的段落都转化为对应的原子认知图;第三,将各个具有原子语义的段落原子认知图组合成段落认知图;第四,由同一篇文档的原子认知图和段落认知图组合成文档认知图,从而实现文档知识的表示。 |
地址 |
上海市闵行区联航路1588号3A业务楼5楼 |