发明名称 | 一种基于本体的医学文档语义关联检索方法 | ||
摘要 | 本发明公开了一种基于本体的医学文档语义关联检索方法,包括以下步骤:A、对XML文档进行解析,识别XML文档标记;B、使用基于链接的Rock分类算法对文档标记进行分类,并以本体语言OWL描述分类结果,构建XML文档聚类本体;C、利用D2R语义数据转换器将解析后的XML文档标记及文本数据转化为XML文档聚类本体的实例,以语义网资源描述框架三元组形式存储;D、使用基于简单路径Xpath的向量检索算法进行检索。本方案能够实现全文的相似性检索以及对检索结果的相关性估计,用户不需要对文档结构非常了解,即可获取经过完整、准确的查询结果。本方案适用于医学文档的存储和检索处理。 | ||
申请公布号 | CN105117397A | 申请公布日期 | 2015.12.02 |
申请号 | CN201510344332.6 | 申请日期 | 2015.06.18 |
申请人 | 浙江大学 | 发明人 | 李劲松;王昱;周天舒;田雨;童丹阳 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 杭州杭诚专利事务所有限公司 33109 | 代理人 | 王江成;卢金元 |
主权项 | 一种基于本体的医学文档语义关联检索方法,其特征在于,包括以下步骤:A、对XML文档进行解析,识别XML文档标记;B、使用基于链接的Rock分类算法对文档标记进行分类,即对所有语义相近的标记和一组上下文相似的标记,计算其分类良好度,使最终分类结果中每一类文档标记都满足分类基准方程取到最大值;最后以本体语言OWL描述分类结果,构建XML文档聚类本体;C、利用D2R语义数据转换器将解析后的XML文档标记及文本数据转化为XML文档聚类本体的实例,以语义网资源描述框架三元组形式存储;D、使用基于简单路径Xpath的向量检索算法进行检索。 | ||
地址 | 310058 浙江省杭州市西湖区余杭塘路866号 |