发明名称 一种基于本体的医学文档语义关联检索方法
摘要 本发明公开了一种基于本体的医学文档语义关联检索方法,包括以下步骤:A、对XML文档进行解析,识别XML文档标记;B、使用基于链接的Rock分类算法对文档标记进行分类,并以本体语言OWL描述分类结果,构建XML文档聚类本体;C、利用D2R语义数据转换器将解析后的XML文档标记及文本数据转化为XML文档聚类本体的实例,以语义网资源描述框架三元组形式存储;D、使用基于简单路径Xpath的向量检索算法进行检索。本方案能够实现全文的相似性检索以及对检索结果的相关性估计,用户不需要对文档结构非常了解,即可获取经过完整、准确的查询结果。本方案适用于医学文档的存储和检索处理。
申请公布号 CN105117397A 申请公布日期 2015.12.02
申请号 CN201510344332.6 申请日期 2015.06.18
申请人 浙江大学 发明人 李劲松;王昱;周天舒;田雨;童丹阳
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州杭诚专利事务所有限公司 33109 代理人 王江成;卢金元
主权项 一种基于本体的医学文档语义关联检索方法,其特征在于,包括以下步骤:A、对XML文档进行解析,识别XML文档标记;B、使用基于链接的Rock分类算法对文档标记进行分类,即对所有语义相近的标记和一组上下文相似的标记,计算其分类良好度,使最终分类结果中每一类文档标记都满足分类基准方程取到最大值;最后以本体语言OWL描述分类结果,构建XML文档聚类本体;C、利用D2R语义数据转换器将解析后的XML文档标记及文本数据转化为XML文档聚类本体的实例,以语义网资源描述框架三元组形式存储;D、使用基于简单路径Xpath的向量检索算法进行检索。
地址 310058 浙江省杭州市西湖区余杭塘路866号