发明名称 一种基于知识库的医院信息搜索引擎及系统
摘要 本发明基于知识库的医疗搜索引擎及系统,抓取中文医疗健康目录构建原始医疗网页库;对原始医疗网页库中的网页进行相关信息抽取,提取对医院、科室、医生的评论信息,构建医疗评论信息库;使用词频统计和调查问卷,对抽取的相关信息进行医疗评论属性字段提取,提取观点短语,观点短语倾向性分析,给出评论评论信息是正面或是反面的分析结果,确定医院、科室、医生的排名;根据医疗知识库对搜索结果进行排序,将高度结构化和高度相关的信息提供给用户。本发明针对通用搜索引擎结果信息是非结构化、相关度和准确度低等缺点,构建医疗知识库,为用户提供高度结构化的医疗信息,提高用户查询医疗信息相关度和准确率,能有效提高搜索结果的准确率和召回率。
申请公布号 CN101441636A 申请公布日期 2009.05.27
申请号 CN200710177798.7 申请日期 2007.11.21
申请人 中国科学院自动化研究所 发明人 戴汝为;缪庆亮;李秋丹;耿光刚;王春恒
分类号 G06F17/30(2006.01)I;G06F19/00(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中科专利商标代理有限责任公司 代理人 梁爱荣
主权项 1、一种基于知识库的医疗信息搜索引擎系统,其特征在于,包括:用户端,与搜索引擎用户端接口连接,用于将疾病名称送入搜索引擎用户端接口;搜索引擎用户端接口,与查询分解模块连接,用于将疾病名称信息送入查询分解模块;用于接收排序模块的医院排序结果和医生信息;查询分解模块,与索引模块连接,用于将分解后的疾病名称信息送入索引模块;索引模块,分别与排序模块和索引器连接,用于排序模块输入原始网页库中与疾病匹配的网页内容信息;用于接收索引器建立的索引信息;排序模块,分别与医疗信息知识库、索引模块和搜索引擎用户端接口连接,用于接收医疗信息知识库的医院排名信息和索引文件中与查询词相关的索引信息,用于输出最后医院排名信息和医生信息;索引器,分别与原始医疗网页库和索引模块连接,用于接收原始医疗网页库的网页信息,用于输出原始网页库中网页的索引信息;医疗信息知识库,分别与排序模块和医疗评论信息库连接,用于接收医疗评论信息库中的评论信息,用于输出医院排名信息;医疗评论信息库,分别与原始医疗网页库和医疗信息知识库连接,用于接收原始医疗网页库的网页信息,用于输出医疗评论信息;原始医疗网页库,分别与医疗评论信息库、爬虫和索引器连接,用于存储爬虫抓取的原始医疗网页,用于输出原始医疗网页信息;爬虫,分别与万维网和原始医疗网页库,用于接收需要抓取的网页URL网址信息,用于输出原始医疗网页源代码信息。
地址 100080北京市海淀区中关村东路95号