发明名称 |
一种中文医疗服务项目信息的自动编码方法及系统 |
摘要 |
本发明的实施方式提供了一种中文医疗服务项目信息的自动编码方法及系统。该方法包括:输入中文医疗服务项目信息字符串并进行预处理;基于预先建立的本体词典、方位词典、等级词典,将中文医疗服务项目信息字符串切分成能够与本体词典中的本体直接匹配的第一类型子字符串和不能够与本体直接匹配第二类型子字符串;将第一类型子字符串相匹配的本体的编码确定为中文医疗服务项目信息字符串的精确编码并进行输出。本发明实现了对属于自然语言的中文医疗服务项目信息的准确识别及编码,识别结果及编码结果具有较高的准确率,为利用中文医疗服务项目信息进行医疗服务价格项目结算提供了便利。 |
申请公布号 |
CN105184053A |
申请公布日期 |
2015.12.23 |
申请号 |
CN201510496444.3 |
申请日期 |
2015.08.13 |
申请人 |
易保互联医疗信息科技(北京)有限公司 |
发明人 |
金以东;陈志永;朱华玲 |
分类号 |
G06F19/00(2011.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F19/00(2011.01)I |
代理机构 |
北京三友知识产权代理有限公司 11127 |
代理人 |
汤在彦 |
主权项 |
一种中文医疗服务项目信息的自动编码方法,包括:步骤1,输入中文医疗服务项目信息字符串;步骤2,对所述中文医疗服务项目信息字符串进行预处理,得到预处理后的中文医疗服务项目信息字符串;步骤3,基于预先建立的本体词典、方位词典、等级词典,将所述预处理后的中文医疗服务项目信息字符串切分成若干第一类型子字符串和第二类型子字符串;其中,所述第一类型子字符串能够与所述本体词典中的本体直接匹配,所述第二类型子字符串不能够与所述本体词典中的本体直接匹配;所述本体词典包括若干本体以及所述本体一一对应的编码,所述本体为标准术语或扩充术语;所述标准术语为全国医疗服务价格项目规范中规定的项目名称;所述扩充术语为与所述标准术语具有同义关系的词语或具有属种关系的词语;其中,所述标准术语对应的编码为全国医疗服务价格项目规范中规定的项目编码;所述扩充术语与具有同义关系或属种关系的所述标准术语对应的编码一致;所述方位词典包括若干方位术语,所述方位术语是用于描述医疗服务项目所针对的方位的词语;所述等级词典包括若干等级术语,所述等级术语是用于描述医疗服务项目的级别、类型的词语;步骤4,将所述第一类型子字符串相匹配的本体的编码确定为所述中文医疗服务项目信息字符串的精确编码,并输出所述精确编码。 |
地址 |
100027 北京市朝阳区新源里16号琨莎中心2座12B层 |