发明名称 一种文本处理方法和文本处理装置
摘要 本发明公开了一种文本处理方法和一种文本处理装置,文本处理方法包括以下步骤:S100、使用语义标准化表、第一标准库和第二标准库生成关联对照表;其中,所述语义标准化表的表项分别包括普通术语和对应的标准化术语;S200、使用语义标准化表对依据第一标准库创建的文本进行语义标准化操作,得到经标准化处理的文本;S300、判断经标准化处理的文本是否能够与关联对照表中的表项进行语义精确匹配,若是则执行步骤S400,否则进一步执行语义模糊匹配和/或人工匹配以及根据匹配结果更新语义标准化表并返回步骤S200;S400、利用与关联对照表中的所述匹配的表项相对应的第二标准库的文本,代替所述经标准化处理的文本和/或编码。
申请公布号 CN103678262A 申请公布日期 2014.03.26
申请号 CN201310741364.0 申请日期 2013.12.27
申请人 中西亚通医疗信息科技(北京)有限公司 发明人 金以东
分类号 G06F17/21(2006.01)I;G06Q50/22(2012.01)I 主分类号 G06F17/21(2006.01)I
代理机构 北京市隆安律师事务所 11323 代理人 权鲜枝
主权项 一种文本处理方法,该方法包括以下步骤:S100、使用语义标准化表、第一标准库和第二标准库生成关联对照表;其中,所述语义标准化表的表项分别包括普通术语和对应的标准化术语;S200、使用语义标准化表对依据第一标准库创建的文本进行语义标准化操作,得到经标准化处理的文本;S300、判断经标准化处理的文本是否能够与关联对照表中的表项进行语义精确匹配,若是则执行步骤S400,否则进一步执行语义模糊匹配和/或人工匹配以及根据匹配结果更新语义标准化表并返回步骤S200;S400、利用与关联对照表中的所述匹配的表项相对应的第二标准库的文本和/或编码,代替所述经标准化处理的文本。
地址 100027 北京市朝阳区新源里16号2座14层12B08