发明名称 一种汉字自动部件层次分析方法
摘要 本发明涉及一种汉字自动部件层次分析方法,包括以下步骤:步骤1确定汉字基本笔画集合,并将《信息交换用汉字编码字符集》“GB2312-80”所收集的6763个汉字中按照该笔画集合写成笔画序列的形式;步骤2依靠汉字部件的稳定性特征将汉字自动切分多个部件,并对这些部件重复步骤2,最终形成层次结构的汉字部件分析树。本发明依据的汉字基本笔画更加具有区别性,在此基础上实现汉字的部件层次分析的自动化。分析结果在用于汉字字形的计算机分析、汉字字形相似度对比等应用中时,因为对部件粒度和拆分方式具有统一的标准,因此可避免传统手工拆分方式时标准不统一所带来的问题。
申请公布号 CN102346664A 申请公布日期 2012.02.08
申请号 CN201110205810.7 申请日期 2011.07.22
申请人 镇江诺尼基智能技术有限公司 发明人 王石;曹存根;刘亮亮;郑宇飞;王为民;符建辉;曹亚男
分类号 G06F9/44(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F9/44(2006.01)I
代理机构 南京知识律师事务所 32207 代理人 汪旭东
主权项 一种汉字自动部件层次分析方法,其特征在于:具体步骤包括:步骤1. 确定汉字基本笔画集合, 并将《信息交换用汉字编码字符集》“GB2312 80”所收集的6763个汉字中按照该笔画集合写成笔画序列的形式;步骤2. 依靠汉字部件的稳定性特征将汉字自动切分多个部件,并对这些部件重复步骤2,最终形成层次结构的汉字部件分析树。
地址 212009 江苏省镇江市丁卯经十二路468号双子研发楼北楼18楼