发明名称 用于基于HMM的东亚字符识别的偏旁集判定
摘要 描述了用于选择供在概率性东亚字符识别算法中使用的偏旁集的示例性技术。一种示例性技术包括对集合中的每一个东亚字符应用分解规则以生成包括作为节点的偏旁的渐进拆分图,从而使用最大似然和最小描述长度来公式化找出表示东亚字符集的最优偏旁集的优化问题并且解该优化问题以得到最优偏旁集。另一种示例性技术包括通过使用表征相对于其他东亚字符的偏旁的general函数以及表征偏旁复杂性的complex函数来选择最优偏旁集。
申请公布号 CN101971192B 申请公布日期 2013.05.22
申请号 CN200880006150.6 申请日期 2008.02.28
申请人 微软公司 发明人 S·韩;Y·邹;M·张;P·刘;Y-J·吴;L·马;F·宋;D·张;J·王
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 顾嘉运;钱静芳
主权项 一种用于提高东亚字符识别效率的方法,包括:提供东亚字符集合;对所述集合中的每一个东亚字符应用分解规则以生成渐进拆分图,其中所述渐进拆分图包括作为节点的偏旁;使用最大似然和最小描述长度来公式化找出表示所述东亚字符集合的最优偏旁集的优化问题,所述最小描述长度包括取决于基于隐马尔可夫模型的字符识别算法中的参数数量的惩罚;解所述优化问题以得到所述最优偏旁集;以及在所述基于隐马尔可夫模型的字符识别算法中使用所述最优偏旁集。
地址 美国华盛顿州