发明名称 基于贝叶斯分类器的文字字体判断设备及其方法
摘要 本发明公开了一种基于贝叶斯分类器的文字字体判断设备及其方法。所述的设备包括:文字图像输入装置与前端处理装置、特征提取器、训练样本存储器、PCA分析器,PCA变换器、分类器参数估计器、贝叶斯分类器、可信度估计装置、判断结果输出装置和控制处理器。根据训练样本,利用统计处理方法自动学知识,从而准确判断文字字体的设备。该设备结构化好,操作简单,判别精度高,并且对于被印章和底纹严重污染的文字,同样可以获得高精度,只需4~5个汉字即可准确判断字体,而且人工设定参数少,不依赖人的经验,回避了复杂而且容易出错的文字切分步骤,不需要对图像进行二值化。该设备适用于对识别精度要求严格的文字识别系统中,如银行支票识别系统、信函地址识别系统、表格识别系统等。
申请公布号 CN1438604A 申请公布日期 2003.08.27
申请号 CN02157957.1 申请日期 2002.12.23
申请人 北京邮电大学 发明人 徐蔚然;刘刚;郭军;张洪刚
分类号 G06K9/00;G06K9/46;G06K9/72 主分类号 G06K9/00
代理机构 代理人
主权项 1、一种基于贝叶斯分类器的文字字体判断设备,其特征在于:所述的设备包括:文字图像输入装置与前端处理装置(1),用于从外界输入图像,以及在图像中确定待识别文字的位置;特征提取器(2),用于从文字图像输入装置与前端处理装置(1)的测试窗中提取用于判别文字字体的特征;训练样本存储器(3),用于把所有学习训练样本的特征保存在一起,以利于贝叶斯分类器的自动学习;PCA分析器(4),用于对训练样本存储器所保存的全部训练样本的特征进行主成分分析,从而得到PCA变换;PCA变换器(5),用于根据PCA分析器(4)确定的参数对样本的特征进行PCA变换;分类器参数估计器(6),用于根据PCA变换器(5)提供的所有学习训练样本来自动估计贝叶斯分类器(6)的全部参数;贝叶斯分类器(7),用于根据由分类器参数估计器(6)确定的参数判别字体;可信度估计装置(9),用于评估贝叶斯分类器(7)输出结果的可信程度;判断结果输出装置(10),用于把本装置的分析结果输出给其它设备;控制处理器(8),用于控制上述的各个装置,以便协调不同装置,实现所述装置的自动学习和自动字体判断。
地址 100876北京市海淀区西土城路10号