发明名称 基于多分类器融合的笔迹鉴别方法
摘要 本发明公开了一种基于多分类器融合的笔迹鉴别方法。首先,将影响笔迹鉴别分类输出的因子分为两类:书写因子与字符因子。建立分类输出的两因子分解模型,采用数据挖掘方法,得到两因子分解模型中的常用汉字的字符因子。然后,对两因子分解模型中的书写因子给出了估计方法。最后,把书写因子作为最终的笔迹鉴别分类器进行笔迹鉴别。本发明方法解决了文本依存笔迹鉴别的理论方法无法满足实际应用需求的问题。面向大型样本笔迹库时,本鉴别方法能得到十分理想的一对多笔迹鉴别分类结果。作一对一笔迹鉴别,其鉴别准确率高达98%。
申请公布号 CN101499133A 申请公布日期 2009.08.05
申请号 CN200910061099.5 申请日期 2009.03.12
申请人 武汉大学 发明人 陈庆虎;邓伟;鄢煜尘;袁凤
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 武汉华旭知识产权事务所 代理人 刘 荣
主权项 1. 一种基于多分类器融合的笔迹鉴别方法,其特征在于包括以下步骤:(1)以单个字符为图像单元分别提取检材笔迹和样本笔迹的笔迹特征向量;(2)将检材笔迹和样本笔迹中的相同字符进行特征向量匹配,设检材笔迹特征向量为样本笔迹特征向量为则特征向量匹配距离为(3)建立文依存分类器分解模型分类器按如下模型进行分解:lnd=μ+α+β+ε (1.2)设笔迹鉴别中,检材笔迹一份,样本笔迹有N份,样本笔迹编号为i=1,2,…N,检材笔迹与每份样本笔迹具有M个相同的匹配字符,编号为j=1,2,…M,用dij表示第i份样本笔迹中编号为j的字符与检材笔迹中编号为j的字符进行特征向量距离匹配的结果,lndij=μ+αi+βj+εij(i=1,2,…N,j=1,2,…M) (1.3)其中,μ为常数,αi是检材书写因子与第i号样本书写因子的差异效应,βj为检材笔迹与样本笔迹中编号为j的字符因子的差异效应,εij为均值为0的随机误差;对常用汉字字符进行统一编号,设检材笔迹与第i份样本笔迹的有Mi个相同汉字,其相同汉字对应的统一编号集为{jk|k=1,2,…M},分类器分解模型为(4)字符因子挖掘与书写因子估计将式(1. 4)中的常数项μ与字符因子βjk合并,则jk为Q个常用汉字中的任意一个,用如下信息挖掘方法求解所有的:第一步,收集常用手写汉字P份,即P个人每人书写Q个常用汉字1份;第二步,选出所有编号为j′(j′=1,2,3……Q)的汉字,共P个;第三步,计算检材笔迹中编号为j的汉字与第二步所提到的P个汉字笔迹特征匹配距离,共有P个距离;第四步,对第三步得到的每个距离值取对数,并求这P个距离对数的平均值,用此平均值作为的估计值在模型(1. 5)中,用信息挖掘值代替令:于是有:书写因子αi的用下式估计:(5)以作为笔迹鉴别分类器进行笔迹鉴别。
地址 430072湖北省武汉市武昌珞珈山