发明名称 一种基于版面分析的选票快速识别统计方法及系统
摘要 一种基于版面分析的选票快速识别统计方法,选票格式可由选举单位自定义,利用高速扫描仪对选票进行图像采集,并对关键符号,如勾、叉、圈或填涂式小方块,建立语义库,通过符号数据与语义之间的映射增强计算机对选票图像的理解能力,所述方法包括:(1)将选票扫描成选票图像;(2)将选票图像进行预处理,并建议投票符号的预定义语义库;(3)选票图像的倾斜校正;(4)表格线检测和提取;(5)符号检测和提取;(6)符号识别;(7)将识别后的结构存入数据库。以及提供了一种基于版面分析的选票快速识别统计系统。发明适用性强、准确性高、提高工作效率。
申请公布号 CN101447017B 申请公布日期 2010.12.08
申请号 CN200810162629.0 申请日期 2008.11.27
申请人 浙江工业大学 发明人 肖刚;陆佳炜;陈久军;高飞;张元鸣;沈军强;刘海萍
分类号 G06K9/00(2006.01)I;G06K9/46(2006.01)I;G06K9/60(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 杭州天正专利事务所有限公司 33201 代理人 王兵;王利强
主权项 一种基于版面分析的选票快速识别统计方法,其特征在于:所述选票快速识别统计方法包括以下步骤:(1)、将选票扫描成选票图像;(2)、将选票图像进行预处理,首先将选票图像转换成二值化图像,再进行平滑和细化处理;并建立投票符号的预定义语义库,所述投票符号包括勾、叉和圈,依照图像形状特征分析,通过竖线特征区分勾和圈、叉,通过轮廓的局部方向特征区分圈和叉;(3)、将预处理后的选票图像进行增强处理,选取有效的子区域,检测表格的边缘线,提取表格线边缘点建立边缘点集,并为每个边缘点建立一个局部斜率特征集,最终形成以局部斜率特征集为集合元素的整体斜率特征集,通过先局部后全局的两轮筛选,得出整体斜率特征集内具有全局最大投票数的斜率,对应的倾斜角即为选票图像的倾斜角,并依照倾斜角进行位置校正,并将表格平移到选票的重心;(4)、表格线检测和提取:其中,检测表格横线的过程为:建立行像素数组HBlackNum[lHeight],lHeight代表选票图像的像素高度;自下而上扫描选票图像,在行像素数组HBlackNum[lHeight]中记录下每一像素行中的黑像素数,同时记录下含最多黑像素数的像素行;取含最多黑像素数的像素行的像素数的1/2作为横向表格线的分割域值Tn,规定行像素数组HBlackNum[lHeight]中像素数不小于该域值的像素行为一条横向表格线HLine[]所在的像素行;最后定义一个相邻表格线之间的距离域值Td来滤除重复的表格线;检测表格竖线的过程与上述表格横线相同;(5)、符号检测和提取:通过搜索这四条表格线之间的区域即可搜索得到该单元格中的投票符号;(6)、符号识别:提取投票符号的列目标点数及列目标点的位置,并做统计:依照预定义语义库,如果列目标点数以一个为主,则为勾,如果列目标点数以两个为主,则为圈和叉;接着,对圈和叉的投票图像提取其轮廓特征,如果局部方向特征呈现先递增后递减、列目标像素点之间的距离逐渐缩小且局部方向特征的翻转次数为一次,则为圈,如果局部方向特征呈现先递减后递增的现象且局部方向特征的翻转次数为一次,或者先递增后递减再递增且局部方向特征的翻转次数为两次,则为叉;(7)、将投票符号识别后的结果存入数据库。
地址 310014 浙江省杭州市下城区朝晖六区