发明名称 |
提取表格特征的方法及装置 |
摘要 |
本发明提供的一种提取表格特征的方法及装置。其中方法包括:对表格进行预处理;从预处理后的表格中提取标识表格类型的图像特征。装置包括:执行上述步骤的预处理模块和特征提取模块。进一步,标识表格类型的图像特征包括:SUMX、SUMA、SUMB、SUMC、SUMD和SUME,SUMX表示表格中中轴线条数,SUMA、SUMB、SUMC和SUMD分别表示A、B、C和D四个区域内的中轴线条数,SUME表示矩形区域E内的中轴线条数,其中A、B、C和D四个区域为在表格的宽和高的中点处,将表格分为的2行2列的四个面积相等的区域,矩形区域E与表格有相同的中心,且宽和高均为表格的宽和高的三分之一。采用该方法及装置,可以快速、准确地从表格中提取出标识表格类型的图像特征。 |
申请公布号 |
CN103093227B |
申请公布日期 |
2016.01.20 |
申请号 |
CN201310013028.4 |
申请日期 |
2013.01.14 |
申请人 |
西南大学 |
发明人 |
余建桥;况远春;郭加旋;胡迎春 |
分类号 |
G06K9/46(2006.01)I;G06K9/20(2006.01)I |
主分类号 |
G06K9/46(2006.01)I |
代理机构 |
北京海虹嘉诚知识产权代理有限公司 11129 |
代理人 |
谢殿武 |
主权项 |
一种提取表格特征的方法,其特征在于:包括如下步骤:步骤a、对表格进行预处理;步骤b、从预处理后的表格中提取标识表格类型的图像特征;所述标识表格类型的图像特征包括:SUMX、SUMA、SUMB、SUMC、SUMD和SUME,SUMX表示表格中中轴线条数,SUMA、SUMB、SUMC和SUMD分别表示A、B、C和D四个区域内的中轴线条数,SUME表示矩形区域E内的中轴线条数,其中A、B、C和D四个区域为在表格的宽和高的中点处,将表格分为的2行2列的四个面积相等的区域,矩形区域E与表格有相同的中心,且宽和高均为表格的宽和高的三分之一。 |
地址 |
400715 重庆市北碚区天生路2号 |