发明名称 |
一种基于标点符号的文档上下方向检测方法 |
摘要 |
本发明涉及一种基于标点符号的文档上下方向检测方法,用于对办公文档扫描图像进行方向检测,该方法包括以下步骤:1)获取文档扫描图像,采用边缘密度算法检测并去除图像中的边缘噪音;2)采用基于投影的页面分割算法对图像进行页面分割,获得若干图像块;3)对每一个图像块,判断其是否为文本块,若是,则将其保留,若否,则将其剔除;4)采用XY切割算法提取每个文本块中的连通体;5)根据连通体的高度和宽度,判断该连通体是否为标点符号;6)分别统计接近于顶部和底部的标点符号的出现次数Lt、Lb,根据R=Lt/Lb与设定值的大小关系,检测文档扫描图像的方向。与现有技术相比,本发明具有检测准确率高、适用范围广等优点。 |
申请公布号 |
CN102831421A |
申请公布日期 |
2012.12.19 |
申请号 |
CN201210313834.9 |
申请日期 |
2012.08.29 |
申请人 |
华东师范大学 |
发明人 |
朱敏 |
分类号 |
G06K9/32(2006.01)I;G06K9/40(2006.01)I;G06T7/00(2006.01)I |
主分类号 |
G06K9/32(2006.01)I |
代理机构 |
上海科盛知识产权代理有限公司 31225 |
代理人 |
赵继明 |
主权项 |
一种基于标点符号的文档上下方向检测方法,用于对办公文档扫描图像进行方向检测,其特征在于,该方法包括以下步骤:1)获取文档扫描图像,采用边缘密度算法检测并去除图像中的边缘噪音;2)采用基于投影的页面分割算法对图像进行页面分割,获得若干图像块;3)对每一个图像块,判断其是否为文本块,若是,则将其保留,若否,则将其剔除;4)采用XY切割算法提取每个文本块中的连通体;5)根据连通体的高度和宽度,判断该连通体是否为标点符号,若是,则执行步骤6),若否,则返回步骤5);6)分别统计接近于顶部的标点符号的出现次数Lt和接近于底部的标点符号的出现次数Lb,根据R=Lt/Lb与设定值的大小关系,检测文档扫描图像的方向。 |
地址 |
200062 上海市普陀区中山北路3663号 |