发明名称 一种基于标点符号的文档上下方向检测方法
摘要 本发明涉及一种基于标点符号的文档上下方向检测方法,用于对办公文档扫描图像进行方向检测,该方法包括以下步骤:1)获取文档扫描图像,采用边缘密度算法检测并去除图像中的边缘噪音;2)采用基于投影的页面分割算法对图像进行页面分割,获得若干图像块;3)对每一个图像块,判断其是否为文本块,若是,则将其保留,若否,则将其剔除;4)采用XY切割算法提取每个文本块中的连通体;5)根据连通体的高度和宽度,判断该连通体是否为标点符号;6)分别统计接近于顶部和底部的标点符号的出现次数Lt、Lb,根据R=Lt/Lb与设定值的大小关系,检测文档扫描图像的方向。与现有技术相比,本发明具有检测准确率高、适用范围广等优点。
申请公布号 CN102831421A 申请公布日期 2012.12.19
申请号 CN201210313834.9 申请日期 2012.08.29
申请人 华东师范大学 发明人 朱敏
分类号 G06K9/32(2006.01)I;G06K9/40(2006.01)I;G06T7/00(2006.01)I 主分类号 G06K9/32(2006.01)I
代理机构 上海科盛知识产权代理有限公司 31225 代理人 赵继明
主权项 一种基于标点符号的文档上下方向检测方法,用于对办公文档扫描图像进行方向检测,其特征在于,该方法包括以下步骤:1)获取文档扫描图像,采用边缘密度算法检测并去除图像中的边缘噪音;2)采用基于投影的页面分割算法对图像进行页面分割,获得若干图像块;3)对每一个图像块,判断其是否为文本块,若是,则将其保留,若否,则将其剔除;4)采用XY切割算法提取每个文本块中的连通体;5)根据连通体的高度和宽度,判断该连通体是否为标点符号,若是,则执行步骤6),若否,则返回步骤5);6)分别统计接近于顶部的标点符号的出现次数Lt和接近于底部的标点符号的出现次数Lb,根据R=Lt/Lb与设定值的大小关系,检测文档扫描图像的方向。
地址 200062 上海市普陀区中山北路3663号