发明名称 分析文件版面布局的设备和方法
摘要 在一个用于分析文件版面布局的设备中,一个字符候选元素生成器根据文件图像的黑像素链接分量生成字符候选元素。一个水平方向行矩形生成器在水平行方向上排列的字符候选元素之中当字符候选元素在垂直方向上相对于水平行方向的偏移量都小于或等于一个阈值时,将这多个字符候选元素设置为一个候选行矩形。一个水平方向段落块生成器将垂直方向上长度基本相同的多个候选行元素设置为一个段落候选元素。
申请公布号 CN1264113C 申请公布日期 2006.07.12
申请号 CN03102102.6 申请日期 2003.01.30
申请人 富士通株式会社 发明人 小泽宪秋;武部浩明;藤本克仁;直井聪
分类号 G06K9/20(2006.01) 主分类号 G06K9/20(2006.01)
代理机构 北京三友知识产权代理有限公司 代理人 李辉
主权项 1.一种用于分析文件版面布局的设备,包括:一个黑像素链接分量提取单元,根据一幅文件图像的数据提取连续黑像素作为黑像素链接分量;一个字符元素提取单元,从黑像素链接分量提取字符元素;和一个行元素提取单元,在行方向上排列的字符元素之中提取多个字符元素作为一个行元素,所提取字符元素在与行方向垂直的方向上的偏移量都小于或等于一个阈值。
地址 日本神奈川县