发明名称 |
识别版面阅读顺序的方法及装置 |
摘要 |
本发明提供一种识别版面阅读顺序的方法,包括:读取待识别版面,并分析该版面以得到版面布局信息和字符文本对象和图像对象的对象属性;根据版面布局信息和对象属性,将字符文本对象合并为文本段落并将图像对象识别为图像段落;采用全局递归切割与局部先后顺序判定相结合的方式来确定文本段落和图像段落的阅读顺序,其中,通过投影来进行全局切割,对于全局切割之后仍包含多个段落的分组,采用局部判定方法来判断段落的先后顺序。相应地,提供一种识别版面阅读顺序的装置。本发明将字符和图像均识别为段落,并采用全局递归切割与局部判定相结合的方式识别段落阅读顺序,从而实现了复杂版面中文本和图像的正确识别,并且效率和准确率高。 |
申请公布号 |
CN102479173B |
申请公布日期 |
2013.11.06 |
申请号 |
CN201010559135.3 |
申请日期 |
2010.11.25 |
申请人 |
北京大学;北大方正集团有限公司;北京北大方正技术研究院有限公司 |
发明人 |
房婧;高良才;汤帜;陶欣 |
分类号 |
G06F17/21(2006.01)I |
主分类号 |
G06F17/21(2006.01)I |
代理机构 |
北京天昊联合知识产权代理有限公司 11112 |
代理人 |
陈源;罗建民 |
主权项 |
一种识别版面阅读顺序的方法,包括以下步骤:步骤1、读取待识别版面,并分析该版面以得到版面布局信息和字符文本对象和图像对象的对象属性;步骤2、根据在步骤1中分析得到的版面布局信息、字符文本对象和图像对象的对象属性,将步骤1中得到的字符文本对象合并为文本段落并将步骤1中得到的图像对象识别为图像段落;步骤3、采用全局递归切割与局部先后顺序判定相结合的方式来确定步骤2中合并的文本段落和识别的图像段落的阅读顺序。 |
地址 |
100871 北京市海淀区颐和园路5号 |