发明名称 一种基于SIVV特征的文档图像粗分类方法
摘要 本发明公开一种基于SIVV特征的文档图像粗分类方法,包括如下步骤:获取文档图像,预处理,加窗处理,计算文档图像SIVV特征,对每个文档分别计算与其他文档SIVV特征的相关系数,若其中K个文档两两之间相关系数均大于某一阈值,则认为这K个文档属于同一分类。本发明的目的,在于提出一种新的文档图像粗分类方法,无需准确获取文档文本内容,即可将文档图像根据SIVV特征的相关系数自动分成若干类,方法具有鲁棒性好、分类速度快的特点。
申请公布号 CN104866822A 申请公布日期 2015.08.26
申请号 CN201510227324.3 申请日期 2015.05.06
申请人 南京信息工程大学 发明人 马廷淮;赵波;张正宇;霍晶晶
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 江苏爱信律师事务所 32241 代理人 唐小红
主权项 一种基于SIVV特征的文档图像粗分类方法,其特征在于,有如下步骤:(1)对文档图像进行预处理;(2)使用与文档图像同等大的2D Blackman窗分别对每幅图进行加窗处理;(3)对加窗后图像计算SIVV特征;(4)计算每幅图两两之间的SIVV特征的相关系数;(5)若其中K个文档两两之间相关系数r均大于某一阈值,则认为这K个文档属于同一分类。
地址 210044 江苏省南京市宁六路219号