发明名称 一种基于多区域特征的电子公文分类方法
摘要 本发明所述一种基于多区域特征的电子公文分类方法,包括以下步骤:图像预处理:图像灰度化;图像自适应滤波;图像灰度拉伸;图像最优阈值计算;图像二值化;区域特征提取:图像分块像素分布统计特征;平滑图像直方图特征;图像纹理特征;标准文档多区域特征提取及入库:标准文档图像预处理;标准文档图像关键区域选择;标准文档图像各区域特征提取;生成文档类型特征矩阵;文档类型识别:从数据库读取文档类型特征矩阵和对应的特征区域;获取被检文档图像对应特征区域图像;计算被检文档图像各特征区域特征向量;两个特征的相关系数矩阵,计算文档类型相似度。本发明可以对公文进行准确的分类或识别,方法操作简单,实现方便。
申请公布号 CN105389557A 申请公布日期 2016.03.09
申请号 CN201510761336.4 申请日期 2015.11.10
申请人 佛山科学技术学院 发明人 王东;李晓东;陈俊健;顾艳春
分类号 G06K9/00(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 广州新诺专利商标事务所有限公司 44100 代理人 许英伟
主权项 一种基于多区域特征的电子公文分类方法,其特征在于,包括以下步骤:1)图像预处理(1)图像灰度化;(2)图像自适应滤波;(3)图像灰度拉伸;(4)图像最优阈值计算;(5)图像二值化;(6)图像倾斜矫正;2)区域特征提取(1)图像分块像素分布统计特征;(2)平滑图像直方图特征;(3)图像纹理特征;3)标准文档多区域特征提取及入库(1)标准文档图像预处理;(2)标准文档图像关键区域选择;(3)标准文档图像各区域特征提取,获得各区域特征向量;(4)生成文档类型特征矩阵;4)文档类型识别(1)从数据库读取文档类型特征矩阵和对应的特征区域;(2)获取被检文档图像对应特征区域图像;(3)计算被检文档图像各特征区域特征向量;(4)计算被检文档的特征矩阵;(5)两个特征的相关系数矩阵,计算文档类型相似度。
地址 528000 广东省佛山市禅城区江湾一路18号