发明名称 |
一种基于多区域特征的电子公文分类方法 |
摘要 |
本发明所述一种基于多区域特征的电子公文分类方法,包括以下步骤:图像预处理:图像灰度化;图像自适应滤波;图像灰度拉伸;图像最优阈值计算;图像二值化;区域特征提取:图像分块像素分布统计特征;平滑图像直方图特征;图像纹理特征;标准文档多区域特征提取及入库:标准文档图像预处理;标准文档图像关键区域选择;标准文档图像各区域特征提取;生成文档类型特征矩阵;文档类型识别:从数据库读取文档类型特征矩阵和对应的特征区域;获取被检文档图像对应特征区域图像;计算被检文档图像各特征区域特征向量;两个特征的相关系数矩阵,计算文档类型相似度。本发明可以对公文进行准确的分类或识别,方法操作简单,实现方便。 |
申请公布号 |
CN105389557A |
申请公布日期 |
2016.03.09 |
申请号 |
CN201510761336.4 |
申请日期 |
2015.11.10 |
申请人 |
佛山科学技术学院 |
发明人 |
王东;李晓东;陈俊健;顾艳春 |
分类号 |
G06K9/00(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I |
主分类号 |
G06K9/00(2006.01)I |
代理机构 |
广州新诺专利商标事务所有限公司 44100 |
代理人 |
许英伟 |
主权项 |
一种基于多区域特征的电子公文分类方法,其特征在于,包括以下步骤:1)图像预处理(1)图像灰度化;(2)图像自适应滤波;(3)图像灰度拉伸;(4)图像最优阈值计算;(5)图像二值化;(6)图像倾斜矫正;2)区域特征提取(1)图像分块像素分布统计特征;(2)平滑图像直方图特征;(3)图像纹理特征;3)标准文档多区域特征提取及入库(1)标准文档图像预处理;(2)标准文档图像关键区域选择;(3)标准文档图像各区域特征提取,获得各区域特征向量;(4)生成文档类型特征矩阵;4)文档类型识别(1)从数据库读取文档类型特征矩阵和对应的特征区域;(2)获取被检文档图像对应特征区域图像;(3)计算被检文档图像各特征区域特征向量;(4)计算被检文档的特征矩阵;(5)两个特征的相关系数矩阵,计算文档类型相似度。 |
地址 |
528000 广东省佛山市禅城区江湾一路18号 |