发明名称 基于距离度量学的棉花品级分类方法及装置
摘要 基于距离度量学的棉花品级分级方法及装置,包括采集棉花样本数字图像,提取图像计算特征,得到到关于“色泽”、“杂质”、“轧工”共21个计算特征;使用大边界最近邻算法在训练数据上进行训练,得到一个马氏距离度量矩阵;并训练一个k近邻分类器;对于待分级的棉花样品,采集数字图像并提取计算特征,输给分类器,该分类器输出的类别即棉花品级。其装置包括正上方设有摄像头和两条标准D65光源的灯箱,和计算机控制系统。本发明选取的用于棉花自动分级的计算特征具有与人工分级所选用的感知特征有很高的吻合程度,保证了分级的正确性,距离度量学的使用进一步提高了系统分级的准确性,完全不需要人工干预。
申请公布号 CN104408473A 申请公布日期 2015.03.11
申请号 CN201410742806.8 申请日期 2014.12.08
申请人 中华人民共和国山东出入境检验检疫局;中国海洋大学 发明人 王东;张婷;陈鹏;甘言海;郑丽莎;亓琳;姚伟敏;董军宇
分类号 G06K9/62(2006.01)I;G06K9/66(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 青岛海昊知识产权事务所有限公司 37201 代理人 张中南;邱岳
主权项 一种基于距离度量学习的棉花品级分级方法,包括按照现有的标准对棉花样品进行分级(每个品级至少30份样品);其特征在于还包括以下步骤:步骤1,在固定的光源条件下,采集已准确分级的棉花样本的数字图像,图像大小为32*32的整数倍;步骤2,对数字图像进行预处理:进行颜色空间转换,将所述数字图像由RGB格式转换为L*a*b*格式;步骤3,对每一幅转换格式后的图像提取其计算特征,具体方法如下:1)针对棉花的“色泽”,提取L*、a*、b*(即CIE L*a*b*颜色空间的三个通道)三个通道在所有像素上的均值和方差;然后以32*32大小的块划分图像,取每一个小块的均值作为该块的代表,求L*、a*、b*三个通道在所有块上的方差;2)针对棉花的“杂质”,提取杂质总面积占整个图像的比例、杂质块的个数、平均大小、杂质的分布四个特征,所述图像中的杂质是指混入棉花中的一些非棉纤维物质;3)针对棉花的“轧工”,计算图像的四个不同方向上的灰度共生矩阵和每个灰度共生矩阵的能量、熵、对比度、相关性四种参数;对得到的四个能量、四个熵、四个对比度、四个相关性,分别提取均值和标准差作为最终8维纹理特征;从每一幅图像中提取到关于“色泽”、“杂质”、“轧工”共21个计算特征;步骤4,每一个棉花样本都由一个21维的向量表示,采集到的所有的样本数据构成一个样本空间,称为训练数据;使用大边界最近邻算法(Large Margin Nearest Neighbor Algorithm)在训练数据上进行训练,得到一个马氏距离度量矩阵;然后使用这个马氏距离度量矩阵训练一个k近邻(k‑Nearest Neighbor)分类器;步骤5,对于一种待分级的棉花样品,在固定的光源条件下,采集该棉花样本的数字图像(大小为32*32的整数倍);然后重复步骤2、3,再将步骤3得到的计算特征输出给上述步骤4得到的分类器,该分类器输出的类别即对应于棉花的不同品级。
地址 266003 山东省青岛市市南区中山路2号