发明名称 基于有监督图的直推式数据降维方法
摘要 本发明公开了一种直推式局部保持投影数据降维方法,主要解决现有基于半监督学的数据降维方法仅利用欧氏距离进行构图,识别结果不理想的问题。其实现步骤是:(1)输入数据并归一化;(2)计算归一化后的原始矩阵及类标向量;(3)由原始数据计算第一拉普拉斯矩阵L;(4)由类标向量计算第二拉普拉斯矩阵L<sup>l</sup>;(5)由第一拉普拉斯矩阵L和第二拉普拉斯矩阵L<sup>l</sup>计算相似度矩阵S;(6)由类标向量计算样本的类间权重矩阵W<sup>c</sup>;(7)由相似度矩阵S和类间权重矩阵W<sup>c</sup>构建广义特征值公式并求解,得到投影矩阵E;(8)由投影矩阵E计算出降维后的样本。本发明能有效地对数据进行特征提取与降维,提高了数据分类识别的准确率,可用于数据与图像处理。
申请公布号 CN105678261A 申请公布日期 2016.06.15
申请号 CN201610008366.2 申请日期 2016.01.07
申请人 西安电子科技大学 发明人 王磊;姬红兵;王家俊;朱明哲;李丹萍
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;张问芬
主权项 一种基于有监督图的直推式数据降维方法,包括如下步骤:(1)输入n=F×P幅原始图像,对这些图像进行校准和对齐,将其裁剪为相同尺寸,其中F为原始图像类别数,P为每一类图像的张数;(2)将每幅图像像素点的灰度特征值按行取出并顺序排列形成一个d维行向量x<sub>j</sub>,组成一个n×d的矩阵,对该矩阵的每一行进行归一化,得到原始矩阵X=(x<sub>1</sub>,x<sub>2</sub>,...,x<sub>n</sub>);(3)将每幅图像的类标顺序排列形成一个n维列向量,即类标向量G,其中无标记样本的类标为0;(4)根据原始矩阵X,计算第一拉普拉斯矩阵L;(5)根据类标向量G,计算第二拉普拉斯矩阵L<sup>l</sup>;(6)根据第一拉普拉斯矩阵L和第二拉普拉斯矩阵L<sup>l</sup>,计算有监督图的相似度矩阵S:S=(I+αL+βL<sup>l</sup>)<sup>‑1</sup>(αL+βL<sup>l</sup>),其中,I为单位矩阵,α是K近邻图影响因子,β是类内无向图影响因子;(7)根据类标向量G,计算类间权重矩阵W<sup>c</sup>;(8)根据有监督图的相似度矩阵S和类间权重矩阵W<sup>c</sup>,计算投影矩阵E:选取特征维数r={5,10,...,50},利用下式求解广义特征值:X<sup>Τ</sup>SXa=λX<sup>Τ</sup>(D‑γW<sup>c</sup>)Xa,其中,a是特征向量,λ是特征值,γ是类间无向图影响因子;将求解得到的特征值按绝对值从大到小的顺序排列,选择前r个绝对值大的特征值对应的特征向量a<sub>i</sub>,顺序排列得到投影矩阵E=(a<sub>1</sub>,a<sub>2</sub>,...,a<sub>i</sub>,...a<sub>r</sub>);(9)根据投影矩阵E计算降维后的矩阵Y=XE。
地址 710071 陕西省西安市太白南路2号