发明名称 一种基于支持向量机的生物年龄分步预测方法
摘要 一种基于支持向量机的生物年龄分步预测方法,本发明涉及基于支持向量机的生物年龄分步预测方法。本发明的目的是为了解决传统的生物年龄预测方法预测效率低、准确度低、成本高以及方法繁琐复杂的问题。通过以下技术方案实现的:步骤一、制成生物年龄数据集;步骤二、区分已知年龄的生物样本和未知年龄的生物样本;步骤三、组间分类;步骤四、生成对应的支持向量机模型;步骤五、建立最优支持向量机模型;步骤六、建立最优特征子集;步骤七、得到测试集中年龄未知的生物样本对应的年龄组的组别;步骤八、组内分类;步骤九、生成组内分类的支持向量机模型;步骤十、得到某个年龄组内测试集样本确切的年龄。本发明应用于生物年龄预测领域。
申请公布号 CN104966106A 申请公布日期 2015.10.07
申请号 CN201510409193.0 申请日期 2015.07.13
申请人 哈尔滨工业大学 发明人 尹珅;田洋;高会军
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 杨立超
主权项 一种基于支持向量机的生物年龄分步预测方法,其特征在于,一种基于支持向量机的生物年龄分步预测方法具体是按以下步骤进行的:步骤一、整理实验获得的生物样本物理属性数据,制成生物年龄数据集;对检测到的生物样本物理属性数据进行分类,将每个生物样本的不同物理属性数据存于矩阵中的一行,即一个生物样本的不同物理属性数据对应一个行向量,不同生物样本放在一起构成一个矩阵;其中,所述物理属性数据包括性别、长度、直径、高度、总重量、去外壳重量、内脏重量和外壳干重;步骤二、区分已知年龄的生物样本和未知年龄的生物样本,步骤一中由实验获得的生物样本物理属性数据制成的生物年龄数据集为已知年龄的生物样本,将已知年龄的生物样本划分为训练集;步骤一中检测到的生物样本物理属性数据为未知年龄的生物样本,将未知年龄的生物样本划分为测试集;训练集的生物样本的年龄作为训练集的标签属性;步骤三、基于支持向量机对训练集进行第一步分类:组间分类,对训练集进行合并,将邻近的n个年龄的生物样本合并为一个年龄组,n≥3,即相应的标签属性也合并为一个;步骤四、根据步骤三得到的合并后的训练集利用支持向量机分类器进行训练,生成对应的支持向量机模型;步骤五、利用参数寻优算法优化支持向量机模型建立过程中的惩罚参数C和RBF核函数中的参数γ,根据优化的结果建立最优支持向量机模型;步骤六、利用SVM‑RFE算法建立经训练的合并后的训练集的最优特征子集;步骤七、利用生成的最优支持向量机模型和经训练的合并后的训练集的最优特征子集对测试集中年龄未知的生物样本进行分类预测,得到测试集中年龄未知的生物样本对应的年龄组的组别;步骤八、基于支持向量机对经训练的合并后的训练集进行第二步分类:组内分类,以测试集中未知年龄的生物样本的某一个年龄组的全部样本作为研究的对象;利用小波变换除去测试集中未知年龄的生物样本对应的年龄组的组内样本的噪声,找到组内不同年龄集的分界点;步骤九、对步骤八得到的组内分类后的经训练的合并后的训练集利用支持向量机分类器进行训练,生成组内分类的支持向量机模型,组内分类的支持向量机模型的最优特征子集选取以及参数寻优算法参照步骤五和步骤六;步骤十、根据步骤九得到的组内分类的支持向量机模型得到某个年龄组内测试集样本确切的年龄。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号