发明名称 一种多模态人类年龄自动估计方法
摘要 本发明公开一种多模态人类年龄自动估计方法,先获取用于训练的具有不同年龄段的人脸图像和语音数据,分别抽取特征作为训练用的人脸图像集和语音数据集;再从输入设备分别获取待估计的人脸图像和语音分别抽取图像特征和语音特征;然后判断类别分别参数是否训练好,若否,则用第一步得到的数据集应用IIS-LLD算法进行训练,然后得到一个基于人脸图像的类别分布函数的最佳参数和一个基于语音的类别分布函数的最佳参数;若是,则将得到的最佳参数分别代入,得到对应于该组数据的基于人脸图像的类别分布和基于语音的类别分布;将得到的类别分布结合得到一个新的类别分布;从得到的新的类别分布中选取对该样本描述程度最大的年龄即可。
申请公布号 CN102306281A 申请公布日期 2012.01.04
申请号 CN201110195665.9 申请日期 2011.07.13
申请人 东南大学 发明人 耿新;方尔庆;谷鹏
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 冯慧
主权项 一种多模态人类年龄自动估计方法,其特征在于,步骤为:第一步,获取用于训练的具有不同年龄段的人脸图像和语音数据分别抽取图像特征和语音特征作为训练用的人脸图像集和语音数据集;第二步,从输入设备分别获取待估计的人脸图像和语音分别抽取图像特征和语音特征;第三步,分别判断基于人脸图像的类别分布参数和基于语音的类别分别参数是否训练好,若否,则执行第四步;若是,则执行第五步;第四步,分别用第一步得到的人脸图像集和语音数据集应用IIS‑LLD算法进行训练,然后分别得到一个基于人脸图像的类别分布函数的最佳参数和一个基于语音的类别分布函数的最佳参数;第五步,将第四步中得到的最佳参数分别代入基于人脸图像的类别分布函数和基于语音的类别分布函数中,得到对应于该组数据的基于人脸图像的类别分布P2(y)和基于语音的类别分布P1(y);第六步,将第五步中得到的基于人脸图像的类别分布P2(y)和基于语音的类别分布P1(y)按照P(y)=λP1(y)+(1‑λ)P2(y)结合得到一个新的类别分布P(y),其中λ为权重;第七步,从第六步中得到新的类别分布P(y)中选取对该样本描述程度最大的年龄,该年龄即为系统作出的估计年龄。
地址 210096 江苏省南京市四牌楼2号