发明名称 |
语音驱动头部图像合成影音文件的方法 |
摘要 |
本发明涉及一种语音驱动头部图像合成影音文件的方法。它包括取静态头部数码图像;提取头部、脸部及五官轮廓特征点数据坐标,并计算图像动画模式数据;生成包括口形闭合帧、口形张开帧、表情帧以及三种类型图像帧的各自数目在内的图像特征数据文件;采集语音数码信息;分析、提取语音特征数据,生成包括有声音语音帧和无声音语音帧在内的语音特征数据文件;将图像特征数据文件和语音特征数据文件同步合成,使得有声音语音帧对应口形张开帧,无声音语音帧对应口形闭合帧,然后输出。本发明具有图像逼真、可实现人脸及动物脸部表情的动画,制作方便简单,便于推广使用等特点。 |
申请公布号 |
CN100369469C |
申请公布日期 |
2008.02.13 |
申请号 |
CN200510093269.X |
申请日期 |
2005.08.23 |
申请人 |
王维国 |
发明人 |
王维国 |
分类号 |
H04N5/265(2006.01) |
主分类号 |
H04N5/265(2006.01) |
代理机构 |
北京连和连知识产权代理有限公司 |
代理人 |
王昕 |
主权项 |
1.一种语音驱动头部图像合成影音文件的方法,其特征是包括下列步骤:步骤1、取静态头部数码图像;步骤2、提取头部、脸部及五官轮廓特征点数据坐标,并计算图像动画模式数据,用以确定口形闭合帧帧数、口形张开帧帧数以及表情帧帧数;步骤3、生成包括口形闭合帧、口形张开帧、表情帧以及三种类型图像帧的各自数目在内的图像特征数据文件;步骤4、采集语音数码信息;步骤5、分析语音数码信息,提取语音特征数据;步骤6、生成包括有声音语音帧和无声音语音帧在内的语音特征数据文件;步骤7、上述图像特征数据文件和语音特征数据文件同步合成,使得有声音语音帧对应口形张开帧,无声音语音帧对应口形闭合帧,然后输出。 |
地址 |
100044北京市西直门北大街41号天兆家园4C501 |