发明名称 语音驱动头部图像合成影音文件的方法
摘要 本发明涉及一种语音驱动头部图像合成影音文件的方法。它包括取静态头部数码图像;提取头部、脸部及五官轮廓特征点数据坐标,并计算图像动画模式数据;生成包括口形闭合帧、口形张开帧、表情帧以及三种类型图像帧的各自数目在内的图像特征数据文件;采集语音数码信息;分析、提取语音特征数据,生成包括有声音语音帧和无声音语音帧在内的语音特征数据文件;将图像特征数据文件和语音特征数据文件同步合成,使得有声音语音帧对应口形张开帧,无声音语音帧对应口形闭合帧,然后输出。本发明具有图像逼真、可实现人脸及动物脸部表情的动画,制作方便简单,便于推广使用等特点。
申请公布号 CN100369469C 申请公布日期 2008.02.13
申请号 CN200510093269.X 申请日期 2005.08.23
申请人 王维国 发明人 王维国
分类号 H04N5/265(2006.01) 主分类号 H04N5/265(2006.01)
代理机构 北京连和连知识产权代理有限公司 代理人 王昕
主权项 1.一种语音驱动头部图像合成影音文件的方法,其特征是包括下列步骤:步骤1、取静态头部数码图像;步骤2、提取头部、脸部及五官轮廓特征点数据坐标,并计算图像动画模式数据,用以确定口形闭合帧帧数、口形张开帧帧数以及表情帧帧数;步骤3、生成包括口形闭合帧、口形张开帧、表情帧以及三种类型图像帧的各自数目在内的图像特征数据文件;步骤4、采集语音数码信息;步骤5、分析语音数码信息,提取语音特征数据;步骤6、生成包括有声音语音帧和无声音语音帧在内的语音特征数据文件;步骤7、上述图像特征数据文件和语音特征数据文件同步合成,使得有声音语音帧对应口形张开帧,无声音语音帧对应口形闭合帧,然后输出。
地址 100044北京市西直门北大街41号天兆家园4C501