基于动态基元选取的语音驱动三维人脸动画方法,申请号CN200510086646.7-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	基于动态基元选取的语音驱动三维人脸动画方法
摘要	本发明公开了一种基于动态基元选取的语音驱动人脸动画方法，将输入的任何用户的任何语言的语音转换成语音和三维人脸动画的同步输出。此方法基于采用运动实时捕获系统建立的多模态数据库，对多模态数据进行音视频分析，分别获得相应的特征向量；以音素为基元单位对多模态数据进行同步分割；对用户给定的语音序列，计算每个基元的音频匹配误差和前后基元间的视觉匹配误差，最后在候选的基元中动态地选择一条最佳路径，输出与语音序列同步的人脸动画参数序列，以驱动三维人脸动画模型。本发明的方法，使得系统输出的动画序列保持较好的真实度和自然度，并适用于多用户和多语言的语音驱动。
申请公布号	CN1952850A	申请公布日期	2007.04.25
申请号	CN200510086646.7	申请日期	2005.10.20
申请人	中国科学院自动化研究所	发明人	陶建华;尹潘嵘
分类号	G06F3/00(2006.01)	主分类号	G06F3/00(2006.01)
代理机构	中科专利商标代理有限责任公司	代理人	段成云
主权项	1.一种基于动态基元选取的语音驱动人脸动画方法，其特征是：使用运动实时捕获设备，建立多模态数据库；同时运用语音分析、运动分析技术提取语音视频特征；以音素为基元单位对多模态数据进行同步分割；对用户给定的语音序列，计算每个基元的音频匹配误差和前后基元间的视觉匹配误差，最后在候选的基元中动态地选择一条最佳路径，输出与语音序列同步的人脸动画参数序列，以驱动三维人脸动画模型，将输入的任何用户的任何语言的语音转换成语音和三维人脸动画的同步输出，包括步骤：A.采用运动实时捕获系统创建多模态数据库；B.对多模态数据进行音视频分析，分别获得相应的特征向量；C.以音素为基元单位对多模态数据进行同步分割；D.采用动态基元选取方法，输出与用户输入语音同步的人脸动画参数序列。
地址	100080北京市海淀区中关村东路95号

您可能感兴趣的专利

SPEAKER RECOGNITION AND SPEECH RECOGNITION APPARATUS AND METHOD THEREOF

APPARATUS AND METHOD FOR IMAGE CORRECTING IN IMAGE DISPLAY DEVICE

TELEVISION FOR MOOD LIGHTING

APPARATUS AND METHOD OF DISPLAY TELETEXT

METHOD FOR SWITCHING EXTERNAL INPUT MODE OF TELEVISION

APPARATUS AND METHOD FOR RESTRICTING SEEING ANDHEARING OF HOME SHOPPING

SUSTAINED RELEASE FORMULATIONS USING NON-AQUEOUS CARRIERS

BIOPOLYMER-BASED GROWTH MEDIA, AND METHODS OF MAKING AND USING SAME

Tragkonstruktion für ein Bedienpult einer Werkzeugmaschine

Apparatus for encoding monitoring and method for operating the same

COMBINATION THERAPY FOR TUBERCULOSIS

LOGISCHE ERSETZUNG VON PROZESSORFÜHRUNG IN EINER EMULIERTEN RECHNERUMGEBUNG

HYDRAULIKVORRICHTUNG

AIR DISTRIBUTION SYSTEM FOR TEMPERATURE-CONTROLLED CASE

INTERLABIAL-POLSTER MIT LASCHE

MULTILAYER MEDICAL BALLOON

Vorrichtung zum Verbinden von zwei Leitungen

VORRICHTUNG UND VERFAHREN ZUM TESTEN VON PRODUKTAKZEPTANZ AUF EINEM DRAHTLOSEN GERÄT