发明名称 字幕生成装置、字幕生成方法及字幕生成程序
摘要 本发明的字幕生成装置中,利用视频识别部来对被输入的视频信号进行视频识别处理。由此来辨别视频上的动作物体。另外,利用音频识别部来对被输入的音频信号进行音频识别处理。由此来推断音频源的位置。控制部通过对利用视频识别处理辨别出的动作物体的信息和利用音频识别处理推断出的音频源的位置信息进行比较从而进行捆绑处理。由此,根据音频信号而生成的字幕的位置被设定在视频上的动作物体的附近。
申请公布号 CN101518055A 申请公布日期 2009.08.26
申请号 CN200780034822.X 申请日期 2007.09.19
申请人 松下电器产业株式会社 发明人 池上功
分类号 H04N5/278(2006.01)I;G10L15/00(2006.01)I;G10L15/10(2006.01)I 主分类号 H04N5/278(2006.01)I
代理机构 上海专利商标事务所有限公司 代理人 侯颖媖
主权项 1.一种字幕生成装置,根据视频信号及音频信号来生成合成视频,所述合成视频包含产生音频的音频产生物体的视频以及由所述音频产生物体产生的音频的字幕,该字幕生成装置的特征在于,具有:视频识别单元,该视频识别单元根据所述视频信号来获取与所述音频产生物体的视频相关的信息以作为视频信息;视频位置检测单元,该视频位置检测单元根据利用所述视频识别单元获取到的所述视频信息来检测所述音频产生物体的视频显示位置;音频识别单元,该音频识别单元根据所述音频信号来获取与所述音频产生物体的音频相关的信息以作为音频信息;音频位置推断单元,该音频位置推断单元根据利用所述音频识别单元获取到的所述音频信息来推断所述音频产生物体的音频产生位置;字幕生成单元,该字幕生成单元根据利用所述音频识别单元获取到的所述音频信息来生成将由所述音频产生物体产生的音频用字符来表现的字幕;相关联单元,该相关联单元将利用所述视频位置检测单元检测出的所述音频产生物体的视频显示位置与利用所述音频位置推断单元推断出的所述音频产生物体的音频产生位置相关联;以及合成视频生成单元,该合成视频生成单元根据利用所述相关联单元而被相关联的所述视频显示位置及所述音频产生位置,来将利用所述字幕生成单元生成的所述字幕配置在与利用所述视频位置检测单元检测出的所述视频显示位置对应的位置从而生成合成视频。
地址 日本大阪府