发明名称 视频语音转换方法、装置和服务器
摘要 本发明实施例公开了一种视频语音转换方法、装置和服务器,涉及多媒体处理技术领域,用于降低视频中语音的翻译成本,提高翻译效率及其准确性。该方法中,提取视频中的源语言的语音信号,将该源语言的语音信号进行分段,得到至少一段源语言的子语音信号;对于每段源语言的子语音信号,根据预先建立的语音模型将该源语言的子语音信号转换为目标语言的子语音信号;将得到的各段目标语言的子语音信号与所述视频进行合并,得到包含目标语言的语音信号的视频。采用本发明可以降低视频中语音的翻译成本,提高翻译效率及其准确性。
申请公布号 CN104252861A 申请公布日期 2014.12.31
申请号 CN201410461061.8 申请日期 2014.09.11
申请人 百度在线网络技术(北京)有限公司 发明人 秦铎浩;沈国龙
分类号 G10L15/26(2006.01)I;G10L13/02(2013.01)I;G06F17/28(2006.01)I;H04N5/278(2006.01)I 主分类号 G10L15/26(2006.01)I
代理机构 北京品源专利代理有限公司 11332 代理人 胡彬;路凯
主权项 一种视频语音转换方法,其特征在于,包括:提取视频中的源语言的语音信号,将该源语言的语音信号进行分段,得到至少一段源语言的子语音信号;对于每段源语言的子语音信号,根据预先建立的语音模型将该源语言的子语音信号转换为目标语言的子语音信号;将得到的各段目标语言的子语音信号与所述视频进行合并,得到包含目标语言的语音信号的视频。
地址 100085 北京市海淀区上地十街10号百度大厦三层