发明名称 数位影音讯号之语音翻译系统与方法;SYSTEM AND METHOD FOR VOICE TRANSLATION ON DIGITAL VIDEO-AUDIO SIGNALS
摘要 一种数位影音讯号之语音翻译系统与方法,用以将一第一声频讯号转换为一第二声频讯号,包含一音频分析模组、一语音辨识模组、一语言翻译模组、一语音合成模组及一音讯混成模组。音频分析模组执行第一音频讯号的音频分析处理以产生第一语音讯号及非语音讯号,语音辨识模组执行第一语音讯号的语音辨识处理以产生第一语言讯号,语言翻译模组执行第一语言讯号的语言翻译处理以产生第二语言讯号,语音合成模组执行第二语言讯号的语音合成处理以产生第二语音讯号,音讯混成模组执行第二语音讯号及非语音讯号的音讯混成处理以产生第二音频讯号。
申请公布号 TWI328216 申请公布日期 2010.08.01
申请号 TW096118251 申请日期 2007.05.22
申请人 广寰科技股份有限公司 KWORLD COMPUTER CO., LTD. 台北县中和市建二路113号6楼 发明人 黄智宏;张志豪
分类号 主分类号
代理机构 代理人 杨长峯 台北县中和市中正路880号3楼之3
主权项 1.一种语音翻译系统,接收具有一第一语音讯号及一第一字幕讯号的一原始影音讯号,输出具有一第二语音讯号的一第二音频讯号,包含:一解多工模组,用以接收该原始影音讯号,并执行该原始影音讯号的解多工处理以产生一第一音频讯号、该第一字幕讯号及一第一影像讯号;一音频分析模组,耦合至该解多工模组以接收该第一音频讯号,执行该第一音频讯号的音频分析处理以产生该第一语音讯号及一非语音讯号;一语音辨识模组,耦合至该音频分析模组以接收该第一语音讯号,执行该第一语音讯号的语音辨识处理以产生一第一语言讯号;一语言翻译模组,耦合至该语音辨识模组以接收该第一语言讯号,执行该第一语言讯号的语言翻译处理以产生一第二语言讯号;一语音合成模组,耦合至该语言翻译模组以接收该第二语言讯号,执行该第二语言讯号的语音合成处理以产生该第二语音讯号;以及一音讯混成模组,耦合至该语音合成模组及该音频分析模组以分别接收该第二语音讯号及该非语音讯号,执行该第二语音讯号及该非语音讯号的音讯混成处理以产生该第二音频讯号。 ;2.如请求项1所述之语音翻译系统,其中该语言翻译模组另执行该第一语言讯号的语言翻译处理以产生一第二字幕讯号。 ;3.如请求项2所述之语音翻译系统,另包含一影像处理装置,耦合至一视讯解码模组、一字幕解码模组、该语言翻译模组及一选择输入装置以分别接收该第一影像讯号、该第一字幕讯号及该第二字幕讯号及一字幕选择讯号,选择该第一字幕讯号或该第二字幕讯号作为一字幕输出讯号,执行该第一影像讯号与该字幕输出讯号之视讯混成处理以产生一视讯输出讯号。 ;4.如请求项3所述之语音翻译系统,另包含一选择输入装置,用以输出一语言选择讯号至该语言翻译模组及该字幕选择讯号至该影像处理装置。 ;5.如请求项4所述之语音翻译系统,其中该语言翻译模组根据该语言选择讯号执行该第一语言讯号的语言翻译处理以产生该第二语言讯号及该第二字幕讯号。 ;6.如请求项4所述之语音翻译系统,其中该影像处理装置根据该字幕选择讯号选择该第一字幕讯号或该第二字幕讯号作为该字幕输出讯号,执行该第一影像讯号与该字幕输出讯号之视讯混成处理以产生该视讯输出讯号。 ;7.如请求项1所述之语音翻译系统,另包含:一音讯解码模组,耦合于该解多工模组及该音频分析模组之间,执行一原始音频讯号之音讯解码处理以产生该第一音频讯号;一字幕解码模组,耦合于该解多工模组、一影像处理装置与该语言翻译模组之间,执行一原始字幕讯号之字幕解码处理以产生该第一字幕讯号;以及一视讯解码模组,耦合于该解多工模组及该影像处理装置之间,执行一原始影像讯号之视讯解码处理以产生该第一影像讯号;其中该原始音频讯号、该原始字幕讯号及该原始影像讯号是该解多工模组执行该原始影音讯号的解多工处理产生。 ;8.如请求项1所述之语音翻译系统,另包含一音调分析模组,耦合于该音频分析模组以接收该第一语音讯号,执行该第一语音讯号的音调分析处理以产生一音调讯号。 ;9.如请求项8所述之语音翻译系统,其中该语音合成模组另耦合至该音调分析模组以接收该音调讯号,该语音合成模组根据该音调讯号执行该第二语言讯号的语音合成处理以产生该第二语音讯号。 ;10.一种语音翻译系统,接收具有一第一语音讯号及一第一字幕讯号的一原始影音讯号,输出具有一字幕输出讯号的一视讯输出讯号,包含:一解多工模组,用以接收该原始影音讯号,并执行该原始影音讯号的解多工处理以产生一原始音频讯号、一原始字幕讯号及一原始影像讯号;一音讯解码模组,耦合于该解多工模组以接收该原始音频讯号,执行该原始音频讯号的音讯解码处理以产生一第一音频讯号;一字幕解码模组,耦合于该解多工模组以接收该原始字幕讯号,执行该原始字幕讯号的字幕解码处理以产生该第一字幕讯号;一视讯解码模组,耦合于该解多工模组以接收该原始影像讯号,执行该原始影像讯号的视讯解码处理以产生一第一影像讯号;一音频分析模组,耦合至该音讯解码模组以接收该第一音频讯号,执行该第一音频讯号的音频分析处理以产生该第一语音讯号及一非语音讯号;一语音辨识模组,耦合至该音频分析模组以接收该第一语音讯号,执行该第一语音讯号的语音辨识处理以产生一第一语言讯号;一语言翻译模组,耦合至该语音辨识模组以接收该第一语言讯号,执行该第一语言讯号的语言翻译处理以产生一第二字幕讯号;一影像处理装置,耦合至该视讯解码模组、该字幕解码模组、该语言翻译模组、一字幕翻译单元及一选择输入装置以分别接收该第一影像讯号、该第一字幕讯号、该第二字幕讯号、一第三字幕讯号及一字幕选择讯号,选择该第一字幕讯号、该第二字幕讯号或该第三字幕讯号作为一字幕输出讯号,执行该第一影像讯号与该字幕输出讯号之视讯混成处理以产生一视讯输出讯号;一选择输入装置,用以输出一语言选择讯号至该语言翻译模组、一第一字幕选择讯号至该字幕翻译单元、及一第二字幕选择讯号至该影像处理装置;一语音合成模组,耦合至该语言翻译模组以接收一第二语言讯号,执行该第二语言讯号的语音合成处理以产生一第二语音讯号;以及一音讯混成模组,耦合至该语音合成模组及该音频分析模组以分别接收该第二语音讯号及该非语音讯号,执行该第二语音讯号及该非语音讯号的音讯混成处理以产生一第二音频讯号。 ;11.如请求项10所述之语音翻译系统,另包含一字幕翻译单元,耦接于该字幕解码模组以接收该第一字幕讯号,执行该第一字幕讯号的语言翻译处理以产生一第三字幕讯号。 ;12.如请求项11所述之语音翻译系统,其中该影像处理装置另耦合于该字幕翻译单元以接收该第三字幕讯号,该影像处理装置选择该第一字幕讯号、该第二字幕讯号或该第三字幕讯号作为该字幕输出讯号,执行该第一影像讯号与该字幕输出讯号之视讯混成处理以产生该视讯输出讯号。 ;13.如请求项12所述之语音翻译系统,其中该语言翻译模组另执行该第一语言讯号的语言翻译处理以产生该第二语言讯号。 ;14.如请求项13所述之语音翻译系统,其中该语言翻译模组根据该语言选择讯号执行该第一语言讯号的语言翻译处理以产生该第二语言讯号及该第二字幕讯号,该字幕翻译单元根据该第一字幕选择讯号执行该第一字幕讯号的语言翻译处理以产生该第三字幕讯号,该影像处理装置根据该第二字幕选择讯号选择该第一字幕讯号、该第二字幕讯号或该第三字幕讯号作为该字幕输出讯号。 ;15.如请求项10所述之语音翻译系统,另包含一音调分析模组,耦合于该音频分析模组以接收该第一语音讯号,执行该第一语音讯号的音调分析处理以产生一音调讯号。 ;16.如请求项15所述之语音翻译系统,其中该语音合成模组另耦合至该音调分析模组以接收该音调讯号,该语音合成模组根据该音调讯号执行该第二语言讯号的语音合成处理以产生该第二语音讯号。 ;17.一种语音翻译方法,用以将具有一第一语音讯号及一第一字幕讯号的一影音输入讯号转换为具有一第二语音讯号的一第二音频讯号及具有一字幕输出讯号的一视讯输出讯号,包含:执行该影音输入讯号的解多工处理以产生一第一音频讯号、该第一字幕讯号及一影像输入讯号;执行该第一音频讯号的音频分析处理以产生该第一语音讯号及一非语音讯号;执行该第一语音讯号的语音辨识处理以产生一第一语言讯号;执行该第一语言讯号的语言翻译处理以产生一第二语言讯号及一第二字幕讯号;执行该第二语言讯号的语音合成处理以产生该第二语音讯号;执行该第二语音讯号及该非语音讯号的音讯混成处理以产生该第二音频讯号;选择该第一字幕讯号或该第二字幕讯号作为该字幕输出讯号;以及执行该影像输入讯号与该字幕输出讯号之视讯混成处理以产生该视讯输出讯号。 ;18.如请求项17所述之语音翻译方法,另包含执行该第一字幕讯号的语言翻译处理以产生一第三字幕讯号,而选择该第一字幕讯号或该第二字幕讯号作为字幕输出讯号系可变更为选择该第一字幕讯号、该第二字幕讯号或该第三字幕讯号作为该字幕输出讯号。;第1图显示习知具有字幕翻译功能的影音系统之方块示意图。;第2图显示依本发明之语音翻译系统的一较佳实施例方块示意图。;第3图显示第2图之语言翻译模组的方块示意图。;第4图显示依本发明之语音翻译系统的另一较佳实施例方块示意图。;第5图显示依本发明之一用于影音装置之语音翻译方法的流程图。
地址 KWORLD COMPUTER CO., LTD. 台北县中和市建二路113号6楼