发明名称 通话中的翻译
摘要 经由通信系统的通信网络从源用户的远程源用户设备接收讲源语言的源用户与讲目标语言的目标用户之间的通话的通话音频,该通话音频包括以源语言的源用户话音。对该通话音频执行自动话音识别过程。使用话音识别过程的结果来以目标语言生成对该源用户的话音的翻译。将该源用户的话音的经翻译的合成话音音频版本与源用户的通话话音进行混合和/或与目标用户的话音的以源语言的经翻译的音频进行混合。将经混合音频信号经由该通信网络发送给目标用户的远程目标用户设备以用于在该通话期间向至少该目标用户输出。
申请公布号 CN106464768A 申请公布日期 2017.02.22
申请号 CN201580027476.7 申请日期 2015.05.22
申请人 微软技术许可有限责任公司 发明人 A·奥厄;A·A·梅内塞斯;J·N·林德布鲁姆;F·富雷斯乔;P·P·N·格雷博里奥
分类号 H04M11/10(2006.01)I;H04W4/14(2009.01)I;H04W4/18(2009.01)I 主分类号 H04M11/10(2006.01)I
代理机构 永新专利商标代理有限公司 72002 代理人 王英;刘瑜
主权项 一种用于在通信系统中使用的语言翻译中继系统,所述通信系统用于实现至少讲源语言的源用户与讲目标语言的目标用户之间的语音或视频通话,所述中继系统包括:输入端,其被配置为经由所述通信系统的通信网络从所述源用户的远程源用户设备接收所述通话的通话音频,所述通话音频包括以所述源话音的所述源用户的话音;话音识别组件,其被配置为对所述通话音频执行自动话音识别过程;翻译组件,其被配置为使用所述话音识别过程的结果来生成对所述源用户的话音的以所述目标语言的翻译,所述翻译包括用于在所述目标用户设备处播放的所述源用户的话音的以所述目标语言的经翻译的合成话音音频版本,所述合成话音是基于所述话音识别过程的所述结果来生成的;混合组件,其被配置为将所述合成话音与所述源用户的通话音频进行混合和/或与所述目标用户的话音的以所述源语言的经翻译的音频进行混合,从而生成经混合的音频信号;以及输出端,其被配置为经由所述通信网络将所述经混合的音频信号发送至至少所述目标用户的远程目标用户设备,以用于在所述通话期间输出给所述目标用户。
地址 美国华盛顿州
您可能感兴趣的专利