发明名称 融合通信中智能语音交互系统及其实现方法
摘要 本发明公布了一种融合通信中智能语音交互系统及其实现方法,所述系统包括众多个智能终端、语音处理进程单元和一个语音服务器,其中语音处理进程单元都包括前端语音采集装置、实时传输模块、语音合成模块和语音识别模块,每个智能终端分别串接语音处理进程单元后与语音服务器通信,前端语音采集装置依次串接语音合成模块、语音识别模块后与语音服务器通信,前端语音采集装置的输出端串接实时传输模块后接语音服务器的输入端。所述方法首先,终端采集音频数据,进行录音。其次,终端将文本信息发至服务器,由服务器将文本信息转换为音频信息,实现Text-to-speech的业务。本发明系统结构简单,具有较强的鲁棒性。
申请公布号 CN101699840B 申请公布日期 2013.03.06
申请号 CN200910185429.1 申请日期 2009.11.09
申请人 希华通信(苏州)有限公司;东南大学 发明人 顾衍;裴文江;葛俊;王开;孙庆庆;张勤;洪松;任梦琪;王毛;孙龙;张春;张金玺;夏然辉
分类号 H04L12/00(2006.01)I;H04M3/42(2006.01)I 主分类号 H04L12/00(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 许方
主权项 一种融合通信中智能语音交互系统的实现方法,该系统包括众多个智能终端、众多个语音处理进程单元、一个语音服务器和一个计算机,其中语音处理进程单元包括前端语音采集装置、实时传输模块、语音合成模块和语音识别模块,每个智能终端分别串接语音处理进程单元后与语音服务器通信,前端语音采集装置依次串接语音合成模块、语音识别模块后与语音服务器通信,前端语音采集装置的输出端串接实时传输模块后接语音服务器的输入端,每个智能终端的控制信号输入端分别接计算机的控制端;前端语音采集装置通过智能终端采集客户的语音信号,智能终端用于对语音信号进行音频录制,语音合成模块对客户端的语音进行语音数据合成,语音识别模块对客户端的文本数据进行识别并转换成语音数据,合成后的语音数据通过传输模块传输至语音服务器,语音数据存储于服务器内;其特征在于,所述方法包括如下步骤:a)前端语音采集装置通过智能终端采集客户的语音信号,智能终端开始录制音频;b)智能终端录制音频结束时向语音服务器请求连接;c)若请求得到语音服务器的响应,则建立起客户端与语音服务器之间的连接,否则智能终端继续存储,并继续向语音服务器发出请求;d)在建立的连接上传输录制的语音数据;e)语音服务器按照语音数据来源和数据类型,对其进行分类存储;f)完成客户端与语音服务器的传输,关闭此连接;g)客户端向语音服务器申请语音合成,若语音服务器无响应,则返回步骤g,重新向语音服务器发出请求,若语音服务器响应,则建立起一条与客户端的数据连接;h)客户端将文本数据上传至语音服务器;i)语音服务器调用语音合成模块,将文本数据转换为语音数据,并将生成的语音文件转存至/tmp/audio目录下;j)在步骤g建立的连接上,将生成后的语音文件回传给智能终端;k)智能终端实时播放回传的音频;l)客户端向语音服务器申请语音拨号,若语音服务器无响应,则返回步骤l,重新向语音服务器发出请求,或直接转手动拨号;若语音服务器响应,则建立起一条与客户端的数据连接;m)客户端采集语音数据,在语音拨号中是对数字序列进行录制的,将其录制好后,以pcm文件保存;n)录制完毕后,将pcm文件发送至语音服务器;o)语音服务器调用语音识别模块,对传输过的pcm文件进行解析;p)将解析后的数字信息以文本形式回发给智能终端。
地址 210016 江苏省南京市白下区联合村169号21-607室