发明名称 数字双向智能语音讲解系统及其方法
摘要 本发明提供一种数字双向智能语音讲解系统,包括PC服务器和终端装置,基于TTS,其中PC服务器仅供管理和配置相应文件,各终端装置可独立工作,具备更好的稳定性。与现有讲解系统只能按照预存的发音文本进行发音讲解不同,本系统各终端装置可选择按预存发音文本发音,或者直接将讲解员的现场声音进行扩音,不受机器干扰,以满足需求最大化和在设备出现故障时的应急措施。发音文件以文本的形式存放和管理,占用资源小,应用灵活性强,可维护性强;可以通过修改文本即可改变发声内容。语音识别关键字以文本形式存放和管理,可根据场馆不同需求进行配置修改,甚至当场管中展品有所变动时,同样能通过服务器快速配置,灵活性非常大。
申请公布号 CN102436808B 申请公布日期 2013.03.27
申请号 CN201110353172.3 申请日期 2011.11.09
申请人 武汉安通科技产业发展有限公司 发明人 陆德宝;吕杰;吴海涛
分类号 G10L13/08(2013.01)I;G10L15/02(2006.01)I;G10L15/22(2006.01)I 主分类号 G10L13/08(2013.01)I
代理机构 湖北武汉永嘉专利代理有限公司 42102 代理人 王丹
主权项 数字双向智能语音讲解系统,包括PC服务器和终端装置,其特征在于:所述的PC服务器包括:网络接口单元,用于PC服务器与各终端装置间的通讯;发音文本库,用于预先存放需要播放的文本文件及其对应的终端号;语音识别关键字库,用于预先存放各终端装置语音识别关键字及其对应的终端号;终端监控管理单元,用于监控和管理各终端装置的在线状态和运行状态;终端设备数据库,用于存放各终端号、状态信息、当前发音文本编号和当前识别关键字编号;所述的终端装置包括网络通讯单元,用于与PC服务器之间的通讯;存储单元,用于存放由网络通讯单元传递过来的发音文本和语音识别关键字;TTS发音单元,用于将发音文本进行语音合成,输出数字语音信号;拾音单元,用于等待用户发出的语音命令并进行本地语音采集;语音识别单元,用于将拾音单元采集到的语音信息进行建模识别,将识别后的结果与识别项进行对比,然后触发TTS发音单元进行语音合成;触发接收单元,用于本地触发控制音频切换单元,选择由机器自动讲解和人工讲解两种方式;D/A转换单元,用于将TTS发音单元输出的数字语音信号转换成模拟语音信号;音频切换单元,用于切换机器合成的模拟语音信号和人工麦克风的模拟语音信号;功放单元,用于将音频切换单元输出的模拟语音信号进行功率放大,并传送给喇叭。
地址 430017 湖北省武汉市中山大道1166号金源大厦B座26楼