发明名称 一种自动调节的咽腔电子喉语音通讯系统
摘要 本发明涉及一种可自动调节的咽腔电子喉语音合成与通讯系统与方法,基于计算机软件平台和外部硬件设备,包括摄像头、麦克风和电子喉振荡器,通过提取使用者面部和颈部运动图像的视觉语音特征信息,实现了对电子喉工作状态及咽腔嗓音源合成的自动控制,不仅使电子喉的使用无需手持,更加简单便捷,而且解决了合成嗓音源与电子喉施加部位不一致和电子喉语音机械不自然的问题,同时对咽腔电子喉重建语音进行动态去噪增强处理,提高了重建语音的质量与可懂度,并通过网络传输技术实现了电子喉语音的远程实时通讯,进一步拓展了电子喉的应用范围,改善了喉切除患者的生活质量。
申请公布号 CN101474104B 申请公布日期 2011.02.09
申请号 CN200910020897.3 申请日期 2009.01.14
申请人 西安交通大学 发明人 万明;吴亮;王素品;吴辉雄;刘菲;翟健东
分类号 A61F2/50(2006.01)I;A61F2/70(2006.01)I;G06K9/00(2006.01)I;G06K9/62(2006.01)I;G10L15/24(2006.01)I 主分类号 A61F2/50(2006.01)I
代理机构 西安通大专利代理有限责任公司 61200 代理人 徐文权
主权项 一种自动调节的咽腔电子喉语音通讯系统,包括电子喉振荡器(2),音视频采集模块与计算机软硬件系统,音视频采集模块包括麦克风、摄像头,摄像头和麦克风(3)固定于麦克风支架上,耳机(1)下方设置有固定带,电子喉施加装置设置于固定带(5)上,其特征在于:该系统包括下述三个主要模块:1)发声过程中面部和颈部运动图像采集与处理模块,实现从运动图像的分析到视觉语音特征参数的提取;2)咽腔嗓音源动态合成模块,将提取的视觉语音特征参数转换为嗓音源合成模型参数,并按照咽腔嗓音源数学模型合成波形;3)咽腔电子喉重建语音实时增强与网络通讯模块,对采集的咽腔电子喉重建语音进行实时增强处理,并将处理后的语音进行远程网络传输,实现网络通讯功能;摄像头通过数据连接线将采集到的运动图像作为输入信号传输给运动图像处理模块进行视觉语音特征参数提取;运动图像处理后输出的视觉语音特征参数,又作为输入信号进入咽腔嗓音源动态合成模块控制波形的合成;合成的咽腔嗓音源波形再次通过数据线输出给电子喉施加装置,施加于颈部咽腔处;重建的咽腔电子喉语音经麦克风设备采集后,通过数据线输入语音实时增强模块,同时语音实时增强模块也接收咽腔嗓音源动态合成模块的输入信号;通讯模块的输入则包括摄像头采集的视频信号与增强后输出的语音信号两部分,最终经过网络输出到另一个客户端,同时另一个客户端发出的音视频信号也是在通讯模块接收并播放;由电子喉施加装置向计算机软硬件系统传输音视频信号进行处理,计算机软硬件系统提取的图像采集与处理模块产生的开关信号与合成的咽腔嗓音源信号传输给电子喉施加装置,电子喉施加装置工作所需的电能由计算机软硬件系统提供。
地址 710049 陕西省西安市咸宁路28号
您可能感兴趣的专利