发明名称 一种基于SOPC的可进化的语音识别红外控制器
摘要 本发明属于语音识别控制技术领域,具体为是一种基于SOPC的可进化的语音识别红外控制器。该控制器由可配置软核处理器及其接口、可配置语音处理芯片、FLASH存储器、数字信号处理器、红外收发机、LCD模块组成。本发明通过对用户的语音训练库进行采集和基于MEL倒谱的特征提取,形成识别用户语音命令的语料库,并通过与红外控制信号进行库匹配,实现基于红外信号的语音识别控制系统。本发明实现了应用范围广、兼容性高的红外信号收发机制,通过采样保存不同红外信号,达到了整合种类繁杂的红外控制器的目的,并进一步与语音识别结合,实现了兼容所有红外协议的语音控制系统。同时基于SOPC系统可进化的特性,提供了一种低成本、高实用性的语音控制解决方案。
申请公布号 CN102496262B 申请公布日期 2013.08.21
申请号 CN201110425600.9 申请日期 2011.12.19
申请人 复旦大学 发明人 叶凡;薛元坤;井冰;任俊彦
分类号 G08C23/04(2006.01)I;G10L15/02(2006.01)I;G10L15/26(2006.01)I 主分类号 G08C23/04(2006.01)I
代理机构 上海正旦专利代理有限公司 31200 代理人 陆飞;盛志范
主权项 一种基于SOPC的可进化的语音识别红外控制器,其特征在于包括:可配置软核处理器及其接口、数字信号处理部件、FLASH存储器、语音编码器、红外收发器和LCD模块,其中:所述的可配置软核处理器及其接口,采用Altera公司生产的Cyclone II EP‑2C35实现,其内部包括软核处理器、红外FIFO接口电路、FLASH控制器;其中,所述软核处理器作为控制单元,负责通过执行用户软件指令,实现语音数据与红外控制数据的采集、调度和模板匹配;所述红外FIFO接口电路提供与软核处理器内部总线匹配的数据采集接口,以方便通过软件指令来调度和匹配红外控制信号;所述FLASH控制器负责匹配片外FLASH存储器的读写时序,以保证可靠的数据读写;所述的数字信号处理部件,指运算Mel倒谱特征参数的所有硬线数据处理单元,包括:256点FFT、Mel滤波器、离散余弦变换单元;所采集到的语音信号通过256点FFT运算得到语音信号的功率谱;Mel滤波器为一组Mel频标上线性分布的三角窗滤波器,用于对语音信号的功率谱进行滤波,以此模拟人耳的掩蔽效应;离散余弦变换单元用以去除各维信号之间的相关性;该数字信号处理部件以流水的形式对语音信号进行复数帧的特征参数的提取; 所述的FLASH存储器,采用Spansion公司生产的S29AL032D‑Flash存储器,该FLASH存储器为语音信号的特征参数以及红外控制信号的存储提供非挥发性的存储介质;FPGA芯片的配置文件和软件也存储在FLASH存储器上,以实现上电后自动配置为设计的系统;所述的语音编码器,采用Wolfson生产的WM8731语音编码芯片,该芯片用于将用户的模拟信号语音命令通过ADC采样量化为脉冲调制PCM的数字信号,并提供低通滤波和降噪处理,高保真地为语音命令的特征参数提取提供数据源;所述的红外线收发器,采用Agilent Technologies生产的HSDL‑3201红外收发器,该红外收发器将用户的红外控制设备的信号进行接收、采集并与相应的语音命令配对后,存储在上述的FLASH存储器中,形成用户的语音命令库等待用户调用;所述LCD模块,用于用户和系统之间的信息交互;所述的可进化的语音识别红外控制器,其输入为用户的语音命令和用户定义的红外控制设备的红外控制信号,通过语音编码器的语音编码、数字信号处理部件的特征提取,再经过红外线收发器的红外控制采集、模板匹配后,输出用户期望的语音命令代表的红外控制信号。
地址 200433 上海市杨浦区邯郸路220号