发明名称 一种基于语音识别的邮箱系统
摘要 本发明公开了一种基于语音识别的邮箱系统。它涉及一种利用语音识别技术来查询处理邮箱中邮件的系统。它涉及一种利用语音识别技术来进行处理邮箱中邮件查询的系统。该语音识别的邮箱系统包括查询终端(如移动手机、带语音输入的PC以及其他各种可采集语音数据的设备)、虚拟身份模块、语音信息处理模块、语音信息校验模块、语音文本互换模块、查询处理模块、邮箱服务器及其邮件仓库所组成。本发明基于语音识别的邮箱系统具有识别率高和安全性好,并且与现在技术相比,具有高适应性,平台无关性,部署灵活,实现对邮箱中邮件的信息进行了结构化信息抽取,也就是将邮件的信息非结构化数据抽取成特定的结构化信息数据。
申请公布号 CN101588322B 申请公布日期 2011.11.23
申请号 CN200910040322.8 申请日期 2009.06.18
申请人 中山大学 发明人 罗笑南;刘宁;曹旦森
分类号 H04L12/58(2006.01)I;G10L15/00(2006.01)I 主分类号 H04L12/58(2006.01)I
代理机构 代理人
主权项 一种基于语音识别的邮箱系统,包括查询终端、虚拟身份模块、语音信息处理模块、语音信息校验模块、语音文本互换模块、查询处理模块、邮箱服务器及其邮件仓库,其特征在于:查询终端是采集语音数据的电子设备,包括移动手机或PC以及各种可采集语音数据的设备,主要功能是实现对终端的特定语音的采集并数字化,其所采集的语音数据要求与虚拟身份模块相连的语音数字数据的语言种类相一致,实现向邮件服务器发出查询请求,发送用户终端的安全身份验证信息、IP地址信息、控制命令连接请求;虚拟身份模块将个人身份、联系方式、语音信息和住所虚拟化,提供唯一的虚拟号码,这个虚拟号码具有通信设备的物理端口的无关性,当用户更改其私人信息时,通过初始设定的安全信息校验进行更改,并使更改后的信息与此虚拟号码相关联,但不改变对每个查询终端具有唯一性的虚拟号码;语音信息处理模块利用语音处理技术对终端采集到的语音数据进行处理,包括频谱整形平稳性处理、滤波处理、去无效冗余帧及抽取语音识别模型的特定参数存储处理;所述的抽取语音识别模型采用基于音素隐含马尔科夫模型,在利用隐含马尔科夫模型解决语言处理问题前,先进行模型的训练,实现基于协同发音上下文相关建模,针对一个音受前后相邻音的影响而发生的变化,使得后一个音的频谱与其他条件下的频谱产生差异来进行语音识别,实现基于音节发音变化词典的方法进行识别语音数字数据信息;用所述的由用户终端所采集到的经语音信息处理模块作了相应处理后的数字数据信息与语音识别模型进行模式匹配,通过N‑best Viterbi帧同步搜索方法,得到识别结果;语音信息校验模块把所述的语音信息处理模块传来的语音数据信息与语音识别模型数据进行模式匹配,利用声学特征的Mel倒谱系数,对两个或多个频率相近的音调同时发出时,并当这两个或多个音调的频率差不小于Mel倒谱系数可测范围内临界带宽时,Mel刻度区别这两种语音数据,以区分不同语音数据来实现语音信息校验;所述的语音文本互换模块,用户从查询终端中收听E‑mail,将一些目标邮件录 音直接转换为文本进行存储,其功能包括把语音数字数据转化成文本信息,把邮件中的文本信息转化成与虚拟身份模块相连的语音数字数据的语言种类相一致的语音数据信息,实现语音识别和语音文本的双向转换;查询处理模块,根据用户终端所提出的操作要求,进行的操作有查询、删除、写邮件、发邮件,所述的查询处理模块与所述的邮箱服务器相连,实现对查询请求的预处理和满足用户终端所提出的操作要求;所述的邮箱服务器与邮件仓库相连,与其进行数据交换、备份的操作。
地址 510006 广东省广州市番禺区大学城中山大学东校区教学实验中心C401