一种语音识别效果自动化测试系统及测试方法,申请号CN201310751488.7-传众专利搜索

发明名称	一种语音识别效果自动化测试系统及测试方法
摘要	一种语音识别效果自动化测试系统及测试方法，包括：自动配置模块、语音的自动播放和自动记录模块、语音识别及结果统计模块；操作者仅需事先准备测试素材，执行全过程自动，极大减少了人的参与，节约了人力成本，可以反复测试验证，并且满足几天几夜的大规模测试，测试结果自动进行统计，避免人工误差，极大提升测试效率和准确度，该系统可应用到任一台式机或笔记本等设备上，对其识别效果评估上，快速得到结果数据，承担人力无法完成的任务，给各厂商提供了极大便利。
申请公布号	CN103745731A	申请公布日期	2014.04.23
申请号	CN201310751488.7	申请日期	2013.12.31
申请人	安徽科大讯飞信息科技股份有限公司	发明人	程美;鹿晓亮;吴如伟;朱明凤;吴晓杰
分类号	G10L25/60(2013.01)I;G10L25/69(2013.01)I;G10L15/18(2013.01)I;G10L15/28(2013.01)I	主分类号	G10L25/60(2013.01)I
代理机构	北京科迪生专利代理有限责任公司 11251	代理人	成金玉;贾玉忠
主权项	一种语音识别效果自动化测试系统，其特征在于包括：自动配置模块、语音的自动播放和自动记录模块、语音识别及结果统计模块，其中：自动配置模块，对音频播放和录音声卡设备、声道、音量大小进行设置，最终生成设备和播放方式配置文件；所述配置文件提供一组默认设置，如果用户忘记设置，则启用默认设置，默认设置为系统默认声卡的左声道播放待识别的录音音频，右声道播放用于模拟真实噪音环境的噪音录音音频，该噪音音频一般都是根据实际使用场景采集取得，另外一个声卡用于播放音乐音频；如果不适用默认设置，用户自行选择进行设置；该模块还对音频音量大小进行校准，用于模拟各种不同信噪比下的识别效果；完成所有设置后，将最终用户设置写入设备和播放方式配置文件，即config.txt文件送至语音自动播放和自动记录模块；语音的自动播放和自动记录模块：调用自动配置模块中的设备和播放方式配置文件，即config.txt文件，模拟播放音频，同时自动录制音频，完成对音频的放音和收音操作，并且能根据指定格式生成测试音频列表；收音即录音，会将识别、噪音和音乐播放的声音同时混合录到指定文件中，录制后的音频名与识别音频文件名相同，会保存在不同的文件夹中；音频存放路径统一为Sound，包含4个子文件夹Utterance、Music、Noise、Record，其中Utterance‑听写识别会话音频，Music‑音乐文件，Noise‑噪音文件，Record‑录音收集文件，Record中的音频是最终用于识别的文件，Record目录包含4个子文件夹All、Babble、Music、Clean，分别存放混合背景噪音和音乐的识别文件、仅混合噪音的识别文件、仅混合音乐的识别文件、纯净的识别文件，具体要测试哪些场景下的效果，可以由用户自行配置和使用；以上生成的音频和测试执行脚本，会送至语音识别及结果统计模块，供其自动测试使用；语音识别及结果统计模块：该模块是对前两个模块成果进行最终验证，生成识别测试脚本，执行批量识别，统计识别结果，它只与语音的自动播放和自动记录模块发生直接关系，根据Record目录中要测试的音频类别，生成多组测试脚本，按顺序批量识别自动播放和自动记录模块采集的音频，生成识结果文件；自动依据动态规划的方法来对其原始标注与识别结果，统计替换错误、插入错误和删除错误数目，最终统计出识别字错误率和命令词正确率效果指标；结果数据均以csv文件顺序保存，该文件被用户直接查阅，非常便捷查看出多次测试的结果。
地址	230088 安徽省合肥市高新开发区望江西路666号