发明名称 |
一种广播电视语音识别系统方法及系统 |
摘要 |
本发明公开了一种广播电视语音识别方法及系统,其中方法包括:根据广播电视数据提取出音频数据;对音频数据进行预处理,得到特征文本数据;将特征文本数据发送给云服务器进行识别处理,得到男女声识别、说话人识别以及语音识别结果;对数据预处理、男女声识别、说话人识别以及语音识别结果进行融合以及结构化文本标识,生成结构化的语音识别结果。该方法对现有语音识别方法进行改进,融合各种广播电视数据预处理技术以及广播电视语音识别方法,对语音数据针对广播电视行业的数据处理要求进行识别处理,对各识别结果进行融合并生成结构化的语音识别结果,能够为后续广播电视节目的其他业务的智能化处理提供基础数据,且处理速度加快并提高准确度。 |
申请公布号 |
CN103700370A |
申请公布日期 |
2014.04.02 |
申请号 |
CN201310648375.4 |
申请日期 |
2013.12.04 |
申请人 |
北京中科模识科技有限公司 |
发明人 |
陈鑫玮;徐波 |
分类号 |
G10L15/26(2006.01)I;G10L15/30(2013.01)I;H04N21/439(2011.01)I |
主分类号 |
G10L15/26(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
李相雨 |
主权项 |
一种广播电视语音识别方法,其特征在于,包括:S1、根据广播电视数据提取出音频数据;S2、对所述音频数据进行预处理,得到特征文本数据;S3、将所述特征文本数据发送给云服务器进行识别处理,得到男女声识别、说话人识别以及语音识别结果;S4、对所述数据预处理、男女声识别、说话人识别以及语音识别结果进行融合以及结构化文本标识,生成结构化的语音识别结果。 |
地址 |
100190 北京市海淀区中关村东路95号自动化大厦5层 |