发明名称 一种广播电视语音识别系统方法及系统
摘要 本发明公开了一种广播电视语音识别方法及系统,其中方法包括:根据广播电视数据提取出音频数据;对音频数据进行预处理,得到特征文本数据;将特征文本数据发送给云服务器进行识别处理,得到男女声识别、说话人识别以及语音识别结果;对数据预处理、男女声识别、说话人识别以及语音识别结果进行融合以及结构化文本标识,生成结构化的语音识别结果。该方法对现有语音识别方法进行改进,融合各种广播电视数据预处理技术以及广播电视语音识别方法,对语音数据针对广播电视行业的数据处理要求进行识别处理,对各识别结果进行融合并生成结构化的语音识别结果,能够为后续广播电视节目的其他业务的智能化处理提供基础数据,且处理速度加快并提高准确度。
申请公布号 CN103700370A 申请公布日期 2014.04.02
申请号 CN201310648375.4 申请日期 2013.12.04
申请人 北京中科模识科技有限公司 发明人 陈鑫玮;徐波
分类号 G10L15/26(2006.01)I;G10L15/30(2013.01)I;H04N21/439(2011.01)I 主分类号 G10L15/26(2006.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 李相雨
主权项 一种广播电视语音识别方法,其特征在于,包括:S1、根据广播电视数据提取出音频数据;S2、对所述音频数据进行预处理,得到特征文本数据;S3、将所述特征文本数据发送给云服务器进行识别处理,得到男女声识别、说话人识别以及语音识别结果;S4、对所述数据预处理、男女声识别、说话人识别以及语音识别结果进行融合以及结构化文本标识,生成结构化的语音识别结果。
地址 100190 北京市海淀区中关村东路95号自动化大厦5层