发明名称 一种可通过语音识别的视频监控联网系统
摘要 本发明公开一种可通过语音识别的视频监控联网系统,该系统包括:词典场景语音模块,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;相似度比较模块,适于将输入语音信号的特征矢量依次与词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;语音识别引擎模块,适于根据语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在监控视频数据库中搜索到目标视频。本发明通过相似度比较,在模版数据库中找出与输入语音信号相似度最高的语音识别结果,并根据语音识别结果获得词解码序列,从而转换代码进行执行查找。
申请公布号 CN105338327A 申请公布日期 2016.02.17
申请号 CN201510859822.X 申请日期 2015.11.30
申请人 讯美电子科技有限公司 发明人 阚涛
分类号 H04N7/18(2006.01)I;H04N21/472(2011.01)I;G10L15/22(2006.01)I 主分类号 H04N7/18(2006.01)I
代理机构 重庆信航知识产权代理有限公司 50218 代理人 江涛
主权项 一种可通过语音识别的视频监控联网系统,其特征在于,该系统包括:词典场景语音模块,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;相似度比较模块,适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;语音识别引擎模块,适于根据所述语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在监控视频数据库中搜索到目标视频。
地址 400039 重庆市九龙坡区科园一路5号创新大厦7楼