基于视频识别与提取影片图像的系统,申请号CN201110104465.8-传众专利搜索

发明名称	基于视频识别与提取影片图像的系统
摘要	本发明公开了一种基于视频识别与提取影片图像的系统，其特征在于包括如下步骤：1)预处理服务器将视频和音频转化为标准的待识别语音；2)预处理服务器将视频转化为标准的待识别图像；3)预处理服务器将视频字幕转化为标准的待识别的二值化图像；4)对待识别语音和图片样本库中的图片以及二值化图像进行特征提取，5)索引服务器对被识别的视频文件进行语音、图像或文字进行特征提取，然后索引服务器将获取的语音、图像或文字的特征同步骤4得的特征数据库中的特征值进行相似度的比较，最终获取匹配结果用于用户调用。该系统具有抓取图像精准，使识别与提取影片图像的功能完全不影响网页原本的流览速度等特点。
申请公布号	CN102222227B	申请公布日期	2013.07.31
申请号	CN201110104465.8	申请日期	2011.04.25
申请人	中国华录集团有限公司;华录文化产业有限公司	发明人	李亚欧;吕齐;李金国
分类号	G06K9/46(2006.01)I;G06K9/36(2006.01)I;G06F17/30(2006.01)I	主分类号	G06K9/46(2006.01)I
代理机构	大连东方专利代理有限责任公司 21212	代理人	李洪福
主权项	一种基于视频识别与提取影片图像的系统，其特征在于包括如下步骤：步骤1预处理服务器将预处理视频中的音频部分转化为标准的待识别语音；步骤2预处理服务器将预处理视频转化为标准的待识别图片：即预处理服务器先将视频分割成独立的镜头，然后通过选取每个镜头的关键帧来表示该镜头，从输入的视频中利用关键帧提取视频文件中的多组图片，并保持分离出来的图片与原来的关键帧时间点一致，然后对图片数据进行数字降噪处理，并将非标准像素点转化为标准像素点后，输出标准的待识别图片，以此获取图片样本库；步骤3预处理服务器将预处理视频中的视频字幕转化为标准的待识别二值化图像；将视频文字尺寸、长宽、笔画类型和笔画密度提取，然后将视频中的文本看作具有特征的特殊符号，综合视频的时域特征信息，进而转化成待识别的二值化图像；将预处理视频分割为独立的镜头，在镜头段内利用字幕的出现与消失所引起的相继两帧的差别，定位出字幕区域，得到了原始图像中出现文字的一系列矩形区域，将这些矩形区域分离出来，就得到了原图像的一系列子图像，从文字块中将背景去除，得到只含文字信息的二值图像；步骤4对待识别语音和图片样本库中的图片以及二值化图像进行特征提取，即进行声音的语调和波长特征提取，图像的颜色、纹理和形状特征提取，文字的尺寸、笔画密度、对象信息和空间关系特征提取；最后输出标准的特征值，以此获得特征数据库；步骤5索引服务器对被识别的视频文件进行语音、图像或文字进行特征提取，然后索引服务器将获取的语音、图像或文字的特征同步骤4得的特征数据库中的特征值进行相似度的比较，如果比较的结果满足相似度80%以上，这个被识别的视频文件中的语音、图像或文字被识别，然后将被识别的语音、图像或文字对应的图像进行提取，并存储在本地服务器上，用于用户调用；如果比较的结果不满足相似度80%，返回到上述相似度的比较操作，再进行相似性匹配，直到满足于匹配条件；所述步骤1中音频部分转化为标准的待识别语音的过程如下：通过检测音频部分的声音信号中是否有连续稳定的基音频率或基波周期存在，在提取出音频部分的数据，并保持了提取出来的音频和原有的视频在时间轴方向的一致，对原始语言进行处理，滤除掉背景噪声，而后进行语音信号的预加重、语音分帧、端点检测处理，音频数据经过数字降噪技术处理后形成标准的待识别语音。
地址	116023 辽宁省大连市高新园区华路1号