发明名称 基于字典学的压缩感知视频编解码系统
摘要 本发明涉及视频压缩感知和图像稀疏表示领域,为设计一个针对无线视频传感网络的压缩感知视频编解码系统,使其具有编码端复杂度低和计算量小,信道传输数据量少,解码端能够进行高质量实时视频重构等特点。为此,本发明采用的技术方案是,基于字典学的压缩感知视频编解码系统,主要包括视频编码端和解码端两部分:编码端:根据压缩感知理论,将K帧的图像像素数据进行临时存储、降维,将降维后的数据通过无线发射模块传输给解码端;在解码端,K帧经过压缩感知重构算法即改进型的修正牛顿法(NSL0)解码出来并储存,最后按照帧序整合成视频并输出。本发明主要应用于视频压缩感知、传输。
申请公布号 CN103596010B 申请公布日期 2017.01.11
申请号 CN201310589803.0 申请日期 2013.11.20
申请人 天津大学 发明人 郭继昌;金卯亨嘉;申燊;许颖;孙骏
分类号 H04N19/177(2014.01)I;H04N19/61(2014.01)I;H04N19/88(2014.01)I 主分类号 H04N19/177(2014.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 刘国威
主权项 一种基于字典学习的压缩感知视频编解码系统,其特征是,主要包括视频编码端和解码端两部分:编码端:根据重构精度和实时性的要求,视频中的帧将被分为两类,一类为关键帧K帧,另一类为非关键帧CS帧,每两帧组成一个小组,即图像组GOP为2,奇数帧为K帧,紧随其后的为该组的CS帧;针对K帧,根据压缩感知理论,将K帧的图像像素数据进行临时存储,然后通过观测矩阵Φ进行降维,将降维后的数据通过无线发射模块传输给解码端;针对CS帧,在读入图像像素数据后,与前一帧K帧进行差分,即dv=Xcs‑Xk,并判断dv的均方误差值(MSE),若MSE小于阈值下限,则判定这两帧非常相似,发送一个1bit信号通知解码端该CS帧无需重构,直接使用前一帧K帧重构结果作为其重构结果;若MSE大于阈值上限,将dv通过观测矩阵Φ降维,将降维后的数据发送给解码端,同时发送1bit信号通知解码端在完成此CS帧重构后进行字典学习;若MSE在阈值范围内,则直接将dv通过观测矩阵Φ降维并发送;在解码端,K帧经过压缩感知重构算法NSL0解码出来并储存,如果编码端传来更新字典的信号,则根据K‑奇异值分解算法(K‑SVD)进行稀疏矩阵的字典更新;对于CS帧,使用K帧更新过的系数矩阵和观测矩阵进行NSL0压缩重构,将重构出的结果与前一帧K帧的重构结果相加得到CS帧的重构,最后按照帧序整合成视频并输出;压缩感知理论具体是指,采用K‑SVD字典学习法生成稀疏字典,初始的稀疏字典设定为全局字典,即使用摄像头所处场景的图片训练出来的字典。
地址 300072 天津市南开区卫津路92号