发明名称 基于宏块特征和统计特性的视频帧间压缩编码方法
摘要 本发明公开了一种基于宏块特征和统计特性的视频帧间压缩编码方法,涉及视频压缩编码领域。本发明包括以下步骤:首先从原始视频数据中提取当前编码宏块的亮度信息;根据对当前编码宏块选择最优帧间模式的统计特性,采用双层预判准则,确定最优帧间编码模式;再利用当前编码宏块的时空相关性特征,有选择性进行帧内编码;根据率失真代价函数,将最佳帧间编码模式和最佳帧内编码模式进行比较,确定最终的帧间编码模式对当前宏块进行编码。本发明方法与视频编码标准H.264中采用的遍历式全搜索的帧间预测编码方法相比较,视频质量几乎没有损失;严格控制了码率增加,保持了原标准算法高压缩比的优越性能,并且能够大幅度提高帧间编码速度。
申请公布号 CN101640802B 申请公布日期 2012.06.20
申请号 CN200910091890.0 申请日期 2009.08.28
申请人 北京工业大学 发明人 刘鹏宇;贾克斌
分类号 H04N7/32(2006.01)I 主分类号 H04N7/32(2006.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 张慧
主权项 1.基于宏块特征和统计特性的视频帧间压缩编码方法,是根据对当前编码宏块选择最优帧间模式的统计特性,采用双层预判准则,首先确定最优帧间编码模式;再利用当前编码宏块的时空相关性特征,有选择性进行帧内编码;实现对宏块进行快速的帧间压缩编码,其特征在于包括下述步骤:步骤一:从视频帧中提取当前编码宏块的亮度值;步骤二:确定最佳帧间编码模式,采用拉格朗日率失真优化准则,作为运动估计和模式选择的判决依据,选择率失真意义上的最好的帧间编码模式;率失真代价值,即RD cost,可按照下面的公式计算:J<sub>mode</sub>(s,c,MODE|λ<sub>mode</sub>)=SSD(s,c,MODE|QP)+λ<sub>mode</sub>×R(s,c,MODE|QP)  (1)式中,MODE表示当前宏块的一种帧间编码模式;s为原始的视频信号;c为采用MODE模式编码后的重构视频信号;λ<sub>mode</sub>为拉格朗日乘子;J<sub>mode</sub>(s,c,MODE|λ<sub>moode</sub>)表示MODE模式下的RD cost,该变量也可以简化表示为RD cost(MODE);R(s,c,MODE|QP)是与模式和量化参数有关的包括宏块头信息、运动矢量和所有DCT块信息的总的二进制位数,它是通过对块进行实际的编码后获得的;QP是编码量化步长;SSD(s,c,MODE)为原始信号与重构信号之间的平方差值和,即:<img file="FSB00000398779300011.GIF" wi="1510" he="132" /><img file="FSB00000398779300012.GIF" wi="1162" he="131" /><img file="FSB00000398779300013.GIF" wi="1009" he="131" />式中,B<sub>1</sub>和B<sub>2</sub>分别表示块的水平像素数和垂直像素数,其取值为16,8,4,s<sub>Y</sub>[x,y],c<sub>Y</sub>[x,y,MODE|QP]表示重建和源视频亮度信号的取值;c<sub>U</sub>,c<sub>V</sub>和s<sub>U</sub>,s<sub>V</sub>表示相应的色差信号的取值;具体包括以下步骤:1)选取自适应阈值T<sub>h</sub>:自适应阈值T<sub>h</sub>由两部分组成,即T<sub>h</sub>=K×T<sub>min-RDcost</sub>;T<sub>min-RDcost</sub>为上一次宏块编码的最小的RD cost;K为可由上一次宏块编码的最小的RD cost自动变化的调整系数组成;其中K的取值原则如下:当T<sub>min-RDcost</sub><2000时,变量B=2000;当T<sub>min-RDcost</sub>>12000时,变量B=12000;当2000≤T<sub>min-RDcost</sub>≤12000时,变量B=T<sub>min-RDcost</sub>;<img file="FSB00000398779300021.GIF" wi="331" he="108" />2)计算帧间模式选择中的Skip模式,即mode0的RD cost,即RD cost(mode0),如果RD cost(mode0)小于阈值T<sub>h</sub>,则直接采用Skip模式为最佳帧间编码模式;否则,计算帧间模式选择中的16×16模式,即mode1的RD cost,如果RD cost(mode0)≤α×RD cost(mode1),则仍可采用Skip模式为最佳帧间编码模式;α为Skip模式的优选调节系数;3)若不满足RD cost(mode0)≤α×RD cost(mode1)的条件,比较帧间模式选择中的16×16模式,即Mode1,16×8模式,即Mode2,8×16模式,即Mode3和8×8模式,即Mode4中的RD cost,只有当Mode4的RD cost满足RD cost(Mode4)≤β×MinRD cost(Modei),i=1,2,3条件时,才需继续搜索较小块编码模式(8×4,4 ×8,4×4),并计算帧间模式选择中的8×4模式,即Mode5,4×8模式,即Mode6,4×4模式,即Mode7的RD cost;再采用RDO函数选择最佳帧间编码模式;其中β为大尺寸宏块模式的优选调节系数;步骤三:确定可选择的最佳帧内编码模式,具体包括以下步骤:1)采用在最佳帧间模式下的当前块及其相邻已编码块的边界像素的平均边界误差,即ABE表示时域相关性,其计算方法如下:<img file="FSB00000398779300031.GIF" wi="1035" he="106" />其中系数64=(16+16)<sub>Luma</sub>+(8+8)<sub>Chroma</sub>×2为16×16大小的亮度宏块相邻边界像素与8×8大小的色度宏块相邻边界像素点个数之和,SBE为上述64个像素点与该宏块边界像素点间的差值之和,计算方法为:<img file="FSB00000398779300032.GIF" wi="1812" he="121" /><img file="FSB00000398779300033.GIF" wi="1611" he="119" /><img file="FSB00000398779300034.GIF" wi="1684" he="121" />其中Y<sub>Orig</sub>,U<sub>Orig</sub>,V<sub>Orig</sub>为当前宏块中被编码的像素值;Y<sub>Rec</sub>,U<sub>Rec</sub>,V<sub>Rec</sub>为宏块的重建值;(x,y),(cx,cy)分别对应亮度和色度块左上角的像素点位置;2)采用最佳帧间模式下编码运动补偿所消耗的平均比特数,即AR表示空域相关性,其计算方法如下:<img file="FSB00000398779300035.GIF" wi="1113" he="108" />其中λ=0.85×2<sup>QP/3</sup>,384=(16×16)<sub>Luma</sub>+(8×8)<sub>Chroma</sub>×2为亮度宏块与色度宏块中像素点个数之和;BTD的计算方法为:<img file="FSB00000398779300041.GIF" wi="1122" he="139" /><img file="FSB00000398779300042.GIF" wi="989" he="141" /><img file="FSB00000398779300043.GIF" wi="1522" he="156" />其中Y<sub>Orig</sub>,U<sub>Orig</sub>,V<sub>Orig</sub>为当前宏块中被编码的像素值;Y<sub>Rec</sub>,U<sub>Rec</sub>,V<sub>Rec</sub>为宏块的重建值;(x,y),(cx,cy)分别对应亮度和色度块左上角的像素点位置;3)判断当前宏块是否满足ABE>γ×AR的条件,其中γ为帧内模式的优选调节系数:a)若满足ABE>γ×AR条件,说明当前编码宏块的时域冗余度大于空域冗余度,此宏块选择帧内编码模式的概率较低,可以略过对帧内编码模式的计算,直接采用步骤二中得到的最佳帧间编码模式作为最终的帧间编码模式,则对宏块做运动估计,得到最佳匹配块,求相应的差值,对该值做变换、量化、熵编码,直接进入步骤五;b)若不满足ABE>γ×AR条件,则说明当前编码宏块的空域冗余大于时域冗余度,需要进行帧内编码模式的计算,根据率失真准则,选择率失真意义上的最佳帧内编码模式;步骤四:根据率失真准则,将步骤三中获得的最佳帧内编码模式与步骤二中获得的最佳帧间编码模式做比较,确定最终的帧间编码模式; 步骤五:输出最终的压缩视频码流,保存相关的编码信息。 
地址 100124 北京市朝阳区平乐园100号