发明名称 一种基于自适应神经网络的视频传输丢包恢复方法
摘要 本发明涉及一种基于自适应神经网络的视频传输丢包恢复方法。现有的网络传输中使用的协议低层有纠错码,但只能解决包内误码,无法解决丢包问题。本发明首先视频信息作为当前环境的状态输入,输出在这些输入状态下应该使用的视频编码码率。其主要的网络丢包模型使用了基于反向传播自适应神经网络的AHC模型。学过程中,Critic接受环境的奖励反馈,更新Value(x),并将奖励预测误差以外界反馈的形式交给Actor模块,用于指导Actor纠正选取动作的策略。本发明有效降低网络丢包对IP视频呼叫的影响,提高视频互动的稳定性。
申请公布号 CN102413378A 申请公布日期 2012.04.11
申请号 CN201110341336.0 申请日期 2011.11.02
申请人 杭州电子科技大学 发明人 柳毅;王晓耘;周涛;刘大为
分类号 H04N21/647(2011.01)I 主分类号 H04N21/647(2011.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 杜军
主权项 1.一种基于自适应神经网络的视频传输丢包恢复方法,其特征在于该方法包括以下步骤:步骤1.选择视频丢包恢复模型的输入变量和输出变量,确定训练样本;具体方法为: 输入变量包括三类网络参数信息及视频信息,所述的三类网络参数信息分别是4个时延状态值、4个抖动状态值、1个丢包率状态值;所述的视频信息为6个帧复杂度状态值, 输出变量为使用的视频编码码率;步骤2.数据归一化处理,对输入和输出序列中的数据进行归一化处理,具体是对时延、抖动和帧复杂度的状态变量参数进行规格化处理,转化为[0, 1]范围的值;步骤 3.视频传输网络丢包模型使用了基于反向传播自适应神经网络的AHC模型(Actor-Critic模型),具体方法是:通过使用三个神经网络分别用来拟合Critic中的Value(x)、Actor中的μ(x)和α(x),其中μ(x)和α(x)分别表示输出值的均值和标准差;所述的Actor负责产生当前状态条件下的一个动作;所述的Critic则负责学习预测当前状态条件下可能得到的奖励;所述的Value(x)为Critic对环境奖励进行预测的函数;三个神经网络的输入相同,都是规格化之后的变量状态值,输入层共有15个输入单元为Inputl-Inputl5;每个神经网络有一个隐层,隐层有三个神经元组成为Hiden1-Hiden3;输出层有一个输出神经元为Out;网络中的每个神经元的门限函数使用的是可微的sigmoid函数;步骤4.训练BP神经网络的学习过程中;具体方法是:在时刻t-1时Actor选择一个码率,而后会收到环境的反馈奖励信息,此处即是校正后的视频质量信息;此时Critic需要使用Q-learning更新规则,更新自己的奖励预测函数;Q-learning更新规则是预测函数在时刻t-1时预测的偏差,下式所示<img file="2011103413360100001DEST_PATH_IMAGE002.GIF" wi="200" he="29" />其中r<sub>t-1</sub>是时刻t-1的动作所收到的奖励,Value<sub>t</sub>与Value<sub>t-1</sub>分别为时刻t与t-1时Critic对所处环境进行评估后函数Value(x)的输出值,γ是一个学习参数;上式使用预测函数Value(x)当前的预测值来代替将来可以获得的奖励的实际值,然后加上由时刻t-1到时刻t之间所得的奖励,就是时刻t-1时应该得到的奖励;步骤5.测试BP神经网络; 对训练完成的BP神经网络进行测试,将历史数据按照步骤(1)中的网络参数信息以及视频信息组成输入信息,再按照步骤(2)进行归一化处理,这样经过规格化后共得到14个输出数据,另外加上丢包率,共有15个Input分别与outl-outl5相对应;按照步骤(3)直接调用MatLab神经网络工具箱中的sim函数,对测试矩阵进行仿真,其中网络中每个神经元的门限函数都是可微的Sigmoid函数,对应为视频传输网络的丢包预测值;步骤6.数据反归一化处理;输出即为当前状态下的视频码率值进行反归一化处理,使用服从均值为μ(x)、标准差为α(x)的高斯分布随机数发生器来产生输出值。
地址 310018 浙江省杭州市下沙高教园区2号大街