发明名称 基于位熵率的视觉注意计算方法及系统
摘要 本发明公开了一种基于位熵率的视觉注意计算方法及系统。所述方法包括:学稀疏码本,获取稀疏码本基函数;采用所述稀疏码本基函数对图像或视频数据进行滤波,获取多个子带特征图;分别为所述每一子带特征图建立对应的全连接图;在所述每一全连接图上采用随机游走的方法进行信息的传递,在随机游走过程中,依据位熵率作进行显著度度量,进而获取每一所述子带特征图对应的位熵率图;将所述多个位熵率图加起来,获取所述图像或视频数据的显著度图。通过了大量的实验证明,无论是在图像显著度分析还是视频显著度分析,基于本发明获取的分析结果都比现有的其他方法更加精确且有生理学、心理学方面的依据来支撑。
申请公布号 CN101751671B 申请公布日期 2011.09.28
申请号 CN200910243706.X 申请日期 2009.12.23
申请人 北京大学 发明人 王亦洲;王威;黄庆明;高文
分类号 G06T7/00(2006.01)I;G06T7/20(2006.01)I;G06T7/40(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 北京市商泰律师事务所 11255 代理人 麻吉凤;毛燕生
主权项 1.一种基于位熵率的视觉注意计算方法,其特征在于,包括如下步骤:滤波步骤,采用稀疏码本基函数对图像或视频数据进行滤波,获取多个子带特征图,其中所述稀疏码本基函数是基于学习稀疏码本而获取的;全连接图建立步骤,分别为所述多个子带特征图的每一子带特征图建立对应的全连接图;位熵率图获取步骤,在每一所述全连接图上采用随机游走的方法进行信息的传递,在随机游走过程中,依据位熵率进行显著度度量,进而获取每一所述子带特征图对应的位熵率图;显著度图获取步骤,将所述多个位熵率图加起来,获取所述图像或视频数据的显著度图;并且所述滤波步骤中,采用所述稀疏码本基函数对视频的每一帧进行滤波,获取每一帧的多个子带特征图,第t帧的第j个子带特征图,依据下式更新:<img file="FSB00000553992600011.GIF" wi="1345" he="199" />其中,f<sub>j</sub>(x,y,t)是更新前的第t帧的第j个子带特征图,f′<sub>j</sub>(x,y,t)是更新后的第t帧的第j个子带特征图,σ是特征衰减率,σ设置为1.5,利用第t帧之前的k帧来对第t帧进行更新;所述全连接图建立步骤中,每一子带特征图对应的全连接图依据如下方式建立: 对应于每一个子带特征图Fk建立一个全连接图G<sub>K</sub>={V<sub>k</sub>,E<sub>k</sub>},其中V<sub>k</sub>={v<sub>k1</sub>,...,v<sub>kn</sub>}是对应于图像像素处的节点,v<sub>ki</sub>=(x<sub>i</sub>,y<sub>i</sub>,f<sub>k</sub>(x<sub>i</sub>,y<sub>i</sub>))有位置和特征响应两个属性,E<sub>k</sub>={e<sub>kij</sub>,i,j=1,...n}是节点之间的加权边,其中e<sub>kij</sub>=(i,j,w<sub>kij</sub>);权重w<sub>kij</sub>包含特征差异度Φ<sub>kij</sub>和空间距离d<sub>ij</sub>这两项,w<sub>kij</sub>=Φ<sub>kij</sub>*d<sub>ij</sub>其中Φ<sub>kij</sub>和d<sub>ij</sub>表示为Φ<sub>kij</sub>=exp{|f<sub>k</sub>(x<sub>i</sub>,y<sub>i</sub>)-f<sub>k</sub>(x<sub>j</sub>,y<sub>j</sub>)|/M<sub>k</sub>}<img file="FSB00000553992600021.GIF" wi="789" he="83" />M<sub>k</sub>是每个子带特征图中的最大特征响应差,D是图像的最大维度,λ用来调节这两项的重要性,设置为5;所述位熵率图获取步骤中,所述位熵率用于确定所述每一子带特征图对应的全连接图中,每个节点i到其他节点的平均信息量SER<sub>i</sub>表示为:<img file="FSB00000553992600022.GIF" wi="448" he="101" />其中,π<sub>i</sub>是随机游走过程的静止概率,P<sub>ij</sub>是节点i到节点j的转移概率,i、j均为自然数。
地址 100871 北京市海淀区中关村颐和园路5号