发明名称 一种模拟视网膜滤波的视觉显著性检测方法
摘要 本发明涉及一种模拟视网膜滤波的视觉显著性检测方法。本发明通过在CIELAB对色通道上建立高斯尺度空间,提取多尺度显著基元,然后在每个尺度层上计算具有对数响应特性的显著基元颜色独特性值和空间紧凑性,并采用一种基于显著基元按颜色独特性值重组的简化-周围算子进行优化滤波。最后经多尺度合成后生成最终显著图。本发明整合了生物视网膜中的多尺度、对数响应和-周围环绕特性,以及纯计算方法中的局部对比度和全局对比度特性。可获得更完整且更均匀高亮的显著性目标区域。
申请公布号 CN103065298A 申请公布日期 2013.04.24
申请号 CN201210560879.6 申请日期 2012.12.20
申请人 杭州电子科技大学 发明人 周文晖;宋腾;孙志海;吴以凡;徐翀
分类号 G06T7/00(2006.01)I;G06T7/60(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 杜军
主权项 1. 一种模拟视网膜滤波的视觉显著性检测方法,其特征在于该方法包括如下步骤:步骤(1):采用彩色变换方法,提取输入图像在CIELAB空间的<i>l</i>彩色分量图、<i>a</i>彩色分量图和<i>b</i>彩色分量图,具体为:对于输入图像<img file="2012105608796100001DEST_PATH_IMAGE002.GIF" wi="18" he="18" />,采用sRGB彩色空间到线性RGB彩色空间的彩色变换方法,将输入图像<img file="610363DEST_PATH_IMAGE002.GIF" wi="18" he="18" />转换为线性RGB彩色空间图像<img file="DEST_PATH_IMAGE004.GIF" wi="21" he="18" />;采用线性RGB彩色空间到CIELAB空间的彩色变换方法,提取线性RGB彩色空间图像<img file="402870DEST_PATH_IMAGE004.GIF" wi="21" he="18" />的<i>l</i>彩色分量图<img file="DEST_PATH_IMAGE006.GIF" wi="21" he="21" />、<i>a</i>彩色分量图<img file="DEST_PATH_IMAGE008.GIF" wi="24" he="21" />和<i>b</i>彩色分量图<img file="DEST_PATH_IMAGE010.GIF" wi="22" he="21" />;步骤(2):根据步骤(1)结果,提取输入图像在CIELAB空间的6层高斯尺度图像,具体为:对于输入图像<img file="55044DEST_PATH_IMAGE002.GIF" wi="18" he="18" />在CIELAB空间的<i>l</i>彩色分量图<img file="450253DEST_PATH_IMAGE006.GIF" wi="21" he="21" />、<i>a</i>彩色分量图<img file="202308DEST_PATH_IMAGE008.GIF" wi="24" he="21" />和<i>b</i>彩色分量图<img file="24771DEST_PATH_IMAGE010.GIF" wi="22" he="21" />,其第<i>n</i>层高斯尺度图像<img file="DEST_PATH_IMAGE012.GIF" wi="21" he="25" />表示为:<img file="DEST_PATH_IMAGE014.GIF" wi="273" he="92" />其中高斯函数<img file="DEST_PATH_IMAGE016.GIF" wi="41" he="28" />的方差为<img file="DEST_PATH_IMAGE018.GIF" wi="17" he="16" />,均值为0;<img file="DEST_PATH_IMAGE020.GIF" wi="18" he="20" />表示卷积运算;步骤(3):采用SLIC超像素聚类方法,提取每层高斯尺度图像中的显著基元;具体为:对于第<i>n</i>层高斯尺度图像<img file="42536DEST_PATH_IMAGE012.GIF" wi="21" he="25" />,采用SLIC方法,设定期望划分的超像素个数<img file="DEST_PATH_IMAGE022.GIF" wi="24" he="26" />,将<img file="179120DEST_PATH_IMAGE012.GIF" wi="21" he="25" />划分为<img file="DEST_PATH_IMAGE024.GIF" wi="24" he="25" />个互不相交且区域面积近似相等的超像素区域;将一个超像素区域视为一个显著基元,即第<i>n</i>层高斯尺度图像<img file="806189DEST_PATH_IMAGE012.GIF" wi="21" he="25" />提取的显著基元个数为<img file="737236DEST_PATH_IMAGE024.GIF" wi="24" he="25" />;取<img file="DEST_PATH_IMAGE026.GIF" wi="73" he="26" />,<img file="DEST_PATH_IMAGE028.GIF" wi="70" he="26" />,<img file="DEST_PATH_IMAGE030.GIF" wi="65" he="26" />,<img file="DEST_PATH_IMAGE032.GIF" wi="65" he="26" />,<img file="2012105608796100001DEST_PATH_IMAGE034.GIF" wi="64" he="26" />,<img file="2012105608796100001DEST_PATH_IMAGE036.GIF" wi="56" he="26" />;步骤(4):提取每层高斯尺度图像中每个显著基元的颜色特征,具体为:对于第<i>n</i>层高斯尺度图像<img file="242298DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="2012105608796100001DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,其颜色特征是由显著基元<img file="916993DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的颜色均值矢量<img file="DEST_PATH_IMAGE040.GIF" wi="24" he="25" />、质心坐标<img file="DEST_PATH_IMAGE042.GIF" wi="22" he="25" />组成;所述的显著基元<img file="312815DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的颜色均值矢量<img file="742659DEST_PATH_IMAGE040.GIF" wi="24" he="25" />表示为<img file="DEST_PATH_IMAGE044.GIF" wi="141" he="30" />,其中<img file="DEST_PATH_IMAGE046.GIF" wi="24" he="26" />为显著基元<img file="859651DEST_PATH_IMAGE038.GIF" wi="21" he="25" />内所有像素的<i>l</i>彩色分量均值,<img file="DEST_PATH_IMAGE048.GIF" wi="24" he="26" />为显著基元<img file="10140DEST_PATH_IMAGE038.GIF" wi="21" he="25" />内所有像素的<i>a</i>彩色分量均值,<img file="DEST_PATH_IMAGE050.GIF" wi="24" he="26" />为显著基元<img file="591294DEST_PATH_IMAGE038.GIF" wi="21" he="25" />内所有像素的<i>b</i>彩色分量均值;所述的显著基元<img file="864144DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的质心坐标<img file="593066DEST_PATH_IMAGE042.GIF" wi="22" he="25" />表示为<img file="DEST_PATH_IMAGE052.GIF" wi="97" he="30" />,其中<img file="DEST_PATH_IMAGE054.GIF" wi="24" he="26" />为显著基元<img file="544317DEST_PATH_IMAGE038.GIF" wi="21" he="25" />内所有像素垂直方向坐标的均值与输入图像高度的比值,<img file="DEST_PATH_IMAGE056.GIF" wi="24" he="26" />为显著基元<img file="979977DEST_PATH_IMAGE038.GIF" wi="21" he="25" />内所有像素水平方向坐标的均值与输入图像宽度的比值;步骤(5):根据步骤(4)结果,提取每层高斯尺度图像中每个显著基元的颜色独特性值,具体为:对于第<i>n</i>层高斯尺度图像<img file="689307DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="577629DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,其颜色独特性值<img file="DEST_PATH_IMAGE058.GIF" wi="53" he="28" />表示为:<img file="DEST_PATH_IMAGE060.GIF" wi="326" he="61" />其中<img file="DEST_PATH_IMAGE062.GIF" wi="72" he="30" />为显著基元<img file="335500DEST_PATH_IMAGE038.GIF" wi="21" he="25" />和显著基元<img file="DEST_PATH_IMAGE064.GIF" wi="21" he="26" />的颜色距离;<img file="DEST_PATH_IMAGE066.GIF" wi="74" he="30" />为显著基元<img file="625667DEST_PATH_IMAGE038.GIF" wi="21" he="25" />和显著基元<img file="505899DEST_PATH_IMAGE064.GIF" wi="21" he="26" />的空间距离;<img file="DEST_PATH_IMAGE068.GIF" wi="68" he="26" />为高斯函数标准差;所述的显著基元<img file="878587DEST_PATH_IMAGE038.GIF" wi="21" he="25" />和显著基元<img file="236887DEST_PATH_IMAGE064.GIF" wi="21" he="26" />的颜色距离<img file="709456DEST_PATH_IMAGE062.GIF" wi="72" he="30" />表示为显著基元<img file="760589DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的颜色均值矢量<img file="685820DEST_PATH_IMAGE040.GIF" wi="24" he="25" />与显著基元<img file="847811DEST_PATH_IMAGE064.GIF" wi="21" he="26" />的颜色均值矢量<img file="DEST_PATH_IMAGE070.GIF" wi="24" he="26" />的L2距离,具体描述为:<img file="DEST_PATH_IMAGE072.GIF" wi="155" he="32" />所述的显著基元<img file="784674DEST_PATH_IMAGE038.GIF" wi="21" he="25" />和显著基元<img file="69025DEST_PATH_IMAGE064.GIF" wi="21" he="26" />的空间距离<img file="419235DEST_PATH_IMAGE066.GIF" wi="74" he="30" />表示为显著基元<img file="384917DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的质心坐标<img file="566499DEST_PATH_IMAGE042.GIF" wi="22" he="25" />与显著基元<img file="690925DEST_PATH_IMAGE064.GIF" wi="21" he="26" />的质心坐标<img file="DEST_PATH_IMAGE074.GIF" wi="24" he="26" />的L2距离,具体描述为:<img file="DEST_PATH_IMAGE076.GIF" wi="158" he="32" />步骤(6):根据步骤(5)的结果,对每层高斯尺度图像中每个显著基元的颜色独特性值进行平滑滤波,并将平滑滤波后的颜色独特性值归一化到[0,1]之间,获取颜色独特性归一化值,具体为:对于第<i>n</i>层高斯尺度图像<img file="466115DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="32225DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,其平滑滤波后的颜色独特性值<img file="DEST_PATH_IMAGE078.GIF" wi="53" he="28" />表示为:<img file="DEST_PATH_IMAGE080.GIF" wi="212" he="161" />其中<img file="DEST_PATH_IMAGE082.GIF" wi="48" he="26" />为第<i>n</i>层高斯尺度图像<img file="209260DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="507517DEST_PATH_IMAGE038.GIF" wi="21" he="25" />和第<i>j</i>个显著基元<img file="894636DEST_PATH_IMAGE064.GIF" wi="21" he="26" />的空间-颜色距离权重;<img file="DEST_PATH_IMAGE084.GIF" wi="21" he="25" />为归一化因子;<img file="DEST_PATH_IMAGE086.GIF" wi="22" he="25" />和<img file="DEST_PATH_IMAGE088.GIF" wi="22" he="26" />分别控制颜色距离和空间距离对平滑效果的敏感度;对于第<i>n</i>层高斯尺度图像<img file="74557DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="965153DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,其颜色独特性归一化值<img file="DEST_PATH_IMAGE090.GIF" wi="53" he="28" />表示为:<img file="DEST_PATH_IMAGE092.GIF" wi="168" he="50" />其中<img file="DEST_PATH_IMAGE094.GIF" wi="38" he="25" />和<img file="DEST_PATH_IMAGE096.GIF" wi="40" he="25" />分别为第<i>n</i>层高斯尺度图像<img file="575257DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中所有显著基元的平滑滤波后的颜色独特性值的最小值和最大值;     步骤(7):根据步骤(4)结果,计算每层高斯尺度图像中每个显著基元的空间紧凑性值,具体为:对于第<i>n</i>层高斯尺度图像<img file="121776DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="295268DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,其空间紧凑性值<img file="DEST_PATH_IMAGE098.GIF" wi="52" he="28" />表示为:<img file="DEST_PATH_IMAGE100.GIF" wi="324" he="58" />其中<img file="DEST_PATH_IMAGE102.GIF" wi="54" he="25" />为高斯函数标准差;     步骤(8):根据步骤(7)的结果,对每层高斯尺度图像中每个显著基元的空间紧凑性值进行平滑滤波,并将平滑滤波后的空间紧凑性值归一化到[0,1]之间,获取空间紧凑性归一化值,具体为:对于第<i>n</i>层高斯尺度图像<img file="118999DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="86955DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,其平滑滤波后的空间紧凑性值<img file="DEST_PATH_IMAGE104.GIF" wi="52" he="28" />表示为:<img file="DEST_PATH_IMAGE106.GIF" wi="198" he="49" />对于第<i>n</i>层高斯尺度图像<img file="55523DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="704810DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,其空间紧凑性归一化值<img file="DEST_PATH_IMAGE108.GIF" wi="52" he="28" />表示为:<img file="DEST_PATH_IMAGE110.GIF" wi="164" he="50" />其中<img file="DEST_PATH_IMAGE112.GIF" wi="37" he="25" />和<img file="DEST_PATH_IMAGE114.GIF" wi="38" he="25" />分别为第<i>n</i>层高斯尺度图像<img file="383048DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中所有显著基元的平滑滤波后的空间紧凑性值的最小值和最大值;步骤(9):根据步骤(6)和步骤(8)的结果,计算每层高斯尺度图像中每个显著基元的颜色显著性值,具体为:对于第<i>n</i>层高斯尺度图像<img file="459588DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="980699DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,其颜色显著性值<img file="DEST_PATH_IMAGE116.GIF" wi="50" he="28" />表示为:<img file="DEST_PATH_IMAGE118.GIF" wi="200" he="30" />步骤(10):根据步骤(6)结果,提取每层高斯尺度图像中每个显著基元的感受野区域,具体为:对于第<i>n</i>层高斯尺度图像<img file="102851DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="25808DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,计算显著基元<img file="273250DEST_PATH_IMAGE038.GIF" wi="21" he="25" />与第<i>n</i>层高斯尺度图像<img file="343974DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中其他显著基元的独特性距离,并按该距离对第<i>n</i>层高斯尺度图像<img file="335064DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的所有显著基元进行升序排列,形成一组新的显著基元序列;在新的显著基元序列中位置处于越前面的显著基元,与显著基元<img file="112527DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的独特性距离越小;提取新的显著基元序列中前<img file="DEST_PATH_IMAGE120.GIF" wi="18" he="16" />个显著基元组成为显著基元<img file="530870DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的“中央”邻域区域<img file="DEST_PATH_IMAGE122.GIF" wi="29" he="26" />;提取新的显著基元序列中第<img file="DEST_PATH_IMAGE124.GIF" wi="37" he="20" />到第<img file="DEST_PATH_IMAGE126.GIF" wi="14" he="16" />个的显著基元组成为显著基元<img file="594551DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的“周围”邻域区域<img file="DEST_PATH_IMAGE128.GIF" wi="29" he="26" />;显著基元<img file="327015DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的“中央”邻域区域<img file="21301DEST_PATH_IMAGE122.GIF" wi="29" he="26" />和“周围”邻域区域<img file="610546DEST_PATH_IMAGE128.GIF" wi="29" he="26" />构成显著基元<img file="593545DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的感受野区域;显著基元<img file="926438DEST_PATH_IMAGE038.GIF" wi="21" he="25" />与显著基元<img file="409984DEST_PATH_IMAGE064.GIF" wi="21" he="26" />的独特性距离<img file="DEST_PATH_IMAGE130.GIF" wi="73" he="30" />表示为显著基元<img file="435709DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的颜色独特性归一化值<img file="640425DEST_PATH_IMAGE090.GIF" wi="53" he="28" />与显著基元<img file="839325DEST_PATH_IMAGE064.GIF" wi="21" he="26" />的颜色独特性归一化值<img file="DEST_PATH_IMAGE132.GIF" wi="54" he="30" />的L2距离,具体描述为:<img file="DEST_PATH_IMAGE134.GIF" wi="213" he="34" />步骤(11):根据步骤(9)和步骤(10)的结果,采用一种简化中央-周围环绕算子计算每层高斯尺度图像中每个显著基元的最终显著性值,具体为:对于第<i>n</i>层高斯尺度图像<img file="117991DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中的第<i>i</i>个显著基元<img file="314617DEST_PATH_IMAGE038.GIF" wi="21" he="25" />,所述的一种简化中央-周围环绕算子描述为:<img file="DEST_PATH_IMAGE136.GIF" wi="310" he="113" />其中<img file="DEST_PATH_IMAGE138.GIF" wi="50" he="28" />为显著基元<img file="944313DEST_PATH_IMAGE038.GIF" wi="21" he="25" />的最终显著性值;<img file="DEST_PATH_IMAGE140.GIF" wi="26" he="28" />为显著基元<img file="616078DEST_PATH_IMAGE064.GIF" wi="21" he="26" />对显著基元<img file="77146DEST_PATH_IMAGE038.GIF" wi="21" he="25" />最终显著性值的贡献权重;<img file="DEST_PATH_IMAGE142.GIF" wi="14" he="18" />为“中央”兴奋强度和“周围”抑制强度的比值;<img file="444674DEST_PATH_IMAGE142.GIF" wi="14" he="18" />取值范围为<img file="DEST_PATH_IMAGE144.GIF" wi="60" he="22" />;当<img file="DEST_PATH_IMAGE146.GIF" wi="38" he="22" />时,所述的一种简化中央-周围环绕算子仅具有“中央”兴奋功能; 步骤(12):为每层高斯尺度图像中的每个像素分配颜色显著性值,并将其归一化到[0,1]之间,获取颜色显著性归一化值,具体为:对于第<i>n</i>层高斯尺度图像<img file="296086DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中像素<img file="DEST_PATH_IMAGE148.GIF" wi="17" he="18" />,其颜色显著性值<img file="DEST_PATH_IMAGE150.GIF" wi="45" he="26" />表示为:<img file="DEST_PATH_IMAGE152.GIF" wi="181" he="28" />对于第<i>n</i>层高斯尺度图像<img file="712155DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中像素<img file="293309DEST_PATH_IMAGE148.GIF" wi="17" he="18" />,其颜色显著性归一化值<img file="DEST_PATH_IMAGE154.GIF" wi="45" he="26" />表示为:<img file="DEST_PATH_IMAGE156.GIF" wi="149" he="49" />其中<img file="DEST_PATH_IMAGE158.GIF" wi="36" he="25" />和<img file="DEST_PATH_IMAGE160.GIF" wi="37" he="25" />分别为第<i>n</i>层高斯尺度图像<img file="500912DEST_PATH_IMAGE012.GIF" wi="21" he="25" />中所有像素的颜色显著性值的最小值和最大值;步骤(13):为输入图像中的每个像素分配合成显著性值,并将其归一化到[0,1]之间,获取最终显著性值,具体为:对于输入图像中像素<img file="167517DEST_PATH_IMAGE148.GIF" wi="17" he="18" />,其合成显著性值<img file="DEST_PATH_IMAGE162.GIF" wi="44" he="26" />表示为:<img file="DEST_PATH_IMAGE164.GIF" wi="122" he="41" />对于输入图像中像素<img file="121698DEST_PATH_IMAGE148.GIF" wi="17" he="18" />,其最终显著性值<img file="DEST_PATH_IMAGE166.GIF" wi="40" he="26" />表示为:<img file="DEST_PATH_IMAGE168.GIF" wi="136" he="49" />其中<img file="DEST_PATH_IMAGE170.GIF" wi="29" he="25" />和<img file="DEST_PATH_IMAGE172.GIF" wi="30" he="25" />分别为输入图像中所有像素的合成显著性值的最小值和最大值。
地址 310018 浙江省杭州市下沙高教园区2号大街