发明名称 基于主动轮廓模型和细胞神经网络的生物芯片分析方法
摘要 本发明公开了一种基于主动轮廓模型和细胞神经网络的生物芯片分析方法,包括以下步骤:对矩形样点采用改进的Hough变换进行倾斜校正,而对于圆形样点则采用改进的Radon变换;基于投影法对样点进行初次定位,并生成优化后的网格;然后基于邻域搜索自适应地调整网格,对样点进行二次精确定位;根据贪婪算法优化主动轮廓模型,利用CNN将样点按信号强弱进行分类;将Multiple snakes与CNN结合,CNN先学强信号样点snake的收敛行为,再指导弱信号样点snake的收敛,最终实现样点的合理分割;提取并输出微阵列样点信号数据。本发明解决了生物芯片图像倾斜校正、形状不规则样点及弱信号样点分割困难等问题,实现了生物芯片样点的自动识别,适合大规模的生物芯片样点快速分析。
申请公布号 CN103236065B 申请公布日期 2015.11.04
申请号 CN201310168888.5 申请日期 2013.05.09
申请人 中南大学 发明人 刘正春;吴灶全;陈熹;彭程;柳建新
分类号 G06T7/00(2006.01)I;G06N3/08(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 长沙正奇专利事务所有限责任公司 43113 代理人 马强
主权项 一种基于主动轮廓模型和细胞神经网络的生物芯片分析方法,其特征在于,该方法为:1)若原始生物芯片图像未发生倾斜,即图像准直,则进入4);若图像发生倾斜,即倾斜角度在[‑5°,5°]范围内,则进入2);若图像倾角超出[‑5°,5°]范围,则认为芯片图像的质量不符合要求,不进行后续的分析;2)将生物芯片图像二值化,计算二值的生物芯片图像的倾斜角度,得到其相反数为最佳的倾斜校正角度;3)利用所述最佳的倾斜校正角度和图像几何空间变换的原理,对倾斜的原始生物芯片图像进行旋转校正并灰度化,得到准直的芯片灰度图像;4)对所述准直的芯片灰度图像进行投影计算,得到准直的芯片灰度图像在水平和竖直两个方向上的投影波形P<sub>H</sub>(x),P<sub>V</sub>(y),将投影波形进行开闭级联运算操作和自适应二值化处理,得到二值投影方波;5)二值投影方波P<sub>H</sub>(x)的波峰中心对应着每一行样点的中心,在所述中心划分网格线,确定样点行在水平方向的坐标;二值投影方波P<sub>H</sub>(x)的波谷中心对应着样点行间空隙的中心位置,在所述中心位置划分网格线,将每个样点分割到各自的子区域中;运用上述同样的方法处理二值投影方波P<sub>V</sub>(y);6)读取上述二值投影方波的各个波峰和波谷的宽度,以及波峰中心与波谷中心的位置;运用数学统计学原理,计算出贴近真实的平均波峰宽度和平均波谷宽度,以及平均波峰中心距;7)结合数学统计学原理,通过判断每条网格线对应的方波的波峰宽度和中心距,发现冗余网格线并予以剔除;对剩余的网格线重新进行计算,添补缺失的网格线;对网格线的位置与数量进行调整,生成优化后的网格线,完成对样点的初次定位;8)将步骤6)获得的平均波峰宽度用作二次精确定位网格的初始直径,对每个样点生成一个二次精确定位网格;对于圆形样点图像,网格设计成圆形;对于矩形样点图像,网格设计成矩形;9)基于邻域搜索和自适应调整的原理,对样点进行二次精确定位:运用邻域搜索算法,对上述产生的二次精确定位网格的中心位置逐个进行调整;通过比较网格内部样点信号数据,确定尺寸调整方向,再按照直径调整准则进行调整;使得网格最终能将样点套住,信号区域完全落在网格内部,同时套住的背景区域像素数目达到最小值;10)根据贪婪算法优化主动轮廓模型,利用细胞神经网络CNN将芯片样点按信号强弱进行分类;将多主动轮廓模型Multiple snakes与CNN结合,CNN先学习强信号样点snake的收敛行为,并得到强信号样点的snake轮廓;再指导弱信号芯片样点snake的收敛,得到弱信号芯片样点的snake轮廓,最终实现芯片样点信号区域的分割,提取芯片样点信号区域内灰度强度作为后续处理的数据;11)计算每个样点信号区域内部的灰度总值、平均值和方差,统计得到芯片样点的信号值;计算样点snake轮廓外部环形区域的灰度强度信息,统计出每个样点的背景值,最后输出生物芯片样点分析数据;所述步骤2)中,计算二值的生物芯片图像的倾斜角度时,对矩形样点图像采用改进的Hough变换检测倾斜角度,对于圆形样点图像则采用改进的Radon变换:a)采用改进的Hough变换检测矩形样点图像的倾斜角度过程如下:1)对生物芯片图像进行灰度化,然后进行一次形态学的开闭运算级联操作;接着运用Otsu算法将芯片图像二值化;2)计算矩形样点的上下边缘像素的Hough参数和累计值;以二值的生物芯片图像的中心为计算原点,以对角线长度为ρ轴最大值,步长为1;以5°为θ轴的最大值,步长为0.01°,计算Hough参数空间;统计ρθ参数空间中各曲线交点的信号累加值,对应着各个角度上特征点的累计数量;3)选择图像宽度的1/10为最小直线长度A<sub>min</sub>;遍历Hough参数空间,如果参数空间坐标(ρ<sub>i</sub>,θ<sub>j</sub>)的累加值为A(i,j),代表直线xcosθ<sub>j</sub>+ysinθ<sub>j</sub>=ρ<sub>i</sub>的累计长度为A(i,j);如果线长度A(i,j)小于A<sub>min</sub>,则表明该直线不占主导地位,舍去不记录;反之,如果线长度A(i,j)不小于A<sub>min</sub>,则进一步判别它是否为局部极大值;根据局部峰值半径r,将Hough参数空间中A(i,j)的r×r邻域值与当前累加值A(i,j)比较,如果A(i,j)在局部区域内是极大值,则表明该直线起主导作用,保存到直线组并用于下一步计算;4)将上述步骤3)中提取到的直线组按照累计长度从大到小排序,从而得到最大累计长度A<sub>max</sub>,分别计算累计长度较长的前10条直线的相对长度<img file="FDA0000746306660000021.GIF" wi="350" he="143" />提取相对长度不小于0.5的直线,计算它们的平均倾斜角度<img file="FDA0000746306660000022.GIF" wi="76" he="71" />则最佳的倾斜校正角度为平均倾斜角度的相反数<img file="FDA0000746306660000023.GIF" wi="115" he="72" /><img file="FDA0000746306660000024.GIF" wi="286" he="273" />其中,M为相对长度不小于0.5的直线的条数,R<sub>m</sub>为相对长度不小于0.5的直线的相对长度,θ<sub>m</sub>为相对长度不小于0.5的直线的倾斜角度;b)采用改进的Radon变换检测圆形样点图像的倾斜角度过程如下:1)选择Otsu算法将芯片图像二值化,得到二值的生物芯片图像A;通过形态学腐蚀操作提取圆形样点的边缘,使用最小的结构元B对二值的生物芯片图像A进行腐蚀,再用A减去腐蚀图像ε<sub>B</sub>(A),得到二值边缘图像β(A)=A‑ε<sub>B</sub>(A),且二值边缘图像边缘宽度为1;2)在倾斜角度[‑5°,5°]区间内θ以0.1°为步长,对二值边缘图像进行第一级Radon变换,得到宽度为101的Radon参数空间g(ρ,θ);固定θ值为θ<sub>k</sub>, 计算投影g(ρ,θ<sub>k</sub>)的累计值<img file="FDA0000746306660000031.GIF" wi="390" he="147" />遍历所有累计值,最大累计值A<sub>m</sub>所对应的θ<sub>m</sub>为初次倾斜角度;记初次倾斜角度为<img file="FDA0000746306660000032.GIF" wi="93" he="82" />在<img file="FDA0000746306660000033.GIF" wi="324" he="85" />区间θ以0.01°为步长,对二值边缘图像进行第二级Radon变换,得到宽度为301的Radon参数空间g(ρ,θ);通过计算投影的累计值并比较出最大值,从而得到对应的二次倾斜角度<img file="FDA0000746306660000034.GIF" wi="87" he="86" />其相反数<img file="FDA0000746306660000035.GIF" wi="98" he="82" />即为最佳的倾斜校正角度。
地址 410083 湖南省长沙市岳麓区麓山南路932号