发明名称 一种细胞分裂序列检测方法
摘要 本发明公开了一种细胞分裂序列检测方法,属于图像分析和模式识别领域,所述方法包括以下步骤:基于细胞分裂区域显著特征和时空关联特性的方法获取第一细胞分裂候选区域,并提取细胞分裂候选序列;通过方向梯度直方图对所述第一细胞分裂候选区域进行描述,通过特征提取将所述细胞分裂候选序列转化为特征向量序列;根据特征向量序列,通过隐条件随机场模型的学和推断实现细胞分裂序列识别。本发明不依赖于经验性图像处理,复杂的细胞跟踪,以及有关特定细胞形态或行为规律等生物学知识,提高了鲁棒性和通用性,因此可以广泛应用于显微镜图像序列中细胞行为的自动理解和检测。
申请公布号 CN102156988B 申请公布日期 2012.10.10
申请号 CN201110140805.2 申请日期 2011.05.27
申请人 天津大学 发明人 刘安安
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 温国林
主权项 1.一种细胞分裂序列检测方法,其特征在于,所述方法包括以下步骤:(1)基于细胞分裂区域显著特征和时空关联特性的方法获取第一细胞分裂候选区域,并提取细胞分裂候选序列;(2)通过方向梯度直方图对所述第一细胞分裂候选区域进行描述,通过特征提取将所述细胞分裂候选序列转化为特征向量序列;(3)根据特征向量序列,通过隐条件随机场模型的学习和推断实现细胞分裂序列识别;其中,步骤(1)中所述基于细胞分裂区域显著特征和时空关联特性的方法获取第一细胞分裂候选区域,并提取细胞分裂候选序列具体为:1)采用动态背景建模法去除每幅图像的背景区域及噪声区,包括:对N帧连续图像取平均,作为所述N帧连续图像的背景图像,将每幅图像与所述背景图像做差,去除所述N帧连续图像中的背景区域及噪声区,获取处理后N帧连续图像;对后续N帧连续图像重复执行步骤1);2)将所述处理后N帧连续图像中的每帧图像与第一预设规格的均值滤波器进行卷积,采用阈值进行每帧图像的二值化,获取细胞分裂候选区域;3)去除所述细胞分裂候选区域中的开操作和闭操作,并通过联通区域的提取形成各个独立细胞分裂候选区域;4)以所述各个独立细胞分裂候选区域的几何中心为中点提取第二预设规格的矩形区域作为第一细胞分裂候选区域;5)将所述N帧连续图像的任意相邻两帧图像中,符合空间区域重合条件的所述第一细胞分裂候选区域进行关联运算,提取所述细胞分裂候选序列;其中,步骤(2)中所述通过方向梯度直方图对所述第一细胞分裂候选区域进行描述,通过特征提取将所述细胞分裂候选序列转化为特征向量序列具体为:1)计算第一细胞分裂候选区域的一阶梯度;2)将所述一阶梯度分成预设数量的单元格,将各单元格中所有像素的方向梯度直方图累加,并将方向梯度直方图映射到预设角度上;3)对所述各个单元格内方向梯度直方图进行归一化,所述第一细胞分裂候选区域中所有单元格的特征描述组成了第一细胞分裂候选区域的特征,获取所述特征向量序列;其中,步骤(3)中所述根据特征向量序列,通过隐条件随机场模型的学习和推断实现细胞分裂序列识别具体为:1)隐条件随机场模型的表示:对于序列标记Y、观察序列X、隐藏变量h和模型参数θ,隐条件随机场模型具体为:<maths num="0001"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><mi>Y</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mi>h</mi></munder><mi>P</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><mi>h</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>&Sigma;</mi><mi>h</mi></msub><mi>exp</mi><mrow><mo>(</mo><msup><mi>&theta;</mi><mi>T</mi></msup><mo>&times;</mo><mi>&phi;</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><mi>h</mi><mo>,</mo><mi>X</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><msub><mi>&Sigma;</mi><mrow><msup><mi>Y</mi><mo>&prime;</mo></msup><mo>,</mo><mi>h</mi></mrow></msub><mi>exp</mi><mrow><mo>(</mo><msup><mi>&theta;</mi><mi>T</mi></msup><mo>&times;</mo><mi>&phi;</mi><mrow><mo>(</mo><msup><mi>Y</mi><mo>&prime;</mo></msup><mo>,</mo><mi>h</mi><mo>,</mo><mi>X</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>其中,φ(Y,h,X)∈R为特征函数,表示由节点位置以及节点间关联决定的序列特征,T表示转置;Y′表示序列标记Y中的成员,R表示实数空间;特征函数构造方法如下:<maths num="0002"><![CDATA[<math><mrow><mi>&phi;</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><mi>h</mi><mo>,</mo><mi>X</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><munder><mi>&Sigma;</mi><mrow><mi>j</mi><mo>&Element;</mo><mi>v</mi></mrow></munder><msub><mi>&phi;</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>,</mo><msub><mi>h</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>,</mo><munder><mi>&Sigma;</mi><mrow><mi>j</mi><mo>&Element;</mo><mi>v</mi></mrow></munder><msub><mi>&phi;</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><msub><mi>h</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>,</mo><munder><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mo>&Element;</mo><mi>&epsiv;</mi></mrow></munder><msub><mi>&phi;</mi><mn>3</mn></msub><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><msub><mi>h</mi><mi>j</mi></msub><mo>,</mo><msub><mi>h</mi><mi>k</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths>其中,φ<sub>1</sub>(x<sub>j</sub>,h<sub>j</sub>)表示观测节点与隐藏变量节点之间的关系;φ<sub>2</sub>(Y,h<sub>j</sub>)表示隐藏变量节点与序列标记的关系;φ<sub>3</sub>(Y,h<sub>j</sub>,h<sub>k</sub>)表示隐藏变量节点间形成的边与序列标记间的关系,观察序列X={x<sub>1</sub>,x<sub>2</sub>,...,x<sub>t</sub>},t表示序列长度,x<sub>j</sub>表示观测节点;隐藏变量h={h<sub>1</sub>,h<sub>2</sub>,...,h<sub>t</sub>,},t表示序列长度,h<sub>j</sub>和h<sub>k</sub>表示隐藏变量节点;隐条件随机场模型的图结构G=(v,ε),v表示图的顶点,ε表示图的边;2)隐条件随机场模型的学习:定义函数f<sub>θ</sub>(X,Y)来度量(X,Y)组合的分数:<maths num="0003"><![CDATA[<math><mrow><msub><mi>f</mi><mi>&theta;</mi></msub><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><munder><mi>max</mi><mi>h</mi></munder><msup><mi>&theta;</mi><mi>T</mi></msup><mo>&times;</mo><mi>&phi;</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><mi>h</mi><mo>,</mo><mi>X</mi><mo>)</mo></mrow></mrow></math>]]></maths>定义目标函数和约束集如下:<maths num="0004"><![CDATA[<math><mrow><munder><mi>min</mi><mrow><mi>&theta;</mi><mo>,</mo><mi>&xi;</mi></mrow></munder><mfrac><mn>1</mn><mn>2</mn></mfrac><msup><mi>&theta;</mi><mn>2</mn></msup><mo>+</mo><mi>C</mi><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msup><mi>&xi;</mi><mi>t</mi></msup></mrow></math>]]></maths><maths num="0005"><![CDATA[<math><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><munder><mi>max</mi><mi>h</mi></munder><msup><mi>&theta;</mi><mi>T</mi></msup><mo>&times;</mo><mi>&phi;</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><mi>h</mi><mo>,</mo><msup><mi>X</mi><mi>t</mi></msup><mo>)</mo></mrow><mo>-</mo><munder><mi>max</mi><msup><mi>h</mi><mo>&prime;</mo></msup></munder><msup><mi>&theta;</mi><mi>T</mi></msup><mo>&times;</mo><mi>&phi;</mi><mrow><mo>(</mo><msup><mi>Y</mi><mi>t</mi></msup><mo>,</mo><msup><mi>h</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>X</mi><mi>t</mi></msup><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0006"><![CDATA[<math><mrow><mo>&le;</mo><msup><mi>&xi;</mi><mi>t</mi></msup><mo>-</mo><mi>&Delta;</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><msup><mi>Y</mi><mi>t</mi></msup><mo>)</mo></mrow><mo>&ForAll;</mo><mi>t</mi><mo>,</mo><mo>&ForAll;</mo><mi>Y</mi></mrow></math>]]></maths><maths num="0007"><![CDATA[<math><mrow><msup><mi>&xi;</mi><mi>t</mi></msup><mo>&GreaterEqual;</mo><mn>0</mn><mo>,</mo><mo>&ForAll;</mo><mi>t</mi></mrow></math>]]></maths>其中,X<sup>t</sup>,Y<sup>t</sup>表示样例X<sup>t</sup>及其真实序列级标注Y<sup>t</sup>;C表示平衡间隔大小和样本错判程度的权重;ξ<sup>t</sup>为第t个训练样例引入的松弛项;Δ(Y,Y<sup>t</sup>)=1-δ(Y=Y<sup>t</sup>)表示间隔,δ(Y=Y<sup>t</sup>)为指标函数,Y=Y<sup>t</sup>时,δ(Y=Y<sup>t</sup>)为1,否则为0,h′表示隐状态空间所有状态值中的一个取值;所述目标函数的求解过程采用如下的分布优化方法,通过迭代优化进行:①固定θ和ξ<sup>t</sup>,对样例(X<sup>t</sup>,Y<sup>t</sup>)计算最优隐变量<img file="FDA00001739220400028.GIF" wi="47" he="61" /><maths num="0008"><![CDATA[<math><mrow><msubsup><mi>h</mi><msup><mi>Y</mi><mi>t</mi></msup><mi>t</mi></msubsup><mo>=</mo><munder><mi>max</mi><msup><mi>h</mi><mo>&prime;</mo></msup></munder><msup><mi>&theta;</mi><mi>T</mi></msup><mo>&times;</mo><mi>&phi;</mi><mrow><mo>(</mo><msup><mi>Y</mi><mi>t</mi></msup><mo>,</mo><msup><mi>h</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>X</mi><mi>t</mi></msup><mo>)</mo></mrow></mrow></math>]]></maths>②固定<img file="FDA00001739220400032.GIF" wi="48" he="60" />,优化θ和ξ<sup>t</sup>;<maths num="0009"><![CDATA[<math><mrow><munder><mi>min</mi><mrow><mi>&theta;</mi><mo>,</mo><mi>&xi;</mi></mrow></munder><mfrac><mn>1</mn><mn>2</mn></mfrac><msup><mi>&theta;</mi><mn>2</mn></msup><mo>+</mo><mi>C</mi><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msup><mi>&xi;</mi><mi>t</mi></msup></mrow></math>]]></maths><maths num="0010"><![CDATA[<math><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><msup><mi>&theta;</mi><mi>T</mi></msup><mo>&times;</mo><mi>&phi;</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><msubsup><mi>h</mi><msup><mi>Y</mi><mi>t</mi></msup><mi>t</mi></msubsup><mo>,</mo><msup><mi>X</mi><mi>t</mi></msup><mo>)</mo></mrow><mo>-</mo><msup><mi>&theta;</mi><mi>T</mi></msup><mo>&times;</mo><mi>&phi;</mi><mrow><mo>(</mo><msup><mi>Y</mi><mi>t</mi></msup><mo>,</mo><msubsup><mi>h</mi><msup><mi>Y</mi><mi>t</mi></msup><mi>t</mi></msubsup><mo>,</mo><msup><mi>X</mi><mi>t</mi></msup><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0011"><![CDATA[<math><mrow><mo>&le;</mo><msup><mi>&xi;</mi><mi>t</mi></msup><mo>-</mo><mi>&Delta;</mi><mrow><mo>(</mo><mi>Y</mi><mo>,</mo><msup><mi>Y</mi><mi>t</mi></msup><mo>)</mo></mrow><mo>&ForAll;</mo><mi>t</mi><mo>,</mo><mo>&ForAll;</mo><mi>Y</mi></mrow></math>]]></maths><maths num="0012"><![CDATA[<math><mrow><msup><mi>&xi;</mi><mi>t</mi></msup><mo>&GreaterEqual;</mo><mn>0</mn><mo>,</mo><mo>&ForAll;</mo><mi>t</mi></mrow></math>]]></maths>3)隐条件随机场模型的推断:在模型参数已知的前提下,推断观察序列X的分类最优标记Y<sup>*</sup>,<img file="FDA00001739220400037.GIF" wi="522" he="80" />实现所述细胞分裂序列识别。
地址 300072 天津市南开区卫津路92号