发明名称 基于图像内容分析的中医舌象检索方法
摘要 基于内容的中医舌象检索方法,属于图像分析和检索领域。本发明鉴于中医舌诊缺乏客观定量化分析,并无法对分析结果进行有效查询和管理的特点,设计了一种基于多特征的中医舌象检索方法。该发明的特征在于:该方法包括特征库构建和舌象检索两大部分;特征库构建过程中,提取了舌象的颜色、纹理和形状信息;而在进行舌象检索时,首先基于舌象的文本标注信息进行初始检索,然后基于特征库的信息计算舌象间的相似度,得到最终检索结果。本发明可以得到令医生满意的查询结果,具有一定的实用价值。
申请公布号 CN102426583A 申请公布日期 2012.04.25
申请号 CN201110304964.1 申请日期 2011.10.10
申请人 北京工业大学 发明人 张菁;卓力;隋磊;刁蒙蒙
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 刘萍
主权项 1.基于内容的中医舌象检索方法,其特征在于该方法分为两大部分:特征库构建和舌象检索;而舌象检索又分为两个部分:关键词检索和图像检索,前者基于舌象的文本标注信息进行初始检索,后者利用特征库,并采用相似度计算的方法进行基于内容的舌象客观化检索;当用户输入关键词进行查询时,初始检索结果将返回数组推荐舌象,这些舌象的标注信息中往往包含该关键词及一个相关词汇,然后用户可以选择其中一幅舌象进行二次查询以获得更多相关舌象,本方法根据该舌象与舌象库中舌象的相似度返回查询结果;1).特征库构建:提取舌象的颜色、纹理以及形状特征,建立舌象特征库,其中舌象各个特征提取的过程如下所示:1.1舌象颜色特征提取:在提取颜色特征时,先使用基于聚类树的支持向量机方法对舌体的各个像素进行识别,具体做法是:对于图像库的每幅舌图像,取一个同样大小的图像块,然后计算每个块的R、G、B三个分量的均值作为训练样本的特征矢量,将图像块标注为以下11种颜色类别的一种:舌质淡、舌质淡红、舌质红、舌质暗红、舌质绛红、舌质暗紫、白苔、黄苔、灰苔、褐苔和黑苔;其中,前六种是舌质颜色,后五种是舌苔颜色;随后,根据训练样本的特征矢量,使用基于聚类树的多类支撑向量机算法建立分类模型,然后依次读取待处理舌图像中舌体区域每个像素的R、G、B值,并根据分类模型,判断该像素的颜色类型,其中该类型对应于上述11类图像块所代表的颜色;获取各个像素点的识别结果后,结合伪彩色图中舌色、苔色的颜色信息,将舌象转化为伪彩色图像,只有11种颜色,它们的RGB三个分量与舌色、苔色的对应关系为:舌质淡{255,200,200}、舌质淡红{255,0,255}、舌质红{255,0,0}、舌质暗红{255,125,125}、舌质绛红{175,0,0}、舌质暗紫{125,50,200}、白苔{255,255,255}、黄苔{255,255,0}、灰苔{125,125,125}、褐苔{100,0,0}和黑苔{0,0,0};然后,统计每幅图像舌体区域中11种RGB分量对应像素点出现的频率,据此建立11维的颜色直方图hist<sub>1</sub>,hist<sub>2</sub>,...,hist<sub>11</sub>表征舌象的颜色特征信息;1.2舌象纹理特征提取:选定标准差分别为2和0.5的两个高斯滤波器,对舌图像进行卷积得到两幅图像,然后使用Prewitt算子分别作卷积,获取舌体区各点的彩色梯度响应D和边缘方向θ,计算两个梯度的均值<img file="FDA0000097584790000021.GIF" wi="66" he="52" />并统计大于100的像素数N<sub>e</sub>,根据式(1)计算裂纹指数CRK:<maths num="0001"><![CDATA[<math><mrow><mi>CRK</mi><mo>=</mo><mi>c</mi><mo>&CenterDot;</mo><mover><mi>D</mi><mo>&OverBar;</mo></mover><mo>&CenterDot;</mo><msqrt><mfrac><mrow><mn>10</mn><mo>&CenterDot;</mo><msub><mi>N</mi><mi>e</mi></msub></mrow><mi>A</mi></mfrac></msqrt><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中c=0.0125是归一化系数,A为舌体区域的像素总数;1.3舌象形状特征提取:先将图像由RGB空间转换为HSV空间,然后进行阈值分割,保留分量H大于500的像素,这样就可得到嘴区范围,随后将区域左右边缘点选定为嘴角;接着采用半径+角度图对折比较法,确定舌体的对称轴,最后根据舌体中轴与嘴角的关系,得到歪斜指数;设嘴角连线的长度为L,嘴角连线的中点与舌体中轴线和嘴角连线的交点的距离为d,舌体中垂线和中轴线的夹角为φ,同时规定图像原点在左上角,横轴以向右为正,纵轴以向下为正,则歪斜指数的定义为:<img file="FDA0000097584790000023.GIF" wi="1374" he="123" />式中max[g]为取括号内两个数的最大值,abs(g)为取括号内数值的绝对值;2).检索:2.1基于文本信息的关键词初始检索使用的舌象均已进行了标记,标注信息包括:舌色即舌质淡、舌质淡红、舌质红、舌质暗红、舌质绛红、舌质暗紫,苔色即白苔、黄苔、灰苔、褐苔和黑苔,舌体形状即歪斜状况:左歪斜、右歪斜和不歪斜,以及纹理即有明显裂纹和无明显裂纹,一共包含四大类信息,十六种标注词汇,根据上述信息分别统计包含每个词汇对应舌象的数目,最后利用这些数据完成初始文本初步检索;先输入关键词P,然后计算该词汇的相关度与信息度,最后根据上述结果完成其余词汇推荐值的计算,并根据推荐值按照从大到小的顺序返回与关键词语义相近的舌象,完成初始文本初步检索;其中,相关度是描述其它词汇p<sub>i</sub>与P的关联程度,信息度是指其它词汇p<sub>i</sub>与P组合在一起能够反映的信息量,这里的其它词汇与关键词P描述的舌象信息不同;在计算关键词的关联度时,首先计算标注信息中包含关键词P与其它词汇p<sub>i</sub>的舌象在舌象库中出现的频率,如下式所示:<maths num="0002"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>|</mo><mi>P</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>I</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>|</mo><mi>P</mi><mo>)</mo></mrow></mrow><mrow><mi>I</mi><mrow><mo>(</mo><mi>P</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中,I(p<sub>i</sub>|P)为标注信息中包含关键词P与p<sub>i</sub>的舌象的数目,I(P)为标注信息中包含关键词P的舌象的数目;然后计算P与p<sub>i</sub>的关联度R(p<sub>i</sub>,P):R(p<sub>i</sub>,P)=f(p(p<sub>i</sub>|P)) (4)式中,f(.)是一个单调递增的标准S型函数,形式为f(x)=1/(1+e<sup>-x</sup>);关键词P与其它词汇p<sub>i</sub>的信息度D(p<sub>i</sub>,p<sub>j</sub>,P)采用了对称KL散度的计算方法,整个计算分为三步:词汇p<sub>i</sub>和p<sub>j</sub>的KL散度的计算,如式(5)所示;词汇p<sub>j</sub>和p<sub>i</sub>对称KL散度的计算,如式(6)所示;信息度D(p<sub>i</sub>,p<sub>j</sub>,P)的计算,如式(7)所示;<maths num="0003"><![CDATA[<math><mrow><mi>KL</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>|</mo><mo>|</mo><msub><mi>p</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>&Sigma;</mi><mi>p</mi></msub><mi>p</mi><mrow><mo>(</mo><mi>p</mi><mo>|</mo><mi>PU</mi><mo>{</mo><msub><mi>p</mi><mi>i</mi></msub><mo>}</mo><mo>)</mo></mrow><mi>log</mi><mfrac><mrow><mi>p</mi><mrow><mo>(</mo><mi>p</mi><mo>|</mo><mi>PU</mi><mo>{</mo><msub><mi>p</mi><mi>i</mi></msub><mo>}</mo><mo>)</mo></mrow></mrow><mrow><mi>p</mi><mrow><mo>(</mo><mi>p</mi><mo>|</mo><mi>PU</mi><mo>{</mo><msub><mi>p</mi><mi>j</mi></msub><mo>}</mo><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中KL(p<sub>i</sub>||p<sub>j</sub>)为词汇p<sub>i</sub>和p<sub>j</sub>的KL散度,p(p|PU{p<sub>i</sub>})为标注信息中包含关键词P、p以及p<sub>i</sub>的舌象在(标注信息中)包含关键词P以及p<sub>i</sub>的舌象中出现的频率,p(p|PU{p<sub>j</sub>})为标注信息中包含关键词P、p以及p<sub>j</sub>的舌象在(标注信息中)包含关键词P以及p<sub>j</sub>的舌象中出现的频率,其中P、p<sub>j</sub>、p<sub>i</sub>和p各代表一种不同的舌象描述信息即舌色为舌质淡、舌质淡红、舌质红、舌质暗红、舌质绛红、舌质暗紫,苔色为白苔、黄苔、灰苔、褐苔和黑苔,舌体形状即左歪斜、右歪斜和不歪斜,以及纹理为有明显裂纹和无明显裂纹,∑<sub>p</sub>(g)是指对p对应的标注信息中所有词汇求和;<img file="FDA0000097584790000041.GIF" wi="1307" he="70" />式中KL(p<sub>j</sub>||p<sub>i</sub>)为词汇p<sub>j</sub>和p<sub>i</sub>的KL散度,<img file="FDA0000097584790000042.GIF" wi="233" he="70" />为词汇p<sub>i</sub>和p<sub>j</sub>的对称散度;<img file="FDA0000097584790000043.GIF" wi="1286" he="67" />式中g(x)=1/(1+e<sup>-x</sup>),根据得到的信息度D(p<sub>i</sub>,p<sub>j</sub>,P)与关联度R(p<sub>i</sub>,P),采用式(8)依次计算其余标注词汇与关键词P之间的推荐值L(p<sub>i</sub>),并按照这个数值的大小进行排序,这样可以获得数组词汇组合,将标注信息中包含这些组合的图片作为初始检索的结果提供给用户,其中图片的个数是除去词汇组合后的其他两类信息包含的标注词汇的个数;<maths num="0004"><![CDATA[<math><mrow><mi>L</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>&lambda;R</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>,</mo><mi>P</mi><mo>)</mo></mrow><mo>+</mo><mfrac><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>&lambda;</mi><mo>)</mo></mrow><mi>T</mi></mfrac><msub><mi>&Sigma;</mi><mrow><msub><mi>p</mi><mi>j</mi></msub><mo>&Element;</mo><msub><mi>E</mi><mi>p</mi></msub></mrow></msub><mi>D</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>,</mo><msub><mi>p</mi><mi>j</mi></msub><mo>,</mo><mi>P</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中D(p<sub>i</sub>,p<sub>j</sub>,P)为关键词P与词汇p<sub>i</sub>的信息度,R(p<sub>i</sub>,P)为关键词P与词汇p<sub>i</sub>的相关度,λ∈[0.5,0.7]为常量,P、p<sub>i</sub>和p<sub>j</sub>为三种不同的舌象描述信息,T为标注词汇的总数目,E<sub>p</sub>为除去关键词P和p<sub>i</sub>对应标注信息后,其余两类信息对应标注词汇的集合;2.2基于特征库相似度计算的最终检索用户可以从初始结果显示的舌象中随机选择一幅作为关键图,并分别计算与该图拥有相同标注信息的舌象的相似度,并按照相似度大小返回最终检索结果;整个检索过程中,先需要进行特征融合,将三种特征归一化合并,计算其相似度;具体步骤是:先进行基于单个特征的舌象检索,采用公式(9)分别计算关键图Y与图像X<sub>m</sub>的单个特征的相似度S<sub>nm</sub>(S<sub>1m</sub>、S<sub>2m</sub>和S<sub>3m</sub>分别对应舌象颜色直方图hist<sub>1</sub>,hist<sub>2</sub>,...,hist<sub>11</sub>、裂纹指数CRK和歪斜指数I<sub>dev</sub>的相似度,m=1,2,...,M对应与关键图拥有相同标注信息的图像的个数),然后依照公式(10)对单个特征的相似度S<sub>nm</sub>进行高斯归一化,以便将不同特征的相似度量化到同一个取值范围内,最后采用公式(13)将归一化后的单个特征对应的相似度S′<sub>nm</sub>进行合并,接着按合并后的总的相似度S<sub>m</sub>,数值越小与关键图的相似度越高,对这些图像重新按S<sub>m</sub>值从小到大排序,从中选出排序靠前的舌象作为检索结果返回给用户;<maths num="0005"><![CDATA[<math><mrow><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow><mo>,</mo><msub><mi>S</mi><mi>nm</mi></msub><mo>=</mo><munder><mi>&Sigma;</mi><mi>l</mi></munder><mo>|</mo><msub><mi>X</mi><mi>nl</mi></msub><mo>-</mo><msub><mi>Y</mi><mi>nl</mi></msub><mo>|</mo><mrow><mo>(</mo><mi>n</mi><mo>=</mo><mn>1,2,3</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中X<sub>nl</sub>为舌象库中与关键图拥有相同标注信息的图像X<sub>m</sub>的特征,Y<sub>nl</sub>为从初始结果中选择的关键图Y的特征,I为舌象颜色直方图hist<sub>1</sub>,hist<sub>2</sub>,...,hist<sub>11</sub>、裂纹指数CRK和歪斜指数I<sub>dev</sub>特征各自对应的维数,其中颜色直方图(X<sub>1l</sub>,Y<sub>1l</sub>={hist<sub>1</sub>,hist<sub>2</sub>,...,hist<sub>l</sub>},l=11)11维,裂纹CRK(X<sub>2l</sub>,Y<sub>2l</sub>={CRK},l=1)和歪斜指数I<sub>dev</sub>(X<sub>3l</sub>,Y<sub>3l</sub>={I<sub>dev</sub>},l=1)各1维;<maths num="0006"><![CDATA[<math><mrow><msubsup><mi>S</mi><mi>nm</mi><mo>&prime;</mo></msubsup><mo>=</mo><mo>[</mo><mfrac><mrow><msub><mi>S</mi><mi>nm</mi></msub><mo>-</mo><msub><mi>S</mi><mi>nmean</mi></msub></mrow><mrow><mn>3</mn><mi>&delta;</mi></mrow></mfrac><mo>+</mo><mn>1</mn><mo>]</mo><mo>/</mo><mn>2</mn><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>10</mn><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0007"><![CDATA[<math><mrow><msub><mi>S</mi><mi>nmean</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msub><mi>S</mi><mi>nm</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>11</mn><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0008"><![CDATA[<math><mrow><mi>&delta;</mi><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msup><mrow><mo>(</mo><msub><mi>S</mi><mi>nm</mi></msub><mo>-</mo><msub><mi>S</mi><mi>nmean</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>12</mn><mo>)</mo></mrow></mrow></math>]]></maths>公式(11)中S<sub>nmean</sub>是舌象颜色直方图、裂纹指数和歪斜指数特征各自对应的一组相似度S<sub>nm</sub>的均值,δ是舌象颜色直方图、裂纹指数和歪斜指数特征各自对应的一组相似度S<sub>nm</sub>的方差,S<sub>nm</sub>是归一化前两幅舌象的舌象颜色颜色直方图、裂纹指数和歪斜指数特征的相似度;<maths num="0009"><![CDATA[<math><mrow><msub><mi>S</mi><mi>m</mi></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mn>3</mn></munderover><mrow><mo>(</mo><msub><mi>w</mi><mi>n</mi></msub><mi>g</mi><msubsup><mi>S</mi><mi>nm</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>13</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中S′<sub>nm</sub>是归一化后两幅舌象的舌象颜色直方图、裂纹指数和歪斜指数特征的相似度,w<sub>n</sub>是分配到第n种特征)的权值:舌象颜色直方图w<sub>1</sub>∈[0.5,0.7]、裂纹指数w<sub>2</sub>∈[0.2,0.3]和歪斜指数w<sub>3</sub>∈[0.1,0.2],且满足以下条件<img file="FDA0000097584790000062.GIF" wi="207" he="119" />
地址 100124 北京市朝阳区平乐园100号