发明名称 |
一种基于决策树学的自动图像标注与翻译的方法 |
摘要 |
本发明公开了一种基于决策树学的自动图像标注与翻译的方法,自动为新图像加以标注,使用机器翻译带有可视化内容的文本词汇表而实现图像资料的机器检索,包括训练标注图像集和图像自动标注。其中训练标注图像集利用图像分割算法对训练图像集分割成子块区域,提取每个子块区域的底层视觉特征;将这些特征数据离散化,然后将训练标注图像集基于底层特征离散值利用聚类算法进行分类,并构造出语义词典;将所述底层特征离散值作为决策树学的输入属性;利用决策树机器学法对已构造的词典,对应预先设定的语义概念进行自我训练学,生成决策树并获取相应的决策规则。本发明的训练标注图像集具有可扩展性和鲁棒性,将其应用于语义图像检索中,能提高检索的查全率和查准率。 |
申请公布号 |
CN101620615B |
申请公布日期 |
2011.12.28 |
申请号 |
CN200910060241.4 |
申请日期 |
2009.08.04 |
申请人 |
西南交通大学 |
发明人 |
侯进;张登胜 |
分类号 |
G06F17/30(2006.01)I;G06N1/00(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于决策树学习的自动图像标注与翻译的方法,以提取特征向量和训练标注文字的形式使机器完成学习后自动地为新图像加以标注,使用机器翻译带有可视化内容的文本词汇表而实现图像资料的机器检索,包括训练标注图像集和图像自动标注两部分,其中(1)所述训练标注图像集包括如下步骤:a)利用图像分割算法对训练图像集分割成子块区域,提取每个子块区域的底层视觉特征;将这些特征数据离散化,然后将训练标注图像集基于底层特征离散值利用聚类算法进行分类,并构造出语义词典;b)将所述底层特征离散值作为决策树学习的输入属性,利用决策树机器学习法对已构造的词典,对应预先设定的语义概念进行自我训练学习,生成决策树并获取相应的决策规则;(2)所述图像自动标注包括如下步骤:a)对于图像自动标注,将待标注的图像通过相同的图像分割算法得到多个区域;b)对每个区域进行特征提取、特征值离散化,得到每个区域的特征属性值;c)根据训练过程中生成的决策规则,将b)得到的属性值带入到所获取的决策规则中测试,得到对应的语义概念,这个语义概念就作为该待标注图像的标注词。 |
地址 |
610031 四川省成都市二环路北一段111号西南交通大学科技处 |