发明名称 |
一种基于半监督主题建模的图像标注方法 |
摘要 |
本发明公开了一种基于半监督主题建模的图像标注方法。本发明的方法首先从互联网上得到图像,包括已有文本标注的图像,以及未标注图像。接着利用一种类似于概率潜在语义分析的模型,对所有图像的视觉特征和文本标注之间的联系通过潜在主题进行建模。然后构建所有图像的最近邻图,并根据由最近邻图进行建模得到的流形结构对模型进行调整。通过期望最大化算法学该模型,并分别计算各个潜在主题与图像匹配的概率。最后根据潜在主题匹配图像的概率计算每个文本标注匹配未标注图像的概率,并选择概率最高的文本标注对未标注图像进行标注。 |
申请公布号 |
CN102637199A |
申请公布日期 |
2012.08.15 |
申请号 |
CN201210050398.0 |
申请日期 |
2012.02.29 |
申请人 |
浙江大学 |
发明人 |
何晓飞;卜佳俊;陈纯;倪雅博 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
杭州天正专利事务所有限公司 33201 |
代理人 |
王兵;黄美娟 |
主权项 |
一种基于半监督主题建模的图像标注方法,其特征在于:1)从互联网上得到图像,包括已有文本标注的图像,以及未标注图像;2)利用一种类似于概率潜在语义分析的模型,对所有图像的视觉特征和文本标注之间的联系通过潜在主题进行建模;3)构建所有图像的最近邻图,并根据由最近邻图进行建模得到的流形结构对步骤2)的模型进行调整;4)通过期望最大化算法学习步骤2)的模型,并分别计算各个潜在主题与图像匹配的概率;5)根据潜在主题匹配图像的概率计算每个文本标注匹配未标注图像的概率,并选择概率最高的文本标注对未标注图像进行标注。 |
地址 |
310027 浙江省杭州市西湖区浙大路38号 |