发明名称 |
图像识别方法及装置 |
摘要 |
本公开是关于一种图像识别方法及装置,属于图像处理领域。该方法包括:获取目标图像,该目标图像为待识别的图像;通过预设卷积神经网络模型对该目标图像进行特征提取,得到该目标图像的属性向量,该属性向量包括该目标图像中存在多个预设词语属性的概率;通过预设循环神经网络模型对该属性向量进行语义分析处理,得到该目标图像的描述语句,该描述语句用于对该目标图像的内容进行描述。也即是,本公开可以将图像识别与自然语言处理相结合,实现将目标图像转换为文字形式的描述语句,从而能够更加详细和形象地描述出目标图像的具体内容,提高了图像识别效果。 |
申请公布号 |
CN106446782A |
申请公布日期 |
2017.02.22 |
申请号 |
CN201610757663.7 |
申请日期 |
2016.08.29 |
申请人 |
北京小米移动软件有限公司 |
发明人 |
杨松;陈志军;万韶华 |
分类号 |
G06K9/00(2006.01)I;G06K9/46(2006.01)I |
主分类号 |
G06K9/00(2006.01)I |
代理机构 |
北京三高永信知识产权代理有限责任公司 11138 |
代理人 |
林锦澜 |
主权项 |
一种图像识别方法,其特征在于,所述方法包括:获取目标图像,所述目标图像为待识别的图像;通过预设卷积神经网络模型对所述目标图像进行特征提取,得到所述目标图像的属性向量,所述属性向量包括所述目标图像中存在多个预设词语属性的概率;通过预设循环神经网络模型对所述属性向量进行语义分析处理,得到所述目标图像的描述语句,所述描述语句用于对所述目标图像的内容进行描述。 |
地址 |
100085 北京市海淀区清河中街68号华润五彩城购物中心二期9层01房间 |