发明名称 图像识别方法及装置
摘要 本公开是关于一种图像识别方法及装置,属于图像处理领域。该方法包括:获取目标图像,该目标图像为待识别的图像;通过预设卷积神经网络模型对该目标图像进行特征提取,得到该目标图像的属性向量,该属性向量包括该目标图像中存在多个预设词语属性的概率;通过预设循环神经网络模型对该属性向量进行语义分析处理,得到该目标图像的描述语句,该描述语句用于对该目标图像的内容进行描述。也即是,本公开可以将图像识别与自然语言处理相结合,实现将目标图像转换为文字形式的描述语句,从而能够更加详细和形象地描述出目标图像的具体内容,提高了图像识别效果。
申请公布号 CN106446782A 申请公布日期 2017.02.22
申请号 CN201610757663.7 申请日期 2016.08.29
申请人 北京小米移动软件有限公司 发明人 杨松;陈志军;万韶华
分类号 G06K9/00(2006.01)I;G06K9/46(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 北京三高永信知识产权代理有限责任公司 11138 代理人 林锦澜
主权项 一种图像识别方法,其特征在于,所述方法包括:获取目标图像,所述目标图像为待识别的图像;通过预设卷积神经网络模型对所述目标图像进行特征提取,得到所述目标图像的属性向量,所述属性向量包括所述目标图像中存在多个预设词语属性的概率;通过预设循环神经网络模型对所述属性向量进行语义分析处理,得到所述目标图像的描述语句,所述描述语句用于对所述目标图像的内容进行描述。
地址 100085 北京市海淀区清河中街68号华润五彩城购物中心二期9层01房间