发明名称 图片中目标物的定位方法及装置
摘要 本公开是关于一种图片中目标物的定位方法及装置。方法包括:根据已训练的第一全卷积神经网络的第一预设缩放比例对原始图片进行缩放处理,得到第一图片;将第一图片输入到第一全卷积神经网络中,通过第一全卷积神经网络进行卷积处理,输出第一热度图;基于第一热度图上的每一个坐标点对应的概率值,确定目标物在原始图片中的候选区域;将候选区域对应的图像内容输入到已训练的第二全卷积神经网络中,通过第二全卷积神经网络进行卷积处理后,输出第二热度图;基于第二热度图上的每一个坐标点对应的值,确定目标物在原始图片中的位置区域。本公开技术方案可以大大降低处理图像的数据量,提高目标物的识别效率。
申请公布号 CN106355573A 申请公布日期 2017.01.25
申请号 CN201610721083.2 申请日期 2016.08.24
申请人 北京小米移动软件有限公司 发明人 陈志军;万韶华;杨松
分类号 G06T7/00(2017.01)I;G06T3/40(2006.01)I 主分类号 G06T7/00(2017.01)I
代理机构 北京博思佳知识产权代理有限公司 11415 代理人 陈蕾
主权项 一种图片中目标物的定位方法,其特征在于,所述方法包括:根据已训练的第一全卷积神经网络的第一预设缩放比例对原始图片进行缩放处理,得到第一图片;将所述第一图片输入到所述第一全卷积神经网络中,通过所述第一全卷积神经网络进行卷积处理,输出第一热度图,所述第一热度图上每一个坐标点对应的值为所述第一全卷积神经网络对所述目标物在所述原始图片上计算出的概率值;基于所述第一热度图上的每一个坐标点对应的概率值,确定所述目标物在所述原始图片中的候选区域;将所述候选区域对应的图像内容输入到已训练的第二全卷积神经网络中,通过所述第二全卷积神经网络进行卷积处理后,输出第二热度图,所述第二热度图上的每一个坐标点对应的值为所述第二全卷积神经网络对所述目标物在所述原始图片上的概率值;基于所述第二热度图上的每一个坐标点对应的值,确定所述目标物在所述原始图片中的位置区域。
地址 100085 北京市海淀区清河中街68号华润五彩城购物中心二期9层01房间