发明名称 基于分布式和SVM分类器的室外海量物体识别方法和系统
摘要 本发明公开了一种基于分布式处理和SVM分类器的室外海量物体识别方案,该方案预先对城市版图进行区域划分,在每个区域中对各场景进行图像采集,并训练区域的词典和场景的SVM分类器;识别时,终端将拍摄的图像和当前GPS信息打包发送给调度处理集群;调度处理集群根据GPS信息判断与待识别图像相关的词典和分类器是否已经加载到计算节点,如果没有,再确定加载范围,将范围内的词典和分类器分摊加载到计算节点;计算节点利用词典得到待识别图像的统计直方图向量,再用SVM进行打分;所有计算节点打分最高的SVM对应的场景最后识别结果,反馈给终端。使用本发明能够实现智能终端的大规模图像识别和检索,而且减少了数据运算量,提高了图像识别和检索的速度。
申请公布号 CN102880879A 申请公布日期 2013.01.16
申请号 CN201210292379.9 申请日期 2012.08.16
申请人 北京理工大学 发明人 王涌天;桂振文;刘越;陈靖
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 北京理工大学专利中心 11120 代理人 杨志兵;高燕燕
主权项 一种基于分布式处理和SVM分类器的室外海量物体识别方法,其特征在于,该方法包括:将室外建筑整体区划分为多个矩形的区域;针对每个区域,选取多个场景,为每个场景采集多幅图像,从每幅图像中提取特征点并转化为描述符,利用聚类算法对一个区域内所有场景的所有描述符进行聚类,每个聚类中心作为一个单词,一个区域内的所有单词形成一个词典;每个区域采用区域中心处GPS信息和四个角的GPS信息表示区域位置,存储带区域位置的词典到样本文件系统中;以区域为单位,对区域内每个场景所有图像的描述符进行训练,形成一个支持向量机SVM分类器,一个场景对应一个分类器;将区域位置、SVM分类器和场景信息对应存储到样本文件系统中;所述的识别方法包括如下步骤:步骤1:终端采集当前场景的待识别图像以及GPS信息;步骤2:提取所述待识别图像的局部特征,并转化为描述符特征向量;步骤3:将待识别图像的GPS信息以及描述符特征向量打包成一个描述符文件,发送给分布式处理系统;步骤4:分布式处理系统中设有调度处理集群、多个计算节点和所述样本文件系统;调度处理集群接收到所述描述符文件后,为所述终端建立一个新的匹配任务A,从该描述符文件中提取GPS信息作为匹配任务A的标识,查询当前正在处理的匹配任务中是否存在与匹配任务A相同或相似的匹配任务,如果是,说明已经将与待识别图像相关的词典和SVM分类器加载到各计算节点中,则将描述符文件发送给每个计算节点,然后执行步骤6;否则,执行步骤5;所述相同或相似的匹配任务的查询标准为:如果当前正在处理的匹配任务对应的GPS信息与待识别图像的GPS信息一致或者相差一个预设阈值,则认为存在相同的匹配任务;步骤5:调度处理集群为匹配任务A加载相关的词典和SVM分类器:以待识别图像的GPS信息为圆心,按照预先设定的筛选半径确定一个圆形,根据区域位置从样本文件系统中筛选出与该圆形相交的区域,将筛选出区域的词典和区域内所有SVM分类器分摊加载到各个计算节点中;同时,调度处理集群还将描述符文件发送给每个计算节点;步骤6:每个计算节点从描述符文件中解析出待匹配描述符特征向量;针对每个区域,利用距离关系查找每个待匹配描述符特征向量在词典中对应的单词,并对每个单词的出现频率进行统计,得到统计直方图向量;再将统计直方图向量输入该区域对应所有SVM分类器进行打分,找出分数最高的SVM分类器;将各区域的匹配结果汇总到调度处理集群;步骤7:调度处理集群统计各个计算节点的匹配结果,选出打分最高的SVM分类器,输出该SVM分类器对应的场景信息给终端。
地址 100081 北京市海淀区中关村南大街5号