发明名称 图像概念的检测方法和装置
摘要 本发明公开了一种图像概念的检测方法和装置。其中,该方法包括获取待测数据和多个概念的训练数据的局部特征;根据不同的量化策略聚集出不同长度的单词表,并分别统计待测数据和多个概念的训练数据的局部特征的直方图;训练二元支持向量机分类器,并计算出每个概念的训练数据的局部特征的检测平均准确率以及训练出每个概念的分类模型;通过交叉验证选取每个概念的最佳子单词表,并将训练出的与每个概念的最佳子单词表相对应的分类模型作为每个概念最终的概念检测分类器;将待测数据的局部特征在每个概念的最佳子单词表上统计出的直方图输入到每个概念最终的概念检测分类器中以确定每个概念在待测数据中出现的概率。
申请公布号 CN102385592B 申请公布日期 2014.07.09
申请号 CN201010271693.X 申请日期 2010.09.03
申请人 中国电信股份有限公司 发明人 冯明;梁笃国;张艳霞;曹宁;邓涛
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 孙宝海
主权项 一种图像概念的检测方法,其特征在于,所述方法包括:根据取样策略选取包含标注信息的每个概念的训练数据;利用SIFT算法分别获取待测数据的局部特征和多个概念的训练数据的局部特征;根据不同的量化策略,利用K均值聚类法和每个概念的训练数据的局部特征聚集出关于每个概念的不同长度的单词表,将所述多个概念各自的不同长度的单词表合并为词袋模型{B<sub>1</sub>,B<sub>2</sub>,...,B<sub>i</sub>,...,B<sub>N</sub>},并分别统计所述待测数据的局部特征的直方图和所述多个概念的训练数据的局部特征的直方图,其中,所述直方图为局部特征在所述词袋模型{B<sub>1</sub>,B<sub>2</sub>,...,B<sub>i</sub>,...,B<sub>N</sub>}的各单词表B<sub>i</sub>的每个子单词表中出现的次数,单词表B<sub>i</sub>为所述多个概念在第i个量化策略下的单词表,所述单词表B<sub>i</sub>包含多个与概念相对应的子单词表,每个子单词表为每个概念在第i个量化策略下的单词表,所述每个子单词表的长度由量化策略决定,量化策略由K值决定,1≤i≤N,N≥2,K>1;将每个概念的训练数据的局部特征分为训练集和校验集,利用所述训练集、所述校验集、每个概念的训练数据的概念标注信息以及每个概念的训练数据的局部特征的直方图训练二元支持向量机分类器,并利用所述校验集在所述二元支持向量机分类器上计算出与所述词袋模型{B<sub>1</sub>,B<sub>2</sub>,...,B<sub>i</sub>,...,B<sub>N</sub>}的每个单词表B<sub>i</sub>中的每个子单词表相对应的每个概念的训练数据的局部特征的检测平均准确率以及训练出与每个单词表B<sub>i</sub>中的每个子单词表相对应的每个概念的分类模型;对计算出的与所述词袋模型{B<sub>1</sub>,B<sub>2</sub>,...,B<sub>i</sub>,...,B<sub>N</sub>}的每个单词表B<sub>i</sub>中的每个子单词表相对应的每个概念的训练数据的局部特征的检测平均准确率进行交叉验证,以在所述词袋模型{B<sub>1</sub>,B<sub>2</sub>,...,B<sub>i</sub>,...,B<sub>N</sub>}中选取出与每个概念的最大检测平均准确率相对应的子单词表作为每个概念的最佳子单词表,并将训练出的与每个概念的最佳子单词表相对应的分类模型作为每个概念最终的概念检测分类器,将所述多个概念各自最终的概念检测分类器合并为最佳概念检测分类器;将所述待测数据的局部特征在每个概念的最佳子单词表上统计出的直方图输入到所述最佳概念检测分类器中以确定每个概念在所述待测数据中出现的概率。
地址 100032 北京市西城区金融大街31号