发明名称 一种在线数字媒体分类的快速特征提取方法
摘要 本发明提供一种在线数字媒体分类的自适应特征提取方法,通过以下步骤来实现对媒体对象的高效分类:(1)起始;(2)检测预测模型是否已训练好,如果预测模型尚未建立,执行步骤3,否则转入步骤6;(3)将特征按提取时间开销排序;(4)按序提取训练媒体对象的特征;(5)按序训练一组备选子预测模型序列;(6)使用子模型序列对媒体对象进行分类;(7)输出媒体对象的分类标记;(8)结束。该方法自动地对“简单”的对象只提取少量特征,而对“复杂”的对象提取更多的特征,这样就可以节省用于特征提取的时间开销,从而提高在线数字媒体处理的速度。
申请公布号 CN101419632B 申请公布日期 2010.12.08
申请号 CN200810243144.4 申请日期 2008.12.09
申请人 南京大学 发明人 周志华;刘力平;俞扬;姜远
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 柏尚春
主权项 一种在线数字媒体分类的快速特征提取方法,其特征是该方法包括以下步骤:(1)起始;(2)检测预测模型是否已训练好,如果预测模型尚未训练好,执行步骤3,否则转入步骤6;(3)将媒体对象的特征按提取时间开销从小到大排序;(4)按序提取训练媒体对象的特征;(5)按序训练一组备选子预测模型序列;(6)使用子预测模型序列对待预测媒体对象进行分类;(7)输出待预测媒体对象的分类标记;(8)结束;其中:步骤(5)按序训练一组备选子预测模型序列的具体步骤是:(51)起始;(52)将特征计数器j设置为0,其中j为特征个数;(53)特征计数器j加1;(54)使用训练集合中测媒体对象的前j个特征输入到学习算法,建立一个SVW子预测模型SVWj,该子预测模型在分类时能够对提取了前j个特征的待预测媒体对象进行分类,其中SVW为支持向量机;(55)如果j<d,表示还有更多的特征可用,则转步骤53,建立一个特征个数j加1的子预测模型,否则,转到步骤56,其中d表示媒体对象总的特征个数;(56)输出所有的子预测模型;(57)结束;步骤(6)使用子模型序列对待预测媒体对象进行分类的具体步骤是:(61)起始;(62)预测模型接受用户要分类的媒体对象I;(63)将特征计数器j初始化为0;(64)将计数器j加1;(65)按照特征顺序提取第j个特征值;(66)将前j个特征值作为媒体对象I的特征向量x输入到第j个子预测模型SVWj;(67)计算特征向量x距离SVWj的分界面的距离m,m为子预测模型的分类置信度;(68)如果m<thr,则表明SVWj对样本分类的置信度不够高,并且j<d,表明还有更多的特征可提取,则返回步骤64;如果不满足m<thr且j<d,则转到步骤69,thr为置信度阈值;其中d表示媒体对象总的特征个数;(69)SVWj的输出作为I的标记;(610)结束。
地址 210093 江苏省南京市汉口路22号