发明名称 |
将图像分类为广告图像或非广告图像 |
摘要 |
广告图像分类系统训练二元分类器来将图像分类成广告图像或非广告图像,并随后使用该二元分类器来将网页的图像分类成广告图像或非广告图像。在训练阶段期间,该分类系统生成包括表示图像的特征向量和指示图像是广告图像还是非广告图像的标签的训练数据。该分类系统使用训练数据来训练二元分类器以分类图像。在分类阶段期间,该分类系统输入具有图像的网页并为该图像生成特征向量。该分类系统随后将已训练的二元分类器应用于该特征向量以生成指示图像是广告图像还是非广告图像的分数。 |
申请公布号 |
CN102138151B |
申请公布日期 |
2013.05.29 |
申请号 |
CN200880019701.2 |
申请日期 |
2008.06.13 |
申请人 |
微软公司 |
发明人 |
M·李;Z·李;D·李;B·王 |
分类号 |
G06K9/66(2006.01)I;G06Q30/00(2012.01)I |
主分类号 |
G06K9/66(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
张政权;钱静芳 |
主权项 |
一种在计算设备中用于标识显示页面的广告图像的方法,所述方法包括:提供显示页面的训练图像;将所述训练图像标签(301)为广告图像或非广告图像;生成(302)每一所述训练图像的特征向量,所述特征向量包括从所述训练图像的显示页面中导出的可视布局特征和内容特征,所述内容特征包括从下组中选择的特征:图像的纵横比、图像格式、图像是照片还是图形、图像的尺寸、图像的不同色彩数量、图像的灰色区域的百分比、以及图像是否具有高对比度的指示;使用所述特征向量和所述训练图像的标签来训练(305)二元分类器;以及通过生成图像的特征向量并将已训练的二元分类器应用到图像所生成的特征向量来将所述训练图像分类(701,702)为广告图像或非广告图像。 |
地址 |
美国华盛顿州 |