一种基于多示例学的有害信息识别和网页分类方法,申请号CN201410609728.4-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种基于多示例学的有害信息识别和网页分类方法
摘要	本发明公开了一种基于多示例学的网页分类方法，该方法包括：设计了相对大小排序前向比较法来提取网页内有效图像，并根据网页树状结构提取有效图像的相关文本；将一幅有效图像及其相关文本作为网页包中的一个示例，分别采用图像词包模型和文本词包模型生成有效图像及其相关文本的描述，并将二者合并起来作为示例的描述；采用多示例核对毒品网页进行分类。本发明的方法，通过将网页中内含的图像及其相关文本作为网页包中的示例，使算法更符合网页内容的实际分布，并能够充分利用网页的有效信息，深入挖掘图像信息与文本信息的互补性，最终取得比只利用单模态信息进行分类更好的效果。
申请公布号	CN104361059A	申请公布日期	2015.02.18
申请号	CN201410609728.4	申请日期	2014.11.03
申请人	中国科学院自动化研究所	发明人	胡卫明;胡瑞光
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	中科专利商标代理有限责任公司 11021	代理人	宋焰琴
主权项	一种网页分类方法，包括以下步骤：步骤1：提取选定网页内的有效图像，并提取所述有效图像的相关文本；步骤2：将一幅有效图像及其相关文本作为网页包中的一个示例，生成所述有效图像及其相关文本的描述，并将二者合并起来作为示例的描述；步骤3：采用多示例核对得到的所述示例进行计算，根据计算的结果对所述选定网页进行分类。
地址	100190 北京市海淀区中关村东路95号

您可能感兴趣的专利

Bidirektionales Halbleiterbauelement

SELECTIVE INHIBITORS OF HISTONE DEACETYLASE

Brennstoffzellenfahrzeug

Seat element or seat back element, particularly for vehicle, has pad element, which has cavity structure that is provided on side turned to user

LIGHT GUIDES AND BACKLIGHT SYSTEMS INCORPORATING PRISMATIC STRUCTURES AND LIGHT REDIRECTORS

Getriebesteuervorrichtung

METHODS FOR TREATING POST-OPERATIVE EFFECTS SUCH AS SPASTICITY AND SHIVERING WITH CLONIDINE

COATED PARTICLE, METHOD FOR PRODUCING COATED PARTICLE AND ADSORPTION DEVICE

TOPICAL PHARMACEUTICAL COMPOSITION FOR THE COMBINATION OF FUSIDIC ACID AND A CORTICOSTEROID

HOT AND COLD STORAGE

METHOD AND VACCINE FOR OPTIMIZING THE SPECIFIC IMMUNE RESPONSES

METHOD OF MACHINING VULNERABLE MATERIAL SUBSTRATE

METHOD OF PRODUCING THROMBIN-IMMOBILIZED BIOABSORBABLE SHEET PREPARATION

FORMATION TREATMENT EVALUATION

TIME-ERROR AND FREQUENCY-ERROR CORRECTION IN A MULTI-CARRIER WIRELESS COMMUNICATIONS SYSTEM

REDUCING THE SIZE OF A MODEL USING VISIBILITY FACTORS

SYSTEM AND METHOD FOR MODIFYING FEATURES IN A SOLID MODEL

CAPSULE FOR BEVERAGE PREPARATION

CHIMERIC PORCINE CIRCOVIRUS PCV2Gen-1Rep AND USES THEREOF