ウェブページからの主要コンテンツの抽出,申请号JP20140541166-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	ウェブページからの主要コンテンツの抽出
摘要	<p>ウェブページから主要コンテンツを抽出することは、ウェブページ上のアイテムを識別してクラス分けすることと、候補のリストを作成することと、候補のスコアを計算することと、トップスコア候補を選択することと、トップスコア候補に対してクリーンアップ処理を行うこととを含む。候補のスコアは、サイズに基づいて分類されたパラグラフ及び画像の数に応じて変化してもよい。ＣＪＫ（語−日本語−韓国語）のテキストのワールド長は、そのテキスト中の句読点に基づいて判定してもよい。候補のスコアは、コンテナ及びピースの数に基づいて修正してもよく、コンテナはタグ「ｂｏｄｙ」、「ｄｉｖ」、「ｔｄ」、「ｌｉ」、「ａｒｔｉｃｌｅ／ｓｅｃｔｉｏｎ」に関連したウェブページ要素であり、ピースは他の候補を含まない候補である。候補のスコアは、テキスト及びリンクの密度に対応する比に基づいて修正してもよい。</p>
申请公布号	JP2015502603(A)	申请公布日期	2015.01.22
申请号	JP20140541166	申请日期	2012.11.07
申请人		发明人
分类号	G06F17/21;G06F17/30	主分类号	G06F17/21
代理机构		代理人
主权项
地址

您可能感兴趣的专利

APPARATUS AND METHOD FOR IP DATAGRAM AND RS-PARITY ENCAPSULATION AND DE-ENCAPSULATION

INTEGRATED CIRCUIT ROUTING AND COMPACTION

AIR-COOLED ENGINE

SYSTEM AND METHOD FOR CREATING ORTHOTICS

CONFIGURATIONAL DENSITY PROCESS AND STRUCTURE

SUPERDEFORMABLE/HIGH STRENGTH METAL ALLOYS

MASTER CYLINDER ASSEMBLY FOR A HYDRAULIC MOTOR VEHICLE BRAKE SYSTEM WITH TELESCOPIC PISTON ASSEMBLY AND MOTOR VEHICLE BRAKE SYSTEM

CLOSING DEVICE FOR A FILLER NECK DISPOSED ON A CONTAINER

OPTOMECHANICAL DEVICE FOR DETECTING POSITION AND FOR DETERMINING AN ANGLE

PROJECT MANAGEMENT ORGANIZER CLIP

ENGINE MODULE FOR ATTACHMENT TO A TARGET SPACECRAFT, IN-SPACE SERVICING SYSTEM AND METHOD FOR OPERATING AN ENGINE MODULE

CONTAINER WHICH MAY BE EVACUATED AND METHOD FOR EVACUATION THEREOF

APPARATUS AND METHOD FOR LATERAL PIPE IDENTIFICATION

ROAD VEHICLE WITH A LICENSE PLATE

BI-DIRECTIONAL BUFFER FOR INTERFACING TEST SYSTEM CHANNEL

METHOD, ARRANGEMENT, COMPUTER PROGRAM WITH PROGRAM CODE MEANS, AND COMPUTER PROGRAM PRODUCT FOR DETERMINING A FUTURE STATE OF A DYNAMIC SYSTEM

MULTI-LANE FRUIT GUIDE ASSEMBLY FOR A JUICE EXTRACTOR

METHOD FOR PRODUCING COATED DRUGS HAVING A STABLE PROFILE FOR THE RELEASE OF ACTIVE INGREDIENTS

OPTIMIZED ALTERNATOR BOBBIN