Techniques for detecting duplicate web pages,申请号US20070788505-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	Techniques for detecting duplicate web pages
摘要	Techniques are disclosed for detecting web pages with duplicate content. In one embodiment, a set of shingles is computed for each page of a group of pages. An aggregate set of shingles is determined based on the sets of shingles computed for the group of pages. A first subset from the aggregate set of shingles is determined by selecting, from the aggregate set, shingles whose frequencies in the aggregate set exceed a specified threshold. A modified set of shingles is generated for each page of the group of pages by removing, from the set of shingles for that page, any shingle included in the first subset. One or more duplicate pages in the group of pages are determined based at least in part on the modified sets of shingles generated for the group of pages.
申请公布号	US7698317(B2)	申请公布日期	2010.04.13
申请号	US20070788505	申请日期	2007.04.20
申请人	YAHOO! INC.	发明人	SASTURKAR AMIT;AHUJA RAJAT;RAVIKUMAR SHANMUGASUNDARAM;OFITSEROV VLADIMIR
分类号	G06F17/00	主分类号	G06F17/00
代理机构		代理人
主权项
地址

您可能感兴趣的专利

Long Distance Optical Fiber Sensing System and Method

METHOD AND DEVICE FOR DETERMINING THE AIR BLEED ON AN AIRCRAFT TURBOJET ENGINE

METALIZED CERAMIC LEADING EDGE NOZZLE KIELS FOR HIGH-TEMPERATURE TURBINE APPLICATIONS

Method for Manufacturing a Damping Shaft Sleeve

METHOD OF MAKING A ROLLED ALUMINUM PRODUCT

ROLL STRIPPER DEVICE AND METHOD

REFRIGERATING AND AIR-CONDITIONING APPARATUS

Combustor Bulkhead Assembly

FUEL HEATING SYSTEM FOR A POWER PLANT AND METHOD OF HEATING FUEL

GAS TURBINE ENGINE COOLING HOLE WITH CIRCULAR EXIT GEOMETRY

INJECTION DEVICE FOR A COMBUSTION CHAMBER OF A TURBINE ENGINE

Nuclear-Fossil Fueled Hybrid Power Generation System

POWER CONDUCTING DEVICE FOR LARGE ANGLES OF TWIST

SUSPENDED CEILING SYSTEM, SECURING MEMBERS, AND PROCESS OF INSTALLING A SUSPENDED CEILING SYSTEM

CANOPY SYSTEM AND GROUP SUSPENSION SYSTEM THEREFORE

Insulating Laminated Point Supported Glass System

INNOVATIVE BATTEN SYSTEM FOR ROOF TILE INSTALLATION

METHOD OF SORTING ABRASIVE PARTICLES, ABRASIVE PARTICLE DISTRIBUTIONS, AND ABRASIVE ARTICLES INCLUDING THE SAME

Remote Control Fishing Robot

BOLT CARRIER AND BOLT FOR GAS OPERATED FIREARMS