Duplicate document detection in a web crawler system,申请号US20030614111-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	Duplicate document detection in a web crawler system
摘要	Duplicate documents are detected in a web crawler system. Upon receiving a newly crawled document, a set of documents, if any, sharing the same content as the newly crawled document is identified. Information identifying the newly crawled document and the selected set of documents is merged into information identifying a new set of documents. Duplicate documents are included and excluded from the new set of documents based on a query independent metric for each such document. A single representative document for the new set of documents is identified in accordance with a set of predefined conditions.
申请公布号	US7627613(B1)	申请公布日期	2009.12.01
申请号	US20030614111	申请日期	2003.07.03
申请人	GOOGLE INC.	发明人	DULITZ DANIEL;VERSTAK ALEXANDRE A.;GHEMAWAT SANJAY;DEAN JEFFREY A.
分类号	G06F12/00;G06F17/30	主分类号	G06F12/00
代理机构		代理人
主权项
地址

您可能感兴趣的专利

SPRAY CONTAINER FOR SPRAYING MEASURED CHEMICAL AGENT

APPARECCHIATURA ELETTRONICA PARTICOLARMENTE ADATTA ALL'ELABORAZIONE, MEMORIZZAZIONE E RESTITUZIONE DI SEGNALI ELETTRICI E DI MESSAGGI CODIFICATI.

PERFEZIONAMENTI AI COMPLESSI TERMICI

COMPOSIZIONE DA STAMPAGGIO IN PARTICOLARE RESINE POLIMERIZZABILI A BASSA TEMPERATURA E PRESSIONE.

MEDESIMO. FRIGORIFERO CON UNO SCAMBIATORE DICALORE SITUATO SU UNA PARETE DEL

COMPLESSO A TAVOLOZZA E STAMPINO PER L'APPLICAZIONE DI TRUCCO FACCIALE.

DISPOSITIVO DI CARICAMENTO.

HOT WATER PIPE FOR HEATING

MANUFACTURING EQUIPMENT OF ROLL PAPER OIL FLOOR COVERED WITH LAMINATED PAPER

TRANSFER APPARATUS FOR CARRIAGE OF TYPEWRITER

PRODUCTION OF ULTRAFINE POWDER OF SILICON CARBIDE

ROOFING OF TILE ROD ROOF

OIL-DISPERSIBLE AQUEOUS STABLE MAGNESIUM HYDROXIDE SUSPENSION

DETONATION FREE TUNNEL DRILLING METHOD

PESO PARA EXERCICIOS E BUCHA

IMPROVED DOORPLATE

FIXING DEVICE FOR FAN

CATIONIC TECHNETIUM (I) COMPLEXES

REAM SKID DISCHARGE ARRANGEMENT FOR CONTINUOUS DISCHARGE SHEETER

RADIATION CURABLE COMPOSITION INCLUDING AN ACRYLATED URETHANE, AND UNSATURATED CARBOXYLIC ACID, A MULTIFUNCTIONAL ACRYLATE AND A SILOXY-CONTAINING POLYCARBINOL