SYSTEM AND METHOD FOR EXTRACTING ENTITIES OF INTEREST FROM TEXT USING N-GRAM MODELS,申请号US20080335490-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	SYSTEM AND METHOD FOR EXTRACTING ENTITIES OF INTEREST FROM TEXT USING N-GRAM MODELS
摘要	A document (or multiple documents) is analyzed to identify entities of interest within that document. This is accomplished by constructing n-gram or bi-gram models that correspond to different kinds of text entities, such as chemistry-related words and generic English words. The models can be constructed from training text selected to reflect a particular kind of text entity. The document is tokenized, and the tokens are run against the models to determine, for each token, which kind of text entity is most likely to be associated with that token. The entities of interest in the document can then be annotated accordingly.
申请公布号	US2009119235(A1)	申请公布日期	2009.05.07
申请号	US20080335490	申请日期	2008.12.15
申请人	INTERNATIONAL BUSINESS MACHINES CORPORATION	发明人	KANUNGO TAPAS;RHODES JAMES J.
分类号	G06F15/18;G06F17/27	主分类号	G06F15/18
代理机构		代理人
主权项
地址

您可能感兴趣的专利

FOERFARANDE FOER FRAMSTAELLNING AV NYA TUBEKULOSTATISKT VERKANDE ALFA-AMINOXIKARBONSYRAAMIDDERIVAT

PAINEL DE ESTOFAMENTO RESILIENTE PERFILADO PARA VEICULOS E PROCESSO PARA FABRICAR O MESMO

PROEVESIGNALGENERATOR TIL LOKALISERING AV FEIL

APERFEICOAMENTO EM ARMACAO PARA OCULOS

APPAREILS DE MESURE DES MASSES ET DES FORCES

FREMGANGSMAADE TIL VASK AF BLOD

SISTEMA DE RECUPERACAO DE CALOR

COMPOSITION DETERGENTE LIQUIDE

WALKING TYPE MOVABLE FARM MACHINERY

CROP RAISING DEVICE FOR REAPER

MULTIILAYER COLOR SILVER HALIDE PHOTOGRAPHIC MATERIAL

AIRPORT GROUND SURVEILLANCE SYSTEM WITH AIRCRAFT TAXI CONTROL FEATURE

RAILLESS GROUND CONVEYOR SYSTEMS

CENTERFILLED PET FOOD PRODUCT

PROCESS FOR THE MANUFACTURE OF NEOHESPERIDINE DIHYDROCHALCONE

CURABLE MOULDING COMPOSITIONS OF LOW SHRINKAGE, BASED ON UNSATURATED POLYESTERS

METHOD AND INSTALLATION FOR THE TREATMENT OF WASTE WATER TO FORM USEFUL WATER

ALUMINUM SURFACE AND TREATMENT THEREOF TO ENHANCE ADHESION IN PRINTED CIRCUIT LAMINATES