一种基于语言模型的排序算法,申请号CN200910068047.0-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种基于语言模型的排序算法
摘要	本发明提出的一种基于语言模型的排序算法包括下列步骤：对用户输入的查询进行预处理，包括进行中文分词和过滤停用词；建立倒排索引单元，将候选文档进行预处理后建立倒排索引，以便快速定位；将预处理得到的关键词在倒排索引中进行查找，以确定包含所述关键词的初始文档集合；利用生成概率在初始文档集合上建图得到每篇文档的中心性(静态)权重；利用生成概率得到查询与候选文档的生成概率作为候选文档的动态权重；确定查询与候选文档的总权重；按照总权重对所述各待排序的文档进行排序。由于总权重中考虑了查询与文档的动态权重以及候选文档之间的静态权重，所以按照总权重对候选文档进行排序能够更加贴近用户的需求。
申请公布号	CN101826075A	申请公布日期	2010.09.08
申请号	CN200910068047.0	申请日期	2009.03.06
申请人	刘金莉	发明人	刘金莉
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构		代理人
主权项	一种基于语言模型的排序算法，其特征在于包括下列步骤：预处理单元，对用户输入的查询词和候选文档进行分词和过滤停用词处理；建立倒排索引单元，对候选文档建立倒排索引，以方便快速定位；静态权重确定单元，既中心性迭代计算单元，利用初始候选文档建图，迭代得到静态权重；动态权重确定单元，用户将查询与候选文档之间利用语言模型得到的权重就是动态权重；总权重确定单元，用于确定查询在候选文档中的总权重；排序单元，用于按照总权重对所述各待排序的网络资源进行排序。
地址	300071 天津市南开区卫星路94号20宿103

您可能感兴趣的专利

MULTIPLE PROCESSOR DATA PROCESSING SYSTEM WITH PROCESSORS OF VARYING KINDS

Production system using wafer-like carrier jig

CONNECTOR WITH A TERMINAL LOCKING BLOCK

PROCESS FOR THE PREPARATION OF THIOPHENE DERIVATIVES

MODULE FOR MUFFLING A FAN AND FOR FIXATION TO AN ELECTRONIC MACHINE CHASSIS

METHOD AND DEVICE FOR THERMAL ABLATION OF HOLLOW BODY ORGANS

Water-cooled friction contour cutting dental tool

THYRISTOR AND MANUFACTURE THEREOF

Safety cylinder cap

Gene capable of enhancing S-adenosyl-L-methionine accumulation and process for producing S-adenosyl-L-methionine using the same

PROCESS FOR THE PRODUCTION OF FINELY DIVIDED AND FREE-FLOWING POWDERS OF THERMOTROPIC POLYMERS

Method and apparatus for forming a diamond film

TWO-COMPONENT LOOP SEWING YARN AND MANUFACTURE THEREOF

Micropin connector system

ANGIOPLASTY CATHETER

Liquid crystal display apparatus having lenticular elements oriented in relation to LC pixel aperture dimensions

Catheter for performing an atherectomy procedure

ELECTRIC MOTOR ACTUATOR