发明名称 对搜索结果进行排序的方法和装置
摘要
申请公布号 TWI486797 申请公布日期 2015.06.01
申请号 TW099106782 申请日期 2010.03.09
申请人 阿里巴巴集团控股有限公司 发明人 谢宇恒;邢飞;郭宁;侯磊;张勤
分类号 G06F17/30 主分类号 G06F17/30
代理机构 代理人 林志刚 台北市中山区南京东路2段125号7楼
主权项 一种对搜索结果进行排序的方法,其特征在于,伺服器预先计算统计样本中每两个词语之间的语义关联权重,以获得并保存词语权重表,该方法还包括:该伺服器接收用户终端输入的查询字串,根据该查询字串而进行搜索并获得目标字串;该伺服器对该查询字串和该目标字串分别进行分词,将该查询字串的各分词依次与该目标字串的分词两两组合;查询词语权重表,以获得每个分词组合的权重值;及根据该权重值而获得加权词语长度,根据该加权词语长度而对每个目标字串进行排序,并反馈给该用户终端,其中,该加权词语长度为最小滑动窗口加权长度;根据该权重值而获得该加权词语长度对每个目标字串进行排序的步骤包括:分别取该目标字串的各个分词在该查询字串各分词的权重最小值;或者,分别取该查询字串的各个分词在该目标字串各分词的权重最小值;对各个目标字串,根据该权重最小值分别计算该最小滑动窗口加权长度;及比较各目标字串的最小滑动视窗加权长度,长度小则排序在前,反之,排序在后,其中,计算每个目标字串的最小滑动视窗加权长度具体包括: 该最小滑动窗口加权长度其中,W表示权重,Ti表示该目标字串中的第i个的分词,k、h分别表示该目标字串最小滑动视窗的起始位置和结束位置,Qj表示该查询字串中的第j个分词,m表示该查询字串分词的个数。
地址 香港