发明名称 一种分类信息的排序方法
摘要 本发明提供了一种分类信息的排序方法,所述方法包括如下步骤:(a)收集查询者输入的关键字,拆分查询者输入的关键字;(b)将每条分类信息按其属性划分为多个域,每个域具有一权重值,按照拆分出来的关键字对于每个域的命中情况为每个域进行打分,再将所有域的打分汇总得到域加权;(c)根据域加权与相关性的关系,得到所述信息的相关性;(d)根据信息的发布时间,获得信息的时效性;(e)将信息的相关性和时效性进行加权,得到信息的最终得分;(f)按照信息得分的大小对信息进行排序,并输出最终排序结果。根据本发明的优化的分类信息排序方法,能有效改进现有的分类信息排序方法,避免信息发布者利用重复发布信息的手段制造大量垃圾信息,使得用户能够更准确快捷地搜索到他想要寻找的分类信息。
申请公布号 CN103336848B 申请公布日期 2016.09.28
申请号 CN201310309710.8 申请日期 2013.07.22
申请人 五八同城信息技术有限公司 发明人 陈秀义
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京律恒立业知识产权代理事务所(特殊普通合伙) 11416 代理人 顾珊;陈轶兰
主权项 一种分类信息的排序方法,所述方法包括如下步骤:(a)收集查询者输入的关键字,拆分查询者输入的关键字;(b)将每条分类信息按其属性划分为多个域,每个域具有一权重值,按照拆分出来的关键字对于每个域的命中情况为每个域进行打分,再将所有域的打分汇总得到域加权;(c)根据域加权与相关性的关系,得到所述信息的相关性,所述域加权与相关性的关系满足下式:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>M</mi><mo>=</mo><mfrac><mrow><mi>R</mi><mo>&CenterDot;</mo><mrow><mo>(</mo><mi>f</mi><mi>l</mi><mi>o</mi><mi>o</mi><mi>r</mi><mo>(</mo><mfrac><mi>x</mi><mi>F</mi></mfrac><mo>)</mo><mo>+</mo><mfrac><mrow><mi>mod</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>F</mi><mo>)</mo></mrow></mrow><mrow><mi>C</mi><mo>&CenterDot;</mo><mi>F</mi></mrow></mfrac><mo>)</mo></mrow></mrow><mrow><mi>K</mi><mo>+</mo><mrow><mo>(</mo><mi>f</mi><mi>l</mi><mi>o</mi><mi>o</mi><mi>r</mi><mo>(</mo><mfrac><mi>x</mi><mi>F</mi></mfrac><mo>)</mo><mo>+</mo><mfrac><mrow><mi>mod</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>F</mi><mo>)</mo></mrow></mrow><mrow><mi>C</mi><mo>&CenterDot;</mo><mi>F</mi></mrow></mfrac><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0001018531780000011.GIF" wi="686" he="239" /></maths>其中,M是相关性,x为域加权,R为归一化范围,取一经验常数,F为步骤(b)中具有最大权重值的域的权重值,C∈[1,+∞),C、K为经验常数,floor为向下取整函数,mod为求余函数,即是x和F作除法运算后的余数;(d)根据信息的发布时间,获得信息的时效性;(e)将信息的相关性和时效性进行加权,得到信息的最终得分,所述加权满足如下关系:S=w<sub>M</sub>·M+w<sub>T</sub>·T其中M为信息的相关性,w<sub>M</sub>为相关性的权重,T为信息的时效性,w<sub>T</sub>为时效性的权重,w<sub>M</sub>和w<sub>T</sub>满足下列不等式:w<sub>M</sub>Δf&gt;w<sub>T</sub>·Tsw<sub>T</sub>ΔT&gt;w<sub>M</sub>·Δs其中Δf为相邻两个相关性档位之间的相关性档位间距,Δs为一个相关性档位中的最大相关性值和最小相关性值的差值,Ts为相关性高一档信息的时效性比相关性低一档信息的时效性陈旧的时间间隔,ΔT为时间周期;(f)按照信息得分的大小对信息进行排序,并输出最终排序结果。
地址 300457 天津市滨海新区第一大街79号泰达MSD-C区-C3座2801房间