发明名称 |
在网络上判断文章重要性的方法和系统、及滑动窗口 |
摘要 |
本发明涉及一种在网络上判断文章重要性的方法,包括:使用预先设置的滑动窗口以文章起始处为起点开始滑动,所述滑动窗口对滑过的词语进行不重复收集;所述滑动窗口收集的词语达到预设数量时,记录滑过词语的数量,并重新设置起点,继续滑动,直至滑过整篇文章;在所述滑动窗口记录的滑过词语的数量中获取数量值最大者,并依据获取的数量值最大者判断文章的重要性。同时,本发明还涉及一种在网络上判断文章重要性的系统,及一种滑动窗口。本发明能够对整体词汇丰富但局部词汇贫乏的文章进行有效的识别,方便用户使用。 |
申请公布号 |
CN100520767C |
申请公布日期 |
2009.07.29 |
申请号 |
CN200710105297.8 |
申请日期 |
2007.05.31 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
董亮;邵荣防 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 |
代理人 |
逯长明 |
主权项 |
1、一种在网络上判断文章重要性的方法,其特征在于,包括:使用预先设置的滑动窗口以文章起始处为起点开始滑动,所述滑动窗口对滑过的词语进行不重复收集;所述滑动窗口收集的词语达到预设数量时,记录滑过词语的数量,并重新设置起点,继续滑动,直至滑过整篇文章;在所述滑动窗口记录的滑过词语的数量中获取数量值最大者,并依据获取的数量值最大者判断文章的重要性。 |
地址 |
518044广东省深圳市福田区振兴路赛格科技园2栋东410室 |