发明名称 |
网页关键词提取方法及装置 |
摘要 |
本发明实施例公开了一种网页关键词提取方法及装置,涉及关键词提取领域,提高了网页关键词提取的准确率和召回率。本发明包括:获取网页的种子关键词及候选关键词;获取网页的种子关键词及候选关键词;统计所述候选关键词与所述种子关键词同句出现的次数;根据所述次数对所述候选关键词进行打分,得到相应的得分;根据所述得分对所述候选关键词进行排序;按照所述得分从高到低的顺序从所述候选关键词中选取预定数量的候选关键词作为所述网页的关键词,并将所述获取的种子关键词也作为所述网页的关键词。本发明主要用于网页关键词的提取过程中。 |
申请公布号 |
CN102262625A |
申请公布日期 |
2011.11.30 |
申请号 |
CN200910261694.3 |
申请日期 |
2009.12.24 |
申请人 |
华为技术有限公司 |
发明人 |
陆元飞;王婵娟;孙斌;刘刚;朱汝维 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京中博世达专利商标代理有限公司 11274 |
代理人 |
申健 |
主权项 |
一种网页关键词提取方法,其特征在于,包括:获取网页的种子关键词及候选关键词;统计所述候选关键词与所述种子关键词同句出现的次数;根据所述次数对所述候选关键词进行打分,得到相应的得分;根据所述得分对所述候选关键词进行排序;按照所述得分从高到低的顺序从所述候选关键词中选取预定数量的候选关键词作为所述网页的关键词,并将所述获取的种子关键词也作为所述网页的关键词。 |
地址 |
518129 广东省深圳市龙岗区坂田华为基地总部办公楼 |