发明名称 |
一种网页文本摘要生成方法和装置 |
摘要 |
本申请实施例提供了一种网页文本摘要生成方法和装置,所述方法包括:确定网页文本中的关键词条;根据所述网页文本中每一词条的出现频率,计算所述网页文本中每一词条的初始权重;当所述网页文本中的任一词条为关键词条时,增大所述关键词条的初始权重,得到所述关键词条的目标权重;当所述网页文本中的任一词条为非关键词条时,将所述非关键词条的初始权重作为所述非关键词条的目标权重;利用所述网页文本中每一词条的目标权重,计算得到每一句子的句子权重;根据所述句子权重,选择摘要句子,并由所述摘要句子生成网页文本摘要。本申请实施例提高了网页文本摘要的准确度。 |
申请公布号 |
CN104156452A |
申请公布日期 |
2014.11.19 |
申请号 |
CN201410405758.3 |
申请日期 |
2014.08.18 |
申请人 |
中国人民解放军国防科学技术大学 |
发明人 |
杨树强;薛竹君;尹洪;陈志坤;金松昌;宋锡宁;束阳雪;黄鸿杰;蒋千月;韩伟红;周斌;李爱平 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
王宝筠 |
主权项 |
一种网页文本摘要生成方法,其特征在于,包括:确定网页文本中的关键词条;根据所述网页文本中每一词条的出现频率,计算所述网页文本中每一词条的初始权重;当所述网页文本中的任一词条为关键词条时,增大所述关键词条的初始权重,得到所述关键词条的目标权重;当所述网页文本中的任一词条为非关键词条时,将所述非关键词条的初始权重作为所述非关键词条的目标权重;利用所述网页文本中每一词条的目标权重,计算得到每一句子的句子权重;根据所述句子权重,选择摘要句子,并由所述摘要句子生成网页文本摘要。 |
地址 |
410073 湖南省长沙市开福区砚瓦池正街47号 |