发明名称 一种网页文本摘要生成方法和装置
摘要 本申请实施例提供了一种网页文本摘要生成方法和装置,所述方法包括:确定网页文本中的关键词条;根据所述网页文本中每一词条的出现频率,计算所述网页文本中每一词条的初始权重;当所述网页文本中的任一词条为关键词条时,增大所述关键词条的初始权重,得到所述关键词条的目标权重;当所述网页文本中的任一词条为非关键词条时,将所述非关键词条的初始权重作为所述非关键词条的目标权重;利用所述网页文本中每一词条的目标权重,计算得到每一句子的句子权重;根据所述句子权重,选择摘要句子,并由所述摘要句子生成网页文本摘要。本申请实施例提高了网页文本摘要的准确度。
申请公布号 CN104156452A 申请公布日期 2014.11.19
申请号 CN201410405758.3 申请日期 2014.08.18
申请人 中国人民解放军国防科学技术大学 发明人 杨树强;薛竹君;尹洪;陈志坤;金松昌;宋锡宁;束阳雪;黄鸿杰;蒋千月;韩伟红;周斌;李爱平
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王宝筠
主权项 一种网页文本摘要生成方法,其特征在于,包括:确定网页文本中的关键词条;根据所述网页文本中每一词条的出现频率,计算所述网页文本中每一词条的初始权重;当所述网页文本中的任一词条为关键词条时,增大所述关键词条的初始权重,得到所述关键词条的目标权重;当所述网页文本中的任一词条为非关键词条时,将所述非关键词条的初始权重作为所述非关键词条的目标权重;利用所述网页文本中每一词条的目标权重,计算得到每一句子的句子权重;根据所述句子权重,选择摘要句子,并由所述摘要句子生成网页文本摘要。
地址 410073 湖南省长沙市开福区砚瓦池正街47号