发明名称 |
一种文摘生成方法及装置 |
摘要 |
本发明实施例公开了一种文摘生成方法和装置,实现了自动生成文摘的目的。其中,所述方法包括:获取待处理文本的关键词集合,并分别计算所述关键词集合中各个关键词的权重,所述关键词用于表达所述待处理文本的内容,所述关键词的权重表示所述关键词在所述待处理文本中的重要程度;以句子为单位对所述待处理文本进行划分,得到目标句子;确定所述目标句子中包含的关键词,并根据所述目标句子中包含的关键词的数量和关键词的权重得到所述目标句子的第一相似度;根据所述目标句子的第一相似度得到所述目标句子是否能够加入文摘的判断结果。 |
申请公布号 |
CN106599148A |
申请公布日期 |
2017.04.26 |
申请号 |
CN201611111235.3 |
申请日期 |
2016.12.02 |
申请人 |
东软集团股份有限公司 |
发明人 |
王伟 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
刘晓菲;王宝筠 |
主权项 |
一种文摘生成方法,其特征在于,所述方法包括:获取待处理文本的关键词集合,并分别计算所述关键词集合中各个关键词的权重,所述关键词用于表达所述待处理文本的内容,所述关键词的权重表示所述关键词在所述待处理文本中的重要程度;以句子为单位对所述待处理文本进行划分,得到目标句子;确定所述目标句子中包含的关键词,并根据所述目标句子中包含的关键词的数量和关键词的权重得到所述目标句子的第一相似度;根据所述目标句子的第一相似度得到所述目标句子是否能够加入文摘的判断结果。 |
地址 |
110179 辽宁省沈阳市浑南新区新秀街2号 |