发明名称 |
一种摘要生成方法及装置 |
摘要 |
本发明实施例公开了一种摘要生成方法及装置,其中方法的实现包括:获取正文内容并获取所述正文内容的句子;对正文内容的各句子使用多元语言模型算法进行分词得到分词结果,确定所述分词结果的特征向量;所述特征向量包含典型特征,典型特征对应有特征权重;依据典型特征的特征权重计算正文内容的各句子的重要度;依据计算得到的重要度由高往低从所述正文内容中提取句子作为摘要。以上方法使用多元语言模型算法进行分词,使分词不再依赖于词典,而且能够最大程度地保留信息量;可以从正文内容中获取到重要度高的句子并作为摘要使用。以上方案不再依赖于词典也不必维护词典,可以准确并且高效的生成摘要。 |
申请公布号 |
CN105005563A |
申请公布日期 |
2015.10.28 |
申请号 |
CN201410151888.9 |
申请日期 |
2014.04.15 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
蔡兵 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市深佳知识产权代理事务所(普通合伙) 44285 |
代理人 |
王仲凯 |
主权项 |
一种摘要生成方法,其特征在于,包括:获取正文内容并获取所述正文内容的句子;对正文内容的各句子使用多元语言模型算法进行分词得到分词结果,确定所述分词结果的特征向量;所述特征向量包含典型特征,典型特征对应有特征权重;依据典型特征的特征权重计算正文内容的各句子的重要度;依据计算得到的重要度由高往低从所述正文内容中提取句子作为摘要。 |
地址 |
518000 广东省深圳市福田区振兴路赛格科技园2栋东403室 |