发明名称 | 一种提取摘要的方法及装置 | ||
摘要 | 本发明提供一种提取摘要的方法及装置,方法包括:将待提取摘要的文稿拆分成段落,将拆分后的每个段落拆分成语句;根据语句与文稿标题的相关度筛选摘要备选语句;判断所有摘要备选语句的字数之和小于或等于摘要预设字数时,则将所有摘要备选语句作为摘要语句;判断所有摘要备选语句的字数之和大于摘要预定字数时,则获取每个摘要备选语句的权重值;按照权重值的大小依次对摘要备选语句进行排序,依照摘要预定字数选择排序在前的摘要备选语句作为摘要语句。该方法能够自动根据文稿内容形成摘要,便于读者快速了解文稿的主要内容,提升了阅读效率。由于摘要语句是直接从文稿中选择的完整语句,因此不会产生短句,提高摘要的可读性。 | ||
申请公布号 | CN106066867A | 申请公布日期 | 2016.11.02 |
申请号 | CN201610365409.2 | 申请日期 | 2016.05.27 |
申请人 | 东软集团股份有限公司 | 发明人 | 王磊;张明亮;张旭;麦涛;徐超 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京集佳知识产权代理有限公司 11227 | 代理人 | 赵晓荣;王宝筠 |
主权项 | 一种提取摘要的方法,其特征在于,包括:将待提取摘要的文稿拆分成段落,将拆分后的每个所述段落拆分成语句;根据所述语句与文稿标题的相关度筛选摘要备选语句;判断所有所述摘要备选语句的字数之和小于或等于摘要预设字数时,则将所有所述摘要备选语句作为摘要语句;判断所有所述摘要备选语句的字数之和大于所述摘要预定字数时,则获取每个所述摘要备选语句的权重值;按照所述权重值的大小依次对所述摘要备选语句进行排序,依照所述摘要预定字数选择排序在前的所述摘要备选语句作为摘要语句。 | ||
地址 | 110179 辽宁省沈阳市浑南新区新秀街2号 |