发明名称 为文字文档自动生成摘要的方法
摘要 本发明公开了一种为文字文档自动生成摘要的方法,该方法在接收用户文本文件的同时还询问用户感兴趣的领域、话题和词语。该方法在确定句子的重要性时主要利用句子中词与用户配置文件的语言关联程度、与用户提交的检索式或话题的相似程度和词所属句子的分值总和等信息。该方法在计算词的分值基础上还根据构成句子的所有词的分值总和以及句子在段落和篇章中的位置来确定句子的重要性。
申请公布号 CN1341899A 申请公布日期 2002.03.27
申请号 CN00126866.X 申请日期 2000.09.07
申请人 国际商业机器公司 发明人 郭志立;杨力平
分类号 G06F17/30 主分类号 G06F17/30
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 于静
主权项 1.一种为文字文档自动生成摘要的方法,包括步骤:·对于给定文档集,通过篇章结构分析获得句子集,通过词法处理获得词集;·为词集中的词和句子集中的句子赋初始的评分值;·对词集中的每个词,根据它所属句子的分值,它与用户信息的关联程度计算它的分值;·对于句子集中的每个句子,根据组成句子的各词的分值,句子在段落和篇章中的位置计算句子的分值;·如果句子集和词集的分值总和与前次结果相比有显著变化,则循环第三步;若分值总和稳定下来,则继续以下步骤;·评价分值高的句子作为文档集的摘要,分值高的词作为文档集的关键词表。
地址 美国纽约
您可能感兴趣的专利