发明名称 文档处理装置
摘要 本发明提供一种文档处理装置。根据该文档处理装置,若通过输入部(11)输入文档,则预处理部(12)将所输入的文档分离成多个单词。重要度算出部(14)算出基于单词的频度的特征值,并基于算出的特征值来算出每一个由多个单词构成的句子的重要度。用户可以直接输入关键词,也可以通过预处理部分离的单词中选择关键词,由用户确定了关键词后,可以算出基于单词的频度以及关键词的特征值,并基于算出的特征值来算出句子的重要度。摘要生成部(15)基于所算出的重要度,并依照句子重要度从高到低的顺序选择规定数量的句子,生成所输入的文档的摘要,显示部(16)显示所生成的摘要。
申请公布号 CN101526938B 申请公布日期 2011.12.28
申请号 CN200810006557.0 申请日期 2008.03.06
申请人 夏普株式会社 发明人 王婍犇;乐宁;朱奇;许晨;吴波
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 雒运朴;李伟
主权项 一种文档处理装置,其特征在于,具有:输入部,其输入文档;预处理部,其将由上述输入部输入的文档分离成多个单词;重要度算出部,其算出由上述预处理部分离的单词的基于频度的特征值,并基于算出的上述基于频度的特征值来算出每一个由多个单词构成的句子的重要度;摘要生成部,其基于由上述重要度算出部算出的每一个句子的重要度,并依照句子重要度从高到低的顺序来选择规定数量的句子,而生成所输入的文档的摘要;显示部,其显示由上述摘要生成部生成的摘要;关键词输入部,作为关键词输入由用户输入的单词,或者作为关键词输入由用户从通过上述预处理部分离的单词中选择的单词;而且,在由上述显示部显示由上述摘要生成部生成的输入文档的摘要后,若由上述关键词输入部输入关键词,则上述重要度算出部算出基于所输入的关键词的特征值,并根据上述基于频度的特征值以及算出的上述基于关键词的特征值这两个特征值来重新算出每一个由多个单词构成的句子的重要度,上述摘要生成部基于由上述重要度算出部重新算出的每一个句子的重要度,依照句子重要度从高到低的顺序选择规定数量的句子,生成所输入的文档的摘要,上述显示部重新显示由上述摘要生成部生成的摘要。
地址 日本大阪府