发明名称 | 文档处理装置 | ||
摘要 | 本发明提供一种文档处理装置。根据该文档处理装置,若通过输入部(11)输入文档,则预处理部(12)将所输入的文档分离成多个单词。重要度算出部(14)算出基于单词的频度的特征值,并基于算出的特征值来算出每一个由多个单词构成的句子的重要度。用户可以直接输入关键词,也可以通过预处理部分离的单词中选择关键词,由用户确定了关键词后,可以算出基于单词的频度以及关键词的特征值,并基于算出的特征值来算出句子的重要度。摘要生成部(15)基于所算出的重要度,并依照句子重要度从高到低的顺序选择规定数量的句子,生成所输入的文档的摘要,显示部(16)显示所生成的摘要。 | ||
申请公布号 | CN101526938A | 申请公布日期 | 2009.09.09 |
申请号 | CN200810006557.0 | 申请日期 | 2008.03.06 |
申请人 | 夏普株式会社 | 发明人 | 王婍犇;乐宁;朱奇;许晨;吴波 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 雒运朴;李 伟 |
主权项 | 1.一种文档处理装置,其特征在于,具有:输入部,其输入文档;预处理部,其将由上述输入部输入的文档分离成多个单词;重要度算出部,其算出由上述预处理部分离的单词的至少基于频度的特征值,并基于上述算出的特征值来算出每一个由多个单词构成的句子的重要度;摘要生成部,其基于由上述重要度算出部算出的每一个句子的重要度,并依照句子重要度从高到低的顺序来选择规定数量的句子,而生成所输入的文档的摘要;显示部,其显示由上述摘要生成部生成的摘要;关键词输入部,其用于输入关键词,用户可以直接输入关键词,也可以通过预处理部分离的单词中选择关键词;而且,在由上述显示部显示由上述摘要生成部生成的输入文档的摘要后,若由上述关键词输入部输入关键词或通过预处理部分离的单词中选择关键词,则上述重要度算出部重新算出基于单词的频度以及所输入的单词的特征值,并基于算出的特征值来算出每一个由多个单词构成的句子的重要度,上述摘要生成部基于由上述重要度算出部算出的每一个句子的重要度,依照句子重要度从高到低的顺序选择规定数量的句子,生成所输入的文档的摘要,上述显示部重新显示由上述摘要生成部生成的摘要。 | ||
地址 | 日本大阪府 |