发明名称 集合扩展处理装置、集合扩展处理方法、程序、及非暂时性记录媒体
摘要 本发明涉及一种集合扩展处理装置、集合扩展处理方法、程序及非暂时性记录媒体。受理部(101)受理种子字符串。检索部(102)获得包含种子字符串的文档的摘要。片段取得部(103)以片段分隔字符串分隔该摘要而获得片段。片段要素取得部(104)以片段要素分隔字符串分隔片段而获得片段要素。片段得分计算部(105)根据片段要素的长度的标准偏差来计算片段的片段得分。片段要素得分计算部(106)根据种子字符串的位置与片段要素的位置的距离、以及片段得分来计算片段要素的片段要素得分。选择部(107)基于片段要素得分而从片段要素中选择任一片段要素作为种子字符串的扩展集合中所包含的候选实例。
申请公布号 CN102971733A 申请公布日期 2013.03.13
申请号 CN201280001852.1 申请日期 2012.02.22
申请人 乐天株式会社 发明人 荻原正人
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京律盟知识产权代理有限责任公司 11287 代理人 章蕾
主权项 一种集合扩展处理装置,其特征在于包含:受理部,受理种子字符串;检索部,检索包含所述受理的种子字符串的文档,并获得该检索的文档的摘要;片段取得部,通过以规定的片段分隔字符串分隔所述获得的摘要,而获得包含在所述受理的种子字符串的前后出现的字符串与该种子字符串按照出现顺序排列而成的字符串的片段;片段要素取得部,通过以规定的片段要素分隔字符串分隔所述获得的各片段,而获得片段要素;片段得分计算部,基于在所述获得的片段中出现的各片段要素的长度的方差或标准偏差,计算所述获得的各片段的片段得分;片段要素得分计算部,基于所述受理的种子字符串在所述获得的片段中出现的位置与该片段中所包含的片段要素在该片段中出现的位置的距离、以及对该片段进行计算所得的片段得分,计算所述获得的各片段中所包含的各片段要素的片段要素得分;及选择部,基于对所述获得的各片段要素进行计算所得的片段要素得分,从所述片段要素中选择任一片段要素作为包含所述受理的种子字符串的集合扩展而成的扩展集合中所包含的候选实例。
地址 日本国东京都