发明名称 信息处理设备,信息处理方法和程序
摘要 本发明涉及信息处理设备,信息处理方法和程序。所述信息处理设备包括语句提取单元,特征提取单元,聚类单元,关联语句提取单元和输出单元。语句提取单元从多个文档中提取多个语句。特征提取单元在相互区分具有相同文字表示的语句的同时,提取所提取的各个语句的特征量。聚类单元在相互区分具有相同文字表示的语句的同时,把提取的各个语句聚类在一起,并计算把各个语句相对于2个或更多的各个聚类的归属度作为分量的归属度向量。关联语句提取单元在相互区分具有相同文字表示的语句的同时,提取归属度向量与提供的输入语句的归属度向量类似的关联语句。输出单元输出关联语句和用于识别关联语句的识别信息。
申请公布号 CN104376034A 申请公布日期 2015.02.25
申请号 CN201410382233.2 申请日期 2014.08.06
申请人 索尼公司 发明人 宫原正典;荒木一宪;金本胜吉;中桥亮;吉山和树;高木友博
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 李颖
主权项 一种信息处理设备,包括:语句提取单元,所述语句提取单元被配置成从多个文档中提取多个语句;特征提取单元,所述特征提取单元被配置成在相互区分具有相同文字表示的语句的同时,提取所提取的各个语句的特征量;聚类单元,所述聚类单元被配置成在相互区分具有相同文字表示的语句的同时,把提取的各个语句聚类在一起,和计算把各个语句相对于2个或更多的各个聚类的归属度作为分量的归属度向量;关联语句提取单元,所述关联语句提取单元被配置成在相互区分具有相同文字表示的语句的同时,提取归属度向量与提供的输入语句的归属度向量类似的关联语句;和输出单元,所述输出单元被配置成输出关联语句和用于识别关联语句的识别信息。
地址 日本东京