发明名称 数据处理装置及故事模型构建方法
摘要 实施方式的数据处理装置(100)具备:事件空位序列提取器(2)、机器学用事例生成器(3)、后续事件空位推测训练器(7)。事件空位序列提取器(2)从带有训练用标记的文章与共用项一起提取事件空位序列而生成事件空位序列数据。机器学用事例生成器(3)从事件空位序列数据生成用包含事件空位履历特征和共用项履历特征的至少某一个特征量的特征矢量表现的训练用事例数据。后续事件空位推测训练器(7)使用训练用事例数据进行基于识别模型的机器学,从而构建作为用于推测后续于在先文脉的事件空位的故事模型的后续事件空位推测模型(D10)。
申请公布号 CN105264518A 申请公布日期 2016.01.20
申请号 CN201380073967.6 申请日期 2013.02.28
申请人 株式会社东芝;东芝解决方案株式会社 发明人 浜田伸一郎
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 永新专利商标代理有限公司 72002 代理人 高迪
主权项 一种数据处理装置,具备:提取部,从被进行谓语项构造解析及共参照解析的文章,与共用项一起提取要素序列,该要素序列将具有所述共用项的谓语和表示所述共用项的格的种类的格种类信息的组合作为要素,将多个所述要素按照所述文章中的所述谓语的出现顺序排列;事例生成部,将构成所述要素序列的所述要素中的1个作为关注要素时,对于所述关注要素的每一个,生成用特征矢量表现的事例数据,该特征矢量包含与将所述关注要素作为末尾的要素的所述要素序列内的部分序列有关的1个以上的特征量、以及与对应于所述部分序列的所述共用项的序列有关的1个以上的特征量的至少某一个特征量;以及模型构建部,使用所述事例数据进行基于识别模型的机器学习,从而构建用于推测后续于在先文脉的所述要素的故事模型。
地址 日本东京都