发明名称 信息处理系统和信息处理方法
摘要 本发明提供一种信息处理系统和信息处理方法。在文献的机器学中降低人力成本和设备成本。信息处理系统在输入特征类型的情况下,根据所输入的特征类型和各教师数据,生成通过数值矢量表示与各教师数据有关的特征的各教师数据的特征矢量,根据各教师数据的特征矢量生成教师数据的图表,根据教师数据的图表,选择用于生成最适于传播教师数据的标签的第1图表的特征类型,进而输出第1图表,根据第1图表和无标签数据,选择应该传播赋予在教师数据中的标签的无标签数据,进而,通过在第1图表中包含选择出的无标签数据,生成第2图表,通过第2图表,将赋予在教师数据中的标签向选择出的无标签数据传播。
申请公布号 CN103678436B 申请公布日期 2017.04.12
申请号 CN201310322481.3 申请日期 2013.07.29
申请人 株式会社日立制作所 发明人 柳濑利彦;今一修
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 永新专利商标代理有限公司 72002 代理人 王成坤;胡建新
主权项 一种信息处理系统,对多个文献数据进行机器学习,其特征在于,所述信息处理系统具有:初始化部,取得赋予了标签的多个文献数据即多个教师数据、未赋予所述标签的文献数据即无标签数据、以及表示提取与所述各文献数据有关的特征的方法的多个特征类型;特征矢量生成部,在输入所述取得的特征类型中的至少一个所述特征类型的情况下,根据所述输入的特征类型和所述取得的各教师数据,生成通过数值矢量表示与所述各教师数据有关的特征的所述各教师数据的特征矢量;图表构筑部,根据由所述特征矢量生成部生成的各教师数据的特征矢量,生成所述教师数据的图表;以及特征选择部,具有对生成的所述教师数据的图表进行评价的特征评价部,根据由所述图表构筑部生成的教师数据的图表,基于所述特征评价部的所述教师数据的图表的评价结果,从由所述初始化部取得的特征类型中选择用于生成最适于传播所述教师数据的标签的第1图表的特征类型,进而,输出由所述图表构筑部生成的所述第1图表;所述特征矢量生成部根据生成所述第1图表的所述特征类型和由所述初始化部取得的多个无标签数据,生成通过数值矢量表示与所述各无标签数据有关的特征的所述无标签数据的特征矢量,所述信息处理系统还具有:数据选择部,基于所述各教师数据的特征矢量和所述各无标签数据的特征矢量,计算所述第1图表中包含的各教师数据与所述各无标签数据之间的距离,根据计算出的所述第1图表中包含的各教师数据与所述各无标签数据之间的距离,选择应该传播赋予在所述教师数据中的标签的所述无标签数据,进而,通过在所述第1图表中包含所述选择出的无标签数据,生成第2图表;以及机器学习部,通过所述第2图表,将赋予在所述教师数据中的标签向所述选择出的无标签数据传播。
地址 日本东京都