发明名称 文本匹配装置以及方法、和文本分类装置以及方法
摘要 本发明提供可靠性高地自动收集属于某归类的信息并合适且及时地进行匹配的系统。文本分类装置(30)用词素解析部(52)和依赖被依赖解析部(54)对收集的文本的依赖被依赖进行解析。问题报告收集装置(64)基于文本的依赖被依赖关系确定文本中的由名词+谓语构成的核,使用名词的分类(负面系/非负面系)和谓语的分类(活性/非活性)的组合以称作核结构矩阵的手法将文本分类为问题报告和除此以外的部分。支援信息收集装置(66)、需求联络收集装置(68)也同样收集支援信息、需求联络。匹配装置(76)将合适的支援信息(问题信息)相对于用称作共现核矩阵的手法使由问题报告收集装置(64)以及支援信息收集装置(66)收集的问题报告以及支援信息匹配而得到的问题信息(支援信息)建立关联。
申请公布号 CN105339936A 申请公布日期 2016.02.17
申请号 CN201480034989.6 申请日期 2014.05.15
申请人 国立研究开发法人情报通信研究机构 发明人 佐野大树;伊什特万·瓦尔加;鸟泽健太郎;桥本力;大竹清敬;河合刚巨;吴钟勋;史蒂恩·德萨哲
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 王亚爱
主权项 一种文本匹配装置,在分类为属于第1归类或者第2归类的文本的集合中,将所述第2归类的文本相对于所述第1归类的文本建立对应,其中,包含于所述集合中的文本通过利用了机器学习的文本分类装置被分类为所述第1归类以及所述第2归类,所述机器学习将构成该文本的1个或多个词素、该1个或多个词素的依赖被依赖信息、以及由包含于所述文本中的名词和该名词所依赖的谓语的组合构成的句的核内的名词的分类和谓语的分类的组合用作特征,所述文本匹配装置包括:存储单元,其将所述第1归类的文本、和所述第2文本相互区别来存储;文本配对生成单元,其从所述存储单元生成由所述第1归类的文本和所述第2归类的文本构成的文本的配对;匹配用特征生成单元,其根据所述配对生成匹配用的特征,该匹配用的特征包含用所述文本分类装置将由所述文本配对生成单元生成的所述配对内的文本分类时的所述特征;和匹配单元,其使用由所述匹配用特征生成单元生成的匹配用特征来判定构成所述配对的2个文本互相是否匹配,所述匹配单元包含机器学习模型,该机器学习模型预先使用匹配用的学习数据,根据所述匹配特征来判定文本的配对是否匹配,从而学习完毕。
地址 日本国东京都