发明名称 |
自然语言处理系统、自然语言处理方法、以及自然语言处理程序 |
摘要 |
一实施方式所涉及的自然语言处理系统具备分析部以及修正部。分析部使用分割模型而执行对于一个句子的词素分析,从而对分割该一个句子而得到的各个被分割元素设定标签。分割模型包含表示被分割元素与标签的对应的输出特性的分数、和表示与连续的两个被分割元素对应的两个标签的组合的转移特性的分数。修正部对通过分析部而得到的分析结果所示的标签、和表示一个句子的正解的标签的正解数据进行比较,将与对应于非正解的标签的正解的标签关联的特性的分数提高,将与该非正解的标签关联的特性的分数降低,从而对分析部在下一个句子的词素分析中所使用的分割模型进行修正。 |
申请公布号 |
CN106030568A |
申请公布日期 |
2016.10.12 |
申请号 |
CN201480076197.5 |
申请日期 |
2014.12.08 |
申请人 |
乐天株式会社 |
发明人 |
萩原正人 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京市柳沈律师事务所 11105 |
代理人 |
胡金珑 |
主权项 |
一种自然语言处理系统,具备:分析部,利用通过使用了1个以上的训练数据的机器学习而得到的分割模型,执行对于一个句子的词素分析,从而对分割该一个句子而得到的各个被分割元素,设定至少表示单词的词类的标签,并且,所述分割模型包含表示被分割元素与标签的对应的输出特性的分数、以及表示与连续的两个被分割元素对应的两个标签的组合的转移特性的分数;以及修正部,对通过所述分析部而得到的分析结果所示的标签、和表示所述一个句子的正解的标签的正解数据进行比较,将与对应于非正解的标签的正解的标签关联的所述输出特性的分数以及所述转移特性的分数设为比当前值更高,将与该非正解的标签关联的所述输出特性的分数以及所述转移特性的分数设为比当前值更低,从而对所述分析部在下一个句子的词素分析中所使用的所述分割模型进行修正。 |
地址 |
日本东京都 |