发明名称 一种问答系统中的问句理解方法
摘要 本发明公布了一种问答系统中的问句理解方法,针对一段问句文本,将问句文本表示为词向量矩阵或字向量矩阵,通过循环神经网络进行学,使得问句文本表示为被意图识别任务和槽填充任务共享的词向量矩阵或字向量矩阵,再使用联合损失函数来共同学意图识别任务和槽填充任务,由此完成问句理解;利用本发明提供的技术方案,可以充分利用意图识别和槽填充两个任务的内在联系,提高两个任务的准确率和F1值。
申请公布号 CN106156003A 申请公布日期 2016.11.23
申请号 CN201610512191.9 申请日期 2016.06.30
申请人 北京大学 发明人 张晓东;王厚峰
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京万象新悦知识产权代理事务所(普通合伙) 11360 代理人 张肖琪
主权项 一种问答系统中的问句理解方法,针对一段问句文本,将所述问句文本表示为词向量矩阵或字向量矩阵,通过循环神经网络进行学习,使得所述问句文本表示为被意图识别任务和槽填充任务共享的词向量矩阵或字向量矩阵,再使用联合损失函数来共同学习意图识别任务和槽填充任务,由此完成问句理解;具体包括如下步骤:A.使用词向量或字向量表示问句文本,将问句文本表示为词向量矩阵或字向量矩阵的形式:B.使用循环神经网络学习A所述词向量矩阵或字向量矩阵,得到问句在循环神经网络各个时刻的表示<img file="FDA0001036956550000011.GIF" wi="49" he="71" />和问句的全局表示h<sup>u</sup>;C.将B所述问句在循环神经网络各个时刻的表示<img file="FDA0001036956550000012.GIF" wi="48" he="70" />用于预测每个槽的标签,将B所述问句的全局表示h<sup>u</sup>用于预测该问句的意图,从而使得文本表示被意图识别任务和槽填充任务所共享;D.使用联合损失函数共同学习意图识别任务和槽填充任务,分别得到意图识别任务和槽填充任务的类别标签,由此完成问句理解。
地址 100871 北京市海淀区颐和园路5号