发明名称 一种基于神经网络的中文问答系统
摘要 本发明公开一种基于神经网络的中文问答系统,包括有用户接口模块、问题预分词模块、神经元预标注模块、学训练模块、神经元知识库模块、语义块识别模块、问题集索引模块和答案推理模块。通过该系统,首先采用SIE编码方式,对语义块内词按相对位置进行编码;然后将问句语义块识别问题转化成一个标记分类问题,采用基于神经网络的分类模型来确定问句的语义结构;最后结合问句的语义结构,实现基于神经网络的问句相似度计算,通过对已标注完成的问句语义特征抽取,比较问句各个语义特征之间的权重,为最终答案推理提供依据。本发明将句子的句法、语义和语境知识融为一体,能够模拟人处理句子的过程。
申请公布号 CN101566998B 申请公布日期 2011.12.28
申请号 CN200910062239.0 申请日期 2009.05.26
申请人 华中师范大学 发明人 何婷婷;张茂元;陈龙;张勇;胡泊;张红春;吴宝珍;刘星星
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06N3/08(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 武汉天力专利事务所 42208 代理人 严彦;冯卫平
主权项 一种基于神经网络的中文问答系统,其特征在于:包括有用户接口模块(10)、问题预分词模块(20)、神经元提供模块(30)、学习训练模块(40)、神经元知识库模块(50)、语义块识别模块(60)、问题集索引库模块(70)和答案推理模块(80);用户接口模块(10)用于实现用户交互,包括接受用户输入问题,然后对用户输入问题的表达进行检查,将通过检查的用户输入问题提交到问题预分词模块(20),并将答案推理模块(80)所得结果反馈用户;问题预分词模块(20)用于接收用户接口模块(10)传递的用户输入问题,对用户输入问题进行预处理,所述预处理包括对用户输入问题进行分词、语义消歧及确定词性;并将预处理后的用户输入问题提交给语义块识别模块(60);神经元提供模块(30),用于提供训练语料给学习训练模块(40),所述训练语料是预先对训练用问句进行分词、语义消歧、确定词性并进行语义块标注形成的语义块序列;所述语义块标注,是为语义块内所含词,根据其位置设定语义块分类标记;学习训练模块(40),用于对神经网络进行训练直至网络收敛,得到稳定的神经网络;所述神经网络根据训练语料建立,其结构包括输入层、隐含层和输出层,其中输入层根据语义块所含词的词义和语境设定节点,输出层根据语义块分类设定节点,隐含层用于实现输入层到输出层的传递;神经元知识库模块(50),用于保存学习训练模块(40)所得稳定的神经网络;语义块识别模块(60),用于当出现用户输入问题时,从神经元知识库模块(50)中提取运行学习训练模块(40)所得稳定的神经网络并运行,从问题预分词模块(20)所得预处理后的用户输入问题中识别得到语义块,从用户输入问题识别得到的所有语义块构成语义块序列;问题集索引库模块(70),用于存放已知问题和答案对的索引文件;所述索引文件记载有已知问题的语义块序列和答案的位置信息,为回答用户输入问题提供知识来源;答案推理模块(80),用于查询问题集索引库模块(70)所提供索引文件,找到与用户输入问题具有相同或相似关键字的相关问题,取得每个相关问题与用户输入问题的相似度,根据相似度选择应答用的相关问题,根据索引文件记载的位置信息提取应答用的相关问题的答案,通过用户接口模块(10)输出相关问题的答案实现应答;相关问题与用户输入问题的相似度,根据相关问题与用户输入问题的语义块序列相似度以及语境相似度得到,其中语义块序列相似度根据语义块间的相似度得到,语义块间的相似度由语义块内词间的相似度得到。
地址 430079 湖北省武汉市武昌珞瑜路152号