发明名称 一种基于结构化文本知识提取的问答系统构建方法
摘要 本发明公开了一种基于结构化文本知识提取的问答系统构建方法,该方法需要基于知识库、分词方法、决策树方法进行实现。知识库分为四部分,一是词库以及相应本体,基于本体方法,将词库中名词与相应本体关联;二是以文本主题本体为索引的结构化文本;三是文本主题本体和关键词本体关联的网状知识模型;四是基于决策树方法构建的决策树模型。决策树模型以网状知识模型的关键词本体数据为特征,以网状知识模型的文本主题本体为结果,将关键词本体和文本主题本体相关联,在问答系统中用于决策支持。本发明可适用于多种不同领域,针对各个领域的问题进行解答,且系统构建方法比较简便易于实现。
申请公布号 CN105528437A 申请公布日期 2016.04.27
申请号 CN201510960519.9 申请日期 2015.12.17
申请人 浙江大学 发明人 李石坚;朱余旭;石龙翔;陶海;潘纲
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州天勤知识产权代理有限公司 33224 代理人 胡红娟
主权项 一种基于结构化文本知识提取的问答系统构建方法,包括如下步骤:(1)对于任一领域,收集关于该领域的所有名词组成词库,同时收集该领域范围内的所有文本主题及其对应的结构化文本;(2)将词库里的所有名词进行同义词归类,将所有具有相同含义的名词映射为一个本体;(3)对文本主题的结构化文本进行分词,每个文本主题的结构化文本通过分词均对应得到若干个关键词,进而确定每个关键词和每个文本主题各自对应的本体;(4)基于结构化文本关键词与文本主题的关联性,建立一个涵盖所有结构化文本关键词本体与文本主题本体关联的网状知识模型;(5)基于上述网状知识模型,以关键词本体为特征,以文本主题本体为结果,根据所有结构化文本的关键词本体和文本主题本体构建该领域的决策树模型;(6)对用户关于该领域所输入的问句进行分词,得到若干个关键词;将该问句各关键词所对应的本体输入至该领域的决策树模型中,得到相关的文本主题本体及其结构化文本作为输出呈现给用户。
地址 310027 浙江省杭州市西湖区浙大路38号