发明名称 一种基于评分机制的反馈型问题类型分类器系统及其工作方法
摘要 本发明涉及一种基于评分机制的反馈型问题类型分类器系统及其工作方法,属于自然语言处理领域。该系统包括:训练样本问题集模块、分词模块、评分模块、词向量模块、分类模块、词库模块及类别比较模块,分词模块用于对训练样本问题分词获得带词性标注的词组集;评分模块用于对带词性标注的词组集进行分析,得到词组的评分权重;词向量模块用于生成该分词词组集对应的词向量;分类模块将对分类器进行迭代、训练,得到类别判别结果,并于目标类别标注相比较,将其结果并反馈到评分模块。本发明公布的问题类型分类器结合评分机制和反馈机制,可达到较为准确识别问题类型的目的。
申请公布号 CN105677779A 申请公布日期 2016.06.15
申请号 CN201511025769.X 申请日期 2015.12.30
申请人 山东大学 发明人 许宏吉;党娟;刘琚;季名扬;许征征;房海腾
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 济南金迪知识产权代理有限公司 37219 代理人 杨树云
主权项 一种基于评分机制的反馈型问题类型分类器系统,其特征在于,包括:训练样本问题集模块、分词模块、评分模块、词向量模块、分类模块、词库模块及类别比较模块,所述训练样本问题集模块、所述分词模块、所述评分模块、所述词向量模块、所述分类模块、所述类别比较模块依次连接,所述分词模块、所述词库模块、所述词向量模块依次连接,所述分词模块连接所述词向量模块,所述训练样本问题集模块连接所述类别比较模块,所述类别比较模块连接所述评分模块;所述训练样本问题集模块用于:对每个训练样本问题人工划分类别,得到训练样本问题集;并人工标注得到所述训练样本问题集中的每个训练样本问题的类别标注;所述分词模块用于:对训练样本问题集中的训练样本问题进行分词,获得带词性标注的词组集,并将带词性标注的词组集分别发送给所述评分模块及所述词向量模块;所述词库模块用于:存储所述分词模块中全部训练样本问题的无重复的分词词组及相应词性,并发送到所述词向量模块;所述评分模块用于:对带词性标注的词组集进行句法分析,获得词组间的依赖关系,生成词图,得到词组的评分权重;所述词向量模块用于:接收词库模块中分词词组及相应词性,与所述词向量模块当前处理的带词性标注的词组集对比,生成当前处理的带词性标注的词组集对应的词向量,并将得到的词向量发送至所述分类模块;所述分类模块用于:对词向量进行迭代、训练,收敛到最优类别判别结果;所述类别比较模块用于:将最优类别判别结果与所述训练样本问题集中相应训练样本问题的类别标注相比较,其结果并反馈到所述评分模块。
地址 250199 山东省济南市历城区山大南路27号