发明名称 |
应用于自动问答系统的问句分类方法及装置 |
摘要 |
本发明提供了一种应用于自动问答系统的问句分类方法及装置,预置包括名词及疑问代词细粒度词性对照信息的词性对照表,方法包括:调用用于执行词性标注操作的预置接口将接收到的问句划分为多个分词,并根据词性对照表对分词进行细粒度词性标注以得到对应的细粒度词性标注序列;将细粒度词性标注序列与预设一级分类模式匹配以第一次确定问句的类别;若第一次确定的类别不唯一,则将细粒度词性标注序列与预设二级分类模式匹配以第二次确定问句的类别;若第二次确定的类别不唯一,则将细粒度词性标注序列与预设三级分类模式匹配以第三次确定问句的类别,以当第三次确定的类别唯一时,确定该类别为问句的类别。该方法可提高问句分类的效率及准确率。 |
申请公布号 |
CN104657463A |
申请公布日期 |
2015.05.27 |
申请号 |
CN201510070543.5 |
申请日期 |
2015.02.10 |
申请人 |
乐娟;北京戏曲艺术职业学院 |
发明人 |
乐娟 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京恒都律师事务所 11395 |
代理人 |
李向东 |
主权项 |
一种应用于自动问答系统的问句分类方法,其特征在于,预先设置词性对照表,所述词性对照表中包括名词细粒度词性对照信息及疑问代词细粒度词性对照信息,所述方法包括:调用用于执行词性标注操作的预置接口,将接收到的问句划分为多个分词以组成分词序列,并根据所述词性对照表对所述分词序列中的分词进行细粒度词性标注,以得到所述分词序列对应的细粒度词性标注序列;将所述细粒度词性标注序列与预设一级分类模式进行匹配以对问句的类别进行第一次确定;若第一次确定的类别不是唯一的,则将所述细粒度词性标注序列与预设二级分类模式进行匹配以对问句的类别进行第二次确定;若第二次确定的类别不是唯一的,则将所述细粒度词性标注序列与预设三级分类模式进行匹配以对问句的类别进行第三次确定,以便当第三次确定的类别为唯一时,则确定该唯一的类别为所述问句的类别并将所述问句的类别返回,以完成针对所述问句的分类操作;其中,预设一级分类模式、预设二级分类模式及预设三级分类模式为基于依存句法分析方法抽取问句中的主谓、动宾及定中三种依存句法关系特征而形成的逐级分类模式。 |
地址 |
100068 北京市丰台区马家堡东里8号 |