发明名称 |
一种筛选问答对并实时更新问答库的方法及系统 |
摘要 |
本发明涉及一种筛选问答对并实时更新问答库的方法及系统,所述方法包括以下步骤:将客服聊天记录解析成标准格式的聊天记录;从标准格式的聊天记录中筛选出问答对;通过三个条件判断是否以前处理过相同的合法问答对,若是,更新相应的统计信息即可,否则在库中创建相应的问答对。通过上述方法和系统,本发明能够从已有的客服聊天记录中自动筛选问答对并构建问答库,无需人工干预,并能够随着时间的推移和聊天记录实现问答库的增量、实时更新。 |
申请公布号 |
CN104679815A |
申请公布日期 |
2015.06.03 |
申请号 |
CN201410743891.X |
申请日期 |
2014.12.08 |
申请人 |
北京云知声信息技术有限公司 |
发明人 |
崇伟峰 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京轻创知识产权代理有限公司 11212 |
代理人 |
杨立 |
主权项 |
一种筛选问答对并实时更新问答库的方法,包括以下步骤:步骤1,将客服聊天记录解析成标准格式的聊天记录;步骤2,从标准格式的聊天记录中筛选出问答对;步骤3,根据问答对的问题和答案,检查合法问答对库中是否存储有相同的合法问答对,若是,执行步骤4;否则,执行步骤5;步骤4,更新所述合法问答对库中所述合法问答对的统计信息,并更新与所述合法问答对对应的复述问答对库中的复述问答对的统计信息,结束处理;步骤5,根据所述问答对中的问题和答案,查找复述问答组库中的复述问题组和复述答案组,得到与问答对对应的问题ID和答案ID,根据问题ID和答案ID,检查复述问答对库中是否存储有问题ID和答案ID组成的复述问答对,若是,执行步骤6;否则,执行步骤7;步骤6,根据所述问答对中的问题和答案在合法问答对库中创建新的合法问答对,并更新与新的合法问答对对应的复述问答对库中的复述问答对的统计信息,结束处理;步骤7,计算问答对中问题和答案的匹配程度值,将所述匹配程度值与预设阈值相比较,根据比较结果创建新的合法问答对或候选问答对,结束处理。 |
地址 |
100191 北京市海淀区花园路2号牡丹科技楼A座5层 |