发明名称 问句信息处理方法及装置
摘要 本发明公开了一种问句信息处理方法及装置。该方法包括:获取语料数据;对语料数据进行预处理,并提取其中的问句信息;根据相似度计算对问句信息进行聚类处理,聚类处理包括:获取第M个问句信息与已聚类的N个问句信息组之间的最大语义相似度值,当最大语义相似度值大于预设值时,将第M个问句信息聚类到最大语义相似度值对应的问句信息组中;当最大语义相似度值小于预设值时,将第M个问句信息作为第N+1个问句信息组,N小于或等于M‑1借助于本发明的技术方案,能够提高在知识库中添加知识点的效率,避免了人力资源的浪费。
申请公布号 CN105975460A 申请公布日期 2016.09.28
申请号 CN201610369479.5 申请日期 2016.05.30
申请人 上海智臻智能网络科技股份有限公司 发明人 张昊;朱频频
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 工业和信息化部电子专利中心 11010 代理人 秦莹
主权项 一种问句信息处理方法,其特征在于,包括:获取语料数据;对所述语料数据进行预处理,并提取其中的问句信息;根据相似度计算对所述问句信息进行聚类处理,所述聚类处理包括:获取第M个问句信息与已聚类的N个问句信息组之间的最大语义相似度值,当所述最大语义相似度值大于预设值时,将第M个问句信息聚类到所述最大语义相似度值对应的问句信息组中;当所述最大语义相似度值小于预设值时,将第M个问句信息作为第N+1个问句信息组,所述N小于或等于M‑1。
地址 201803 上海市嘉定区金沙江西路1555弄398号7层