发明名称 |
问句信息处理方法及装置 |
摘要 |
本发明公开了一种问句信息处理方法及装置。该方法包括:获取语料数据;对语料数据进行预处理,并提取其中的问句信息;根据相似度计算对问句信息进行聚类处理,聚类处理包括:获取第M个问句信息与已聚类的N个问句信息组之间的最大语义相似度值,当最大语义相似度值大于预设值时,将第M个问句信息聚类到最大语义相似度值对应的问句信息组中;当最大语义相似度值小于预设值时,将第M个问句信息作为第N+1个问句信息组,N小于或等于M‑1借助于本发明的技术方案,能够提高在知识库中添加知识点的效率,避免了人力资源的浪费。 |
申请公布号 |
CN105975460A |
申请公布日期 |
2016.09.28 |
申请号 |
CN201610369479.5 |
申请日期 |
2016.05.30 |
申请人 |
上海智臻智能网络科技股份有限公司 |
发明人 |
张昊;朱频频 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
工业和信息化部电子专利中心 11010 |
代理人 |
秦莹 |
主权项 |
一种问句信息处理方法,其特征在于,包括:获取语料数据;对所述语料数据进行预处理,并提取其中的问句信息;根据相似度计算对所述问句信息进行聚类处理,所述聚类处理包括:获取第M个问句信息与已聚类的N个问句信息组之间的最大语义相似度值,当所述最大语义相似度值大于预设值时,将第M个问句信息聚类到所述最大语义相似度值对应的问句信息组中;当所述最大语义相似度值小于预设值时,将第M个问句信息作为第N+1个问句信息组,所述N小于或等于M‑1。 |
地址 |
201803 上海市嘉定区金沙江西路1555弄398号7层 |