发明名称 一种领域问答系统咨询的快速可增量聚类方法
摘要 本发明公开了一种领域问答系统咨询的快速可增量聚类方法,该方法基于将离线聚类和在线聚类相结合的聚类框架,通过咨询历史的离线聚类算法,结合咨询去重,利用语义无关词典和词类词典对用户咨询进行语义预处理,从而实现语义的归一化,然后基于多特征的相似度计算构建相似度图,基于相似度图对用户咨询历史进行离线聚类的步骤;进而利用离线聚类的结果作为聚类特征,对用户咨询进行在线聚类,对离线聚类和在线聚类结果进行合并,生成聚类结果。本发明提供的聚类方法,系统响应快、精度符合实际应用需求,有效性和准确性高。
申请公布号 CN104778256A 申请公布日期 2015.07.15
申请号 CN201510187231.2 申请日期 2015.04.20
申请人 江苏科技大学 发明人 马健;刘亮亮;吴健康;李洪梅
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 许丹丹
主权项 一种领域问答系统咨询的快速可增量聚类方法,其特征在于该方法基于将离线聚类和在线聚类相结合的聚类框架,包括以下步骤:1)通过咨询历史的离线聚类算法,结合咨询去重,利用语义无关词典和词类词典对用户咨询进行语义预处理,从而实现语义的归一化,然后基于多特征融合的相似度计算构建相似度图,基于相似度图对用户咨询历史进行离线聚类;所述基于多特征融合的相似度计算方法至少包括基于特征向量的相似度、2‑gram相似度和搭配相似度;2)利用离线聚类的结果作为聚类特征,对用户咨询进行在线聚类,对离线聚类和在线聚类结果进行合并,生成聚类结果。
地址 212003 江苏省镇江市梦溪路2号