发明名称 |
一种用于对问题进行聚类处理的方法与装置 |
摘要 |
本发明的目的是提供一种用于对问题进行聚类处理的方法与装置;获取待聚类的目标问题与候选问题;根据所述目标问题与候选问题的问题特征,确定所述目标问题与候选问题的特征向量;根据所述目标问题与候选问题的特征向量,计算所述目标问题与候选问题的相似度;根据所述相似度,并结合分段阈值,判断是否将所述目标问题与候选问题聚为一类。与现有技术相比,本发明根据待聚类的目标问题与候选问题的问题特征,确定特征向量,进而计算该目标问题与候选问题的相似度,并结合分段阈值,判断是否将该目标问题与候选问题聚为一类,高效、准确地对问题进行聚类处理,整合了问题资源,提高了用户的检索体验。 |
申请公布号 |
CN103744889A |
申请公布日期 |
2014.04.23 |
申请号 |
CN201310718033.5 |
申请日期 |
2013.12.23 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
李皛皛;方高林;孟新萍;杨帆 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京汉昊知识产权代理事务所(普通合伙) 11370 |
代理人 |
罗朋;周建华 |
主权项 |
一种用于对问题进行聚类处理的方法,其中,该方法包括以下步骤:a 获取待聚类的目标问题与候选问题;b 根据所述目标问题与候选问题的问题特征,确定所述目标问题与候选问题的特征向量;c 根据所述目标问题与候选问题的特征向量,计算所述目标问题与候选问题的相似度;d 根据所述相似度,并结合分段阈值,判断是否将所述目标问题与候选问题聚为一类。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦 |