发明名称 |
基于知识问答平台的回答排重方法及装置 |
摘要 |
本发明涉及问答平台开发技术领域,公开了一种基于知识问答平台的回答排重方法及装置。该方法包括:获取当前用户提交的回答内容;确定回答内容的长度;如果所述长度小于或等于预设的长度阈值,则判断回答内容是否为其他用户已提交到回答数据库中的已回答内容和问题标题拼接的字符串的子串;如果是,则禁止将回答内容提交到回答数据库中;否则,将回答内容提交到回答数据库中;如果所述长度大于所述长度阈值,则将回答内容按所述长度阈值顺序切割为多个子段;判断所述多个子段中是否有任意一个子段为所述字符串的子串,如果是,则禁止将回答内容提交到回答数据库中;否则,将回答内容提交到回答数据库中。本发明可以实现回答排重,节省网络资源。 |
申请公布号 |
CN102750344B |
申请公布日期 |
2015.02.04 |
申请号 |
CN201210185394.3 |
申请日期 |
2012.06.06 |
申请人 |
新浪网技术(中国)有限公司 |
发明人 |
赵鹏伟 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
赵景平;王宝筠 |
主权项 |
一种基于知识问答平台的回答排重方法,其特征在于,包括:获取当前用户提交的回答内容;从回答数据库中提取除所述当前用户之外的其他用户的已回答内容和问题标题,然后将其拼接成字符串;确定所述回答内容的长度;如果所述长度小于或等于预设的长度阈值,则判断所述回答内容是否为拼接成的字符串的子串,所述字符串包括其他用户已提交到回答数据库中的已回答内容和问题标题,所述已回答内容是其他用户针对与所述用户回答的问题的同一问题的回答内容;如果是,则禁止将所述回答内容提交到所述回答数据库中;否则,将所述回答内容提交到所述回答数据库中;如果所述长度大于所述长度阈值,则将所述回答内容按所述长度阈值顺序切割为多个子段;判断所述多个子段中是否有任意一个子段为所述字符串的子串,如果是,则禁止将所述回答内容提交到所述回答数据库中;否则,将所述回答内容提交到所述回答数据库中。 |
地址 |
100080 北京市海淀区北四环西路58号理想国际大厦20层 |