发明名称 一种基于概率潜在语义分析的网络答案选择方法
摘要 一种基于概率潜在语义分析的网络答案选择方法,包括以下步骤:问题集C,以用户集u和词语集w作为变量构建概率潜在语义分析模型,利用所述的概率潜在语义分析模型挖掘各用户u的潜在主题信息;获取问答社区中新提出的问题q,及组成该问题的词语w,确定当前问题与候选答案的联合概率,以及计算当前问题与回答当前问题的用户的联合概率;将当前问题与候选答案的联合概率以及问题与回答当前问题的用户的联合概率进行线性加权得到候选答案得分,对候选答案得分进行降序排列,将答案根据排列顺序推送给提问用户。本发明具有能充分利用问答社区中丰富的用户信息,准确率高,适用性广的优点。
申请公布号 CN101751454A 申请公布日期 2010.06.23
申请号 CN200910155471.9 申请日期 2009.12.12
申请人 浙江大学 发明人 卜佳俊;陈纯;曲明成;仇光;吴昊
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州天正专利事务所有限公司 33201 代理人 王兵;黄美娟
主权项 一种基于概率潜在语义分析的网络答案选择方法,包括以下步骤:1)、提取问答社区中用户提出的问题q及问题q对应的答案a组成问题集C,C={{q1,a1},{q2,a2},...{qi,ai},...{qf,af}},其中,{qi,ai}为第i个问题及其对应的答案;抽取提出问题和回答问题的用户名组成用户集{u1,u2,...ui,...um},其中ui为第i个用户名;抽取组成每个问题q及其对应答案a的词语、构成词语集{w1,w2,...wi,...wn},其中wi为第i个词语;2)、以用户集u和词语集w作为变量构建概率潜在语义分析模型,利用所述的概率潜在语义分析模型挖掘各用户u的潜在主题信息;3)、获取问答社区中新提出的问题q,及组成该问题的词语w,利用步骤2)得出的潜在主题信息确定当前问题与候选答案的联合概率,以及计算当前问题与回答当前问题的用户的联合概率;4)、将当前问题与候选答案的联合概率以及问题与回答当前问题的用户的联合概率进行线性加权得到候选答案得分,对候选答案得分进行降序排列,将答案根据排列顺序推送给提问用户。
地址 310027 浙江省杭州市浙大路38号