发明名称 确定词素重要性分析模型的方法及装置
摘要 本发明公开了一种确定词素重要性分析模型的方法及装置,属于计算机领域。所述方法包括:获取至少两条训练数据,每条训练数据包括一个查询词、查询词中的任一词素以及任一词素在查询词中的重要性得分;确定每条训练数据的每个预设特征的特征值;根据所有训练数据的每个预设特征的特征值及所有训练数据中包括的词素的重要性得分确定模型参数,并根据确定的模型参数确定词素重要性分析模型。本发明通过获取到的训练数据确定模型参数,并根据确定的模型参数确定词素重要性分析模型,进而实现通过词素重要性分析模型分析词素重要性时,不仅运算速度较快,提高了分析词素重要性的效率,而且准确性较高。
申请公布号 CN104866496A 申请公布日期 2015.08.26
申请号 CN201410063194.X 申请日期 2014.02.22
申请人 腾讯科技(深圳)有限公司 发明人 姚伶伶;何琪;赫南;张博
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三高永信知识产权代理有限责任公司 11138 代理人 滕一斌
主权项 一种确定词素重要性分析模型的方法,其特征在于,所述方法包括:获取至少两条训练数据,每条训练数据包括一个查询词、所述查询词中的任一词素以及所述任一词素在所述查询词中的重要性得分;确定每条训练数据的每个预设特征的特征值,所述预设特征至少包括词素自解释特征及词素交叉特征中的一种特征;根据所有训练数据的每个预设特征的特征值及所有训练数据中包括的词素的重要性得分确定模型参数,并根据确定的模型参数确定词素重要性分析模型;其中,所述模型参数的数量由所述预设特征的数量确定,且所述模型参数的数量不大于所述训练数据的数量。
地址 518000 广东省深圳市福田区振兴路赛格科技园2栋东403室