发明名称 | 获取业务对象标签、建立训练模型的方法及装置 | ||
摘要 | 本发明公开了获取业务对象标签、建立训练模型的方法及装置,其中,所述获取业务对象标签的方法包括:获取目标业务对象的文字描述信息,对所述文字描述信息进行分词,得到多个描述词语;提取各个描述词语的特征;将各个描述词语的特征以及描述词语在所述目标文字描述信息中的上下文信息输入到预置的训练模型中,根据所述训练模型的输出结果确定各个描述词语是否可作为对应业务对象的标签;其中,所述训练模型用于预测目标文字描述信息中的各个描述词语能够作为对应业务对象的标签的概率,该概率与当前描述词语的特征以及该当前描述词语在所述目标文字描述信息中的上下文信息相关。通过本发明,可以使得预测出的结果具有较高的准确度。 | ||
申请公布号 | CN104111933A | 申请公布日期 | 2014.10.22 |
申请号 | CN201310134293.8 | 申请日期 | 2013.04.17 |
申请人 | 阿里巴巴集团控股有限公司 | 发明人 | 钟灵;成幸毅;陈凡;金凯民 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京润泽恒知识产权代理有限公司 11319 | 代理人 | 苏培华 |
主权项 | 一种获取业务对象标签的方法,其特征在于,包括:获取目标业务对象的文字描述信息,对所述文字描述信息进行分词,得到多个描述词语;提取各个描述词语的特征;将各个描述词语的特征以及描述词语在所述目标文字描述信息中的上下文信息输入到预置的训练模型中,根据所述训练模型的输出结果确定各个描述词语是否可作为对应业务对象的标签;其中,所述训练模型用于预测目标文字描述信息中的各个描述词语能够作为对应业务对象的标签的概率,该概率与当前描述词语的特征以及该当前描述词语在所述目标文字描述信息中的上下文信息相关;其中,所述上下文信息包括当前描述词语前M个描述词语和后N个描述词语的特征,M、N均为整数。 | ||
地址 | 英属开曼群岛大开曼资本大厦一座四层847号邮箱 |