发明名称 | 对字符串进行分类的方法和装置 | ||
摘要 | 本发明公开了一种对字符串进行分类的方法和装置,属于计算机通信技术领域。所述方法包括:获取待分类字符串;从所述待分类字符串中提取多个分类特征;对每个所述分类特征分别进行归一化处理,得到多个归一化分类特征;通过离线训练得到的分类模型,根据多个所述归一化分类特征,对所述待分类字符串进行分类,得到所述待分类字符串的分类结果。所述装置包括:获取模块、第一提取模块、归一化模块和分类模块。本发明通过离线训练得到的分类模型,根据多个归一化分类特征,对待分类字符串进行分类,得到待分类字符串的分类结果,不需要依靠人工,即可自动实现,效率很高。 | ||
申请公布号 | CN106156120A | 申请公布日期 | 2016.11.23 |
申请号 | CN201510162076.9 | 申请日期 | 2015.04.07 |
申请人 | 阿里巴巴集团控股有限公司 | 发明人 | 李家宏 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京国昊天诚知识产权代理有限公司 11315 | 代理人 | 许志勇;刘戈 |
主权项 | 一种对字符串进行分类的方法,其特征在于,所述方法包括:获取待分类字符串;从所述待分类字符串中提取多个分类特征;对每个所述分类特征分别进行归一化处理,得到多个归一化分类特征;通过离线训练得到的分类模型,根据多个所述归一化分类特征,对所述待分类字符串进行分类,得到所述待分类字符串的分类结果。 | ||
地址 | 英属开曼群岛大开曼资本大厦一座四层847号邮箱 |