发明名称 |
特征选择方法及系统 |
摘要 |
一种特征选择方法及系统,获取初始特征信息及决策特征信息;根据初始特征信息及决策特征信息确定初始特征集的每个特征子集与决策特征集的互信息;将特征子集中与决策特征集具有最大互信息的特征子集作为待选特征集;根据待选相关熵是否大于已选特征集的已选相关熵,确定是否将待选特征集中的特征放入到已选特征集中。该方法及系统选择与决策特征集具有最大互信息的特征子集作为待选特征集,以保证选择出的特征集具有高区分能力。根据待选相关熵是否大于已选特征集的已选相关熵,确定是否将待选特征集中的特征放入到已选特征集中,如此可以在保证具有高区分能力的同时保证冗余度小,以确保选择出的特征集具有高分类精度。 |
申请公布号 |
CN105184323A |
申请公布日期 |
2015.12.23 |
申请号 |
CN201510586621.7 |
申请日期 |
2015.09.15 |
申请人 |
广州唯品会信息科技有限公司 |
发明人 |
徐诚浪 |
分类号 |
G06K9/62(2006.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
广州华进联合专利商标代理有限公司 44224 |
代理人 |
王程 |
主权项 |
一种特征选择方法,其特征在于,包括步骤:获取初始特征信息及决策特征信息;所述初始特征信息包括初始特征集,所述决策特征信息包括决策特征集;根据所述初始特征信息及所述决策特征信息确定所述初始特征集的每个特征子集与决策特征集的互信息;将所述特征子集中与决策特征集具有最大互信息的特征子集作为待选特征集,并根据已选特征集与待选特征集确定待选相关熵;根据所述待选相关熵是否大于所述已选特征集的已选相关熵,确定是否将所述待选特征集中的特征放入到所述已选特征集中。 |
地址 |
510370 广东省广州市荔湾区芳村花海街20号自编1-5号楼 |