发明名称 一种基于最优间隔分布脊回归的网络情感分类方法
摘要 本发明公开了一种基于最优间隔分布脊回归的网络情感分类方法,通过考虑局部类内关系和全局类间关系,将网络情感分类问题描述成一个凸二次优化目标的形式加以求解。根据网页对象本身的特征,本发明给出了线性和非线性两种解法,用户可以根据实际情况自行选择。此外,用户可以根据需求来设计类内间隔方差和类间间隔方差的比重,从而能够更好地结合网页特征与需求。
申请公布号 CN106203504A 申请公布日期 2016.12.07
申请号 CN201610538498.6 申请日期 2016.07.08
申请人 南京大学 发明人 高尉;周志华;陈加略
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 李玉平
主权项 一种基于最优间隔分布脊回归的网络情感分类方法,其特征在于,包括下列步骤:步骤100,建立一个包含网络情感信息的网页对象库作为训练数据集,将对象库中的所有网页对象赋予一个类别标记;步骤101,通过特征提取算法,提取网页对象库中对象的特征,将所有网页对象转化成相应的特征向量;步骤102,询问用户是否需要使用线性函数,若用户选择“是”则转到步骤103,若用户选择“否”,计算核矩阵K并转到步骤104;步骤103询问用户是否需要控制网页对象类内间隔方差和类间间隔方差的比重,若用户选择“否”则转到步骤105,若用户选择“是”则转到步骤106;步骤104询问用户是否需要控制网页对象类内间隔方差和类间间隔方差的比重,若用户选择“否”则转到步骤107,若用户选择“是”则转到步骤108;步骤105,使用线性2系数ODMRR算法训练分类器;步骤106,使用线性3系数ODMRR算法训练分类器;步骤107,使用非线性2系数ODMRR算法训练分类器;步骤108,使用非线性3系数ODMRR算法训练分类器;步骤109,获取待测网页对象的特征向量,将该特征向量输入分类器中以获取其预测标记。
地址 210046 江苏省南京市栖霞区仙林大道163号