发明名称 一种基于大数据的券商客户风险偏好分类方法
摘要 本发明公开了一种基于大数据的券商客户风险偏好分类方法,先使用主成分分析来简化数据。再利用改进的K‑means算法进行迭代按算法确立聚心、聚类、调整聚心并删除不满足条件的聚心、重新聚类。直到聚心不再改变,停止聚类。确立聚心仅需一次,不需要迭代。得到客户的交易类别划分结果。基于上述的聚类结果,即客户的交易类别划分,结合不同产品的风险值,可确定客户的交易风险偏好。这是主要的。其次,辅助以已有的证券交易系统的在线问卷调查获得客户的主观风险偏好。二者相结合,可以更合理准确地得到客户的风险偏好的最终结果。本系统运行依靠券商的数据库,只要用户有交易历史数据,就可以据此判断该用户的投资偏好,这也直接反映客户的风险特征。这正是本系统的优越性和方便性体现。
申请公布号 CN106228399A 申请公布日期 2016.12.14
申请号 CN201610573542.7 申请日期 2016.07.20
申请人 福建工程学院 发明人 肖琳;陈庆强;邹复民;刘建华;郭李华
分类号 G06Q30/02(2012.01)I;G06Q40/04(2012.01)I 主分类号 G06Q30/02(2012.01)I
代理机构 北京市商泰律师事务所 11255 代理人 王晓彬
主权项 一种基于大数据的券商客户风险偏好分类方法,其特征在于,包括以下步骤:步骤一)从原始数据中选取要进行分析的变量,再使用主成分分析法对选取的变量进行分析,得到主成分矩阵X<sub>F</sub>;步骤二)在主成分矩阵X<sub>F</sub>中确定出K个簇的初始簇心;步骤三)计算每个簇心与最邻近簇心之间距离;将X<sub>F</sub>中所有的样本对象分配到最邻近的簇中,然后更新每个簇中对象的数目及离簇心最远的对象与簇心间距离值;按均值调整每个簇簇心,直至所有簇心位置无调整;按照条件1依次计算判断每个簇,条件1为:该簇中对象数目小于最邻近簇的对象数,且该簇与最邻近簇的簇心距离小于2倍的离簇心最远的对象与簇心间距离;删除满足条件1的簇,再使用新的簇心代入步骤三);步骤四)在步骤三)迭代数次后,得到稳定的主成分矩阵X<sub>F</sub>的聚类结果;所述聚类结果即为客户的交易类别划分,再结合不同产品的风险值,即可确定客户的交易风险偏好。
地址 350118 福建省福州市大学新区学院路3号