发明名称 |
一种股市风险预测平台及其文本挖掘方法 |
摘要 |
本发明公开了一种股市风险预测平台,包括:数据采集模块;数据预处理模块;文本挖掘模块;股市预测模块;风险评估模块;结果输出模块。本发明还提供了一种股市风险预测平台的文本挖掘方法,是一种将非结构化的文本数据转化为结构化数据的方法以分析文档中所蕴含的观点、态度或者情。本发明设计合理,将非结构化的文本数据转化为结构化数据的方法以分析文档中所蕴含的观点、态度或者情绪,并且根据数据分析得到的结果进行股市风险等级的评定,股市风险等级不仅可以服务于投资者决策,还可以为制定相关政策、企业实施相应策略等提供依据。 |
申请公布号 |
CN105956770A |
申请公布日期 |
2016.09.21 |
申请号 |
CN201610283046.8 |
申请日期 |
2016.05.03 |
申请人 |
中国科学院大学 |
发明人 |
吴德胜 |
分类号 |
G06Q10/06(2012.01)I;G06Q40/04(2012.01)I |
主分类号 |
G06Q10/06(2012.01)I |
代理机构 |
北京市中闻律师事务所 11388 |
代理人 |
蒋玉 |
主权项 |
一种股市风险预测平台,其特征在于:包括:数据采集模块,用于自动搜集和获取股票市场交易数据和多源互联网文本数据;数据预处理模块,对数据采集模块中获取的数据进行预处理,包含数据清洗、数据集成、数据变换和数据归约,为建立股市预测模型做好数据准备工作;文本挖掘模块,用于对互联网文本数据进行分析处理以挖掘投资者情绪,构建情绪指数,包含文本分词、词性标注、情感极性标注、情绪指数计算、情绪指数调整、情绪指数整合六大步骤;股市预测模块,综合应用文本挖掘、机器学习、数理统计的方法对股票市场进行预测分析;风险评估模块,根据股市预测模块的结果对实时监控的股票和市场整体趋势进行风险等级划分;结果输出模块,用于向投资者输出所关注的股票的风险等级,并同时输出整个市场的风险等级情况并提供实时预警。 |
地址 |
100049 北京市石景山区玉泉路(甲)19号 |