发明名称 基于新闻语料的金融概念对应股票关联方法及其装置
摘要 本发明提供一种基于新闻语料的金融概念对应股票关联方法,该方法以爬取的互联网上财经新闻或社交论坛获的文章为语料,通过统计语料中关键词的出现频次,动态建立金融概念与个股之间的关联关系,作为决策资讯提供给投资者。
申请公布号 CN105718444A 申请公布日期 2016.06.29
申请号 CN201610051993.4 申请日期 2016.01.26
申请人 中国人民解放军国防科学技术大学 发明人 陈发君;黄金才;刘忠;程光权;朱承;修保新;陈超;冯旸赫
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京中济纬天专利代理有限公司 11429 代理人 陈立新
主权项 一种基于新闻语料的金融概念对应股票关联方法,其特征在于,包括:步骤S100:对经过清洗的所述新闻语料进行分词,得到分词文档;步骤S200:获取所述分词文档的子句中所述金融概念C<sub>i</sub>词的出现频次count(C<sub>i</sub>)、所述股票A<sub>j</sub>词的出现频次count(A<sub>j</sub>)以及所述金融概念C<sub>i</sub>词和所述股票A<sub>j</sub>词同时出现的频次count(C<sub>i</sub>,A<sub>j</sub>),其中i为任一所述金融概念,j为任一所述股票;步骤S300:按式一计算得到所述金融概念C<sub>i</sub>和所述股票A<sub>j</sub>的共现关联度D<sub>ij</sub>,<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>D</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mfrac><mrow><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>C</mi><mi>i</mi></msub><mo>,</mo><msub><mi>A</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>C</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>A</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0000914661430000011.GIF" wi="568" he="131" /></maths>      式一。
地址 410073 湖南省长沙市开福区德雅路109号