主权项 |
一种基于新闻语料的金融概念对应股票关联方法,其特征在于,包括:步骤S100:对经过清洗的所述新闻语料进行分词,得到分词文档;步骤S200:获取所述分词文档的子句中所述金融概念C<sub>i</sub>词的出现频次count(C<sub>i</sub>)、所述股票A<sub>j</sub>词的出现频次count(A<sub>j</sub>)以及所述金融概念C<sub>i</sub>词和所述股票A<sub>j</sub>词同时出现的频次count(C<sub>i</sub>,A<sub>j</sub>),其中i为任一所述金融概念,j为任一所述股票;步骤S300:按式一计算得到所述金融概念C<sub>i</sub>和所述股票A<sub>j</sub>的共现关联度D<sub>ij</sub>,<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>D</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mfrac><mrow><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>C</mi><mi>i</mi></msub><mo>,</mo><msub><mi>A</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>C</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>c</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>t</mi><mrow><mo>(</mo><msub><mi>A</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0000914661430000011.GIF" wi="568" he="131" /></maths> 式一。 |