发明名称 一种基于固定主题的文本情感倾向性分类方法
摘要 本发明公开了一种基于固定主题的文本情感倾向性分类的方法,属于文本情感倾向性分类领域。首先找出句子的主题,根据主题在本句的位置分成两步分别计算此主题前后的情感倾向,最终再计算出此主题的情感倾向。利用特征情感符号和通用情感词典找出句子中的情感符号;在主题词与情感符号之间找否定词和程度副词并计算其对此情感符号的影响;在情感符号之间找连接关系并计算本主题的情感倾向。本发明能帮助用户得到其他用户对某一产品、服务、事件或人物重要属性的倾向程度,并细分出相关用户对此产品、事件或人物各特征方面的情感倾向。
申请公布号 CN106202200A 申请公布日期 2016.12.07
申请号 CN201610485392.4 申请日期 2016.06.28
申请人 昆明理工大学 发明人 邵玉斌;王丽霞;刘彩;王晨歌;杜庆治
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于固定主题的文本情感倾向性分类方法,其特征在于,包括以下步骤:(1)划分中文文本中句子的组成成分将句子划分为四种成分,包括主题T、情感符号S、修饰情感符号的程度副词W、修饰情感符号的否定词P;(2)建立特征属性等式,找出中文文本中所有主题T;(3)找出每个主题T常用的特征情感符号和通用情感词典,按照积极和消极为情感符号赋值D<sub>s</sub>;(4)按句子顺序,找出中文文本中第一个主题T<sub>1</sub>,在主题T<sub>1</sub>后面从特征情感符号和通用情感词典找出第一个情感符号S<sub>1</sub>,其情感倾向值为步骤(3)中对应的情感符号赋值D<sub>s</sub>,没有情感符号则情感倾向值为0并继续查找下一主题;(5)在第一个主题T<sub>1</sub>与第一个情感符号S<sub>1</sub>之间找出所有的否定词P和程度副词W,并记录其位置P<sub>ID</sub>和W<sub>ID</sub>,计算第一个情感符号S<sub>1</sub>的情感倾向值S<sub>T11</sub>;①否定词P的个数为偶数时:<maths num="0001"><math><![CDATA[<mrow><msub><mi>S</mi><mrow><msub><mi>T</mi><mn>1</mn></msub><mn>1</mn></mrow></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><msub><mi>D</mi><mi>S</mi></msub></mtd><mtd><mrow><mo>(</mo><msub><mi>D</mi><mi>W</mi></msub><mo>=</mo><mn>0</mn><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>D</mi><mi>S</mi></msub><mo>&CenterDot;</mo><msub><mi>D</mi><mi>W</mi></msub></mrow></mtd><mtd><mrow><mo>(</mo><msub><mi>D</mi><mi>W</mi></msub><mo>&NotEqual;</mo><mn>0</mn><mo>)</mo></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001032884160000011.GIF" wi="518" he="142" /></maths>②否定词P的个数为奇数时:<maths num="0002"><math><![CDATA[<mrow><msub><mi>S</mi><mrow><msub><mi>T</mi><mn>1</mn></msub><mn>1</mn></mrow></msub><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mo>-</mo><mi>S</mi></mrow></mtd><mtd><mrow><mo>(</mo><msub><mi>D</mi><mi>W</mi></msub><mo>=</mo><mn>0</mn><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mrow><mfrac><mrow><msub><mi>W</mi><mrow><mi>I</mi><mi>D</mi></mrow></msub><mo>-</mo><msub><mi>P</mi><mrow><mi>I</mi><mi>D</mi></mrow></msub></mrow><mrow><mo>|</mo><msub><mi>W</mi><mrow><mi>I</mi><mi>D</mi></mrow></msub><mo>-</mo><msub><mi>P</mi><mrow><mi>I</mi><mi>D</mi></mrow></msub><mo>|</mo></mrow></mfrac><mo>&CenterDot;</mo><msub><mi>D</mi><mi>S</mi></msub><mo>&CenterDot;</mo><msub><mi>D</mi><mi>W</mi></msub></mrow></mtd><mtd><mrow><mo>(</mo><msub><mi>D</mi><mi>W</mi></msub><mo>&NotEqual;</mo><mn>0</mn><mo>)</mo></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001032884160000012.GIF" wi="734" he="215" /></maths>其中D<sub>S</sub>为情感符号的赋值,D<sub>w</sub>表示程度副词的赋值,W<sub>ID</sub>为程度副词的位置,P<sub>ID</sub>为离S最近的否定词的位置;(6)在第一个情感符号S<sub>1</sub>后面继续查找第二个情感符号S<sub>2</sub>,按照步骤(4)和(5)计算第二个情感符号S<sub>2</sub>的情感倾向值S<sub>T12</sub>,并按照两者之间的连接关系计算第一个主题T<sub>1</sub>后面的情感倾向值,若第一个情感符号S<sub>1</sub>后面没有其他情感符号则查找下一主题;①并列关系:第一个主题T<sub>1</sub>后面的情感倾向值为第一个情感符号S<sub>1</sub>和第二个情感符号S<sub>2</sub>的情感倾向值之和;②转折关系:第一个主题T<sub>1</sub>后面的情感倾向值为第二个情感符号S<sub>2</sub>的情感倾向值;(7)继续顺序查找句子中其他情感符号直至句末或下一个主题词,并按照步骤(6)计算出第一个主题T<sub>1</sub>后总的情感倾向值S<sub>T1A</sub>;(8)查找第一个主题T<sub>1</sub>前面的情感符号,并按步骤(4)‑(7)计算第一个主题T<sub>1</sub>前面的情感倾向值S<sub>T1B</sub>;(9)计算第一个主题T<sub>1</sub>的情感倾向值S<sub>T1</sub>=S<sub>T1A</sub>+S<sub>T1B</sub>;(10)依次查找其他主题并计算情感倾向值,每一句的情感倾向通过本句中所有主题的情感倾向值之和判断。
地址 650093 云南省昆明市五华区学府路253号