发明名称 一种微博主题情感演化分析方法
摘要 本发明涉及一种微博主题情感演化分析方法,包括以下步骤:步骤1、设置本方法相关的循环控制参数C<sub>1</sub>、C<sub>2</sub>、C<sub>3</sub>与C<sub>4</sub>,以及情感词典;步骤2、初始化微博消息集中的词语情感极性与主题归属;步骤3、根据设定时间粒度TG计算微博消息的所属时间片编号;步骤4:利用主题情感演化模型TSEM不断对变量                                               <img file="dest_path_image002.GIF" wi="378" he="30" />、<img file="dest_path_image004.GIF" wi="37" he="26" />、<img file="dest_path_image006.GIF" wi="53" he="26" />和<img file="dest_path_image008.GIF" wi="39" he="30" />进行迭代更新; 步骤5、通过<img file="897717dest_path_image008.GIF" wi="39" he="30" />判断每条发表于时间片<i>d</i>内的微博<i>m</i>的情感极性。该方法能够有效发现隐藏于微博消息中的主题情感演化模式。
申请公布号 CN104978308A 申请公布日期 2015.10.14
申请号 CN201510263378.5 申请日期 2015.05.22
申请人 福建师范大学 发明人 黄发良;李超雄;李璇;元昌安
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 福州元创专利商标代理有限公司 35100 代理人 蔡学俊
主权项 一种微博主题情感演化分析方法,其特征在于,包括以下步骤:步骤1、设置本方法相关的循环控制参数,以及情感词典;步骤2、初始化微博消息集中的词语情感极性与主题归属:若微博消息集里的词语在所述情感词典中出现,则将所述词语的情感极性赋为情感词典定义的情感极性值,否则为所述词语随机分配情感极性<i>l</i>;若词语所在微博消息具有以特殊符号“#”标记的微博用户明确定义的主题,则将所述主题作为所述词语的所属主题,否则为所述词语随机指定主题;步骤3、根据设定时间粒度TG计算微博消息的所属时间片编号:假定微博消息集里的所有消息发布时间序列为{<i>ut</i><sub>1</sub>, <i>ut</i><sub>2</sub>, ... , <i>ut<sub>m</sub></i>},对于发布时间为<i>ut<sub>i</sub></i>的消息<i>i</i>,根据<img file="dest_path_image001.GIF" wi="265" he="27" />计算出其所在的时间片编号为k;步骤4:利用主题情感演化模型TSEM不断对变量<img file="587704dest_path_image002.GIF" wi="377" he="29" />、<img file="dest_path_image003.GIF" wi="37" he="26" />、<img file="222953dest_path_image004.GIF" wi="53" he="27" />和<img file="dest_path_image005.GIF" wi="39" he="29" />进行迭代更新;其中,<img file="48696dest_path_image006.GIF" wi="57" he="24" />表示时间片<i>d</i>内发布的消息<i>m</i>的句子<i>s</i>中主题<i>t</i>属于情感极性<i>l</i>的频数,<img file="dest_path_image007.GIF" wi="50" he="23" />表示时间片<i>d</i>内发布的消息<i>m</i>的句子<i>s</i>中属于情感极性<i>l</i>的主题总频数,<img file="224331dest_path_image008.GIF" wi="47" he="23" />表示词语<i>w</i>同时属于主题<i>t</i>、情感极性<i>l</i>和时间片<i>d</i>的频数,<img file="dest_path_image009.GIF" wi="38" he="21" />表示所有同时属于主题<i>t</i>、情感极性<i>l</i>和时间片<i>d</i>的词语的总频数,<img file="553550dest_path_image010.GIF" wi="43" he="21" />表示时间片<i>d</i>内发布的消息<i>m</i>中情感极性<i>l</i>出现的频数,<img file="dest_path_image011.GIF" wi="35" he="23" />表示时间片<i>d</i>内发布的消息<i>m</i>中情感极性<i>l</i>的总频数,<img file="383139dest_path_image003.GIF" wi="37" he="26" />表示时间片<i>d</i>内发布的所有消息中词语<i>w</i>同时属于主题<i>t</i>和情感极性<i>l</i>的概率;<img file="40385dest_path_image012.GIF" wi="53" he="26" />表示时间片<i>d</i>内发布的消息<i>m</i>的句子<i>s</i>中主题<i>t</i>属于情感极性<i>l</i>的概率;<img file="dest_path_image013.GIF" wi="39" he="30" />表示时间片<i>d</i>内发布的消息<i>m</i>中情感极性<i>l</i>出现的概率;步骤5、通过<img file="488553dest_path_image013.GIF" wi="39" he="30" />判断每条发表于时间片<i>d</i>内的消息<i>m</i>的情感极性:若<img file="547644dest_path_image014.GIF" wi="95" he="32" />,其中<i>l</i><sub>1</sub>为积极情感,<i>l</i><sub>2</sub>为消极情感,则判定消息<i>m</i>的情感极性为积极情感,反之为消极情感。
地址 350108 福建省福州市闽侯福建师大旗山校区科研处