发明名称 |
一种中文微博主客观句分类方法 |
摘要 |
本发明提出了一种中文微博主客观句分类方法,所述方法包括:根据预设的主观句训练语料集和客观句训练语料集形成如下的六个特征集:3‑POS主观模式特征集、句法依存关系特征集、情感词特征集、情感影响因子特征集、语气词及标点符号特征集、字数及链接特征集;根据所述六个特征集,利用支持向量机SVM算法,形成中文微博主客观句分类模型,以利用所述中文微博主客观句分类模型对待测试语句进行主客观句分类。所述方法不但考虑了中文文本的语言学特点,同时也充分利用微博的个性化特征,使得本文所选取的特征更加接近微博本身的语义描述。 |
申请公布号 |
CN106055633A |
申请公布日期 |
2016.10.26 |
申请号 |
CN201610367978.0 |
申请日期 |
2016.05.30 |
申请人 |
国家计算机网络与信息安全管理中心 |
发明人 |
佟玲玲;杜兰;钮艳;易立;李鹏霄;刘洋;查奇文;万欣欣;孙旷怡 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
工业和信息化部电子专利中心 11010 |
代理人 |
田卫平 |
主权项 |
一种中文微博主客观句分类方法,其特征在于,包括:根据预设的主观句训练语料集和客观句训练语料集形成如下的六个特征集:3‑POS主观模式特征集、句法依存关系特征集、情感词特征集、情感影响因子特征集、语气词及标点符号特征集、字数及链接特征集;根据所述六个特征集,利用支持向量机SVM算法,形成中文微博主客观句分类模型,以利用所述中文微博主客观句分类模型对待测试语句进行主客观句分类。 |
地址 |
100029 北京市朝阳区裕民路甲3号 |