发明名称 一种网络自杀遗书的识别方法
摘要 本发明提出了一种自动识别出现在互联网上的自杀遗书的方法,属于中文文本信息处理与应用心理学技术领域,解决了自动发现网络自杀遗书的技术问题。该发明采用核心词绑定特征句的识别方法,分为特征提取与特征识别两个阶段。通过提取核心词,然后依据核心词所在分句与其特征句相近程度的最大值等因素来计算待检文本的自杀倾向值,继而判断待检样本是否为自杀遗书。本发明能够自动识别网络自杀遗书,可以对出现心理危机的个体进行早期预警,为心理咨询与辅导等部门实施干预与治疗提供依据。本发明简便易行,规避了分词缺陷的负面影响,对新增样本的兼容性强,识别准确率高,漏检率低。
申请公布号 CN102521220A 申请公布日期 2012.06.27
申请号 CN201110386606.X 申请日期 2011.11.29
申请人 华中师范大学 发明人 王泰;徐薇;李隆;刘三女牙
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 武汉天力专利事务所 42208 代理人 吴晓颖;冯卫平
主权项 一种网络自杀遗书的识别方法,其特征在于:该方法由特征提取与特征识别两个阶段组成,所述特征提取阶段,用于获得特征识别阶段所需的“核心词——特征句库”对照表;在该阶段,首先从收集到的足够数量的自杀遗书样本中选出最能体现作者自杀意念的分句称为特征句,然后在这些特征句中,选出最能表达作者自杀意念的核心词,每个特征句限选一个核心词;核心词相同的特征句归入到该核心词的特征句库;核心词A的同义词B也视为核心词,且该同义词B所在的特征句也归入到核心词A的特征句库去;最后,采用启发式的算法选择尽可能少的核心词以覆盖尽可能多的自杀遗书样本,从而建立了“核心词——特征句库”对照表;所述特征识别阶段,用于根据“核心词——特征句库”对照表,对待检文本是否为自杀遗书进行判断;具体过程是如果该文本没有出现核心词,则判别为非自杀遗书;否则,将所有出现了核心词的分句与“核心词——特征句库”对照表中与该核心词相对应的特征句进行比较,把在比较过程中获得的语句相似度的最大值作为该待检句的自杀倾向值,所有待检句自杀倾向值的平均值就是该待检文本的自杀倾向值,最后,将其自杀倾向值与设定阈值进行比较,判断其是否为自杀遗书。
地址 430079 湖北省武汉市洪山区珞喻路152号