发明名称 |
文本过滤系统及方法 |
摘要 |
本发明公开一种文本过滤系统及方法,该系统至少包括:本体库建立模组,用于根据用户的过滤需求建立本体库;自适应学模组,通过对一组过滤样本进行训练学以对该本体库建立模组建立的本体库动态调整,使其逐渐接近于用户的过滤需求;以及文本过滤模组,通过对待过滤文本进行预处理、抽取特征词集及相似度匹配处理后,获得该待过滤文本与本体的相关度,并根据该相关度对该待过滤文本进行过滤,通过本发明,不仅能够准确表达用户的过滤模型,并能够在过滤时进行自主学,调整采用本体表达的用户过滤模型,并能够动态调整过滤阈值,以达到更好的过滤效果。 |
申请公布号 |
CN102521402A |
申请公布日期 |
2012.06.27 |
申请号 |
CN201110440801.6 |
申请日期 |
2011.12.23 |
申请人 |
上海电机学院 |
发明人 |
闫俊英 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海思微知识产权代理事务所(普通合伙) 31237 |
代理人 |
郑玮 |
主权项 |
一种文本过滤系统,至少包括:本体库建立模组,用于根据用户的过滤需求建立本体库;自适应学习模组,通过对一组过滤样本进行训练学习以对该本体库建立模组建立的本体库动态调整,使其逐渐接近于用户的过滤需求;以及文本过滤模组,通过对待过滤文本进行预处理、抽取特征词集及相似度匹配处理后,获得该待过滤文本与本体的相关度,并根据该相关度对该待过滤文本进行过滤。 |
地址 |
200240 上海市闵行区江川路690号 |