发明名称 | 用于搜索引擎的色情用户查询识别方法及设备 | ||
摘要 | 本发明提供一种用于搜索引擎的色情用户查询识别方法,该方法包括基于已标注的用户查询集合,训练用于识别色情用户查询的分类模型,以及利用该训练好的分类模型判断待识别的用户查询是否为色请用户查询。其中,用于训练所述分类模型的用户查询特征包括用户查询的命名实体和实体上下文主题特征以及用户属于色情查询和非色情查询的概率。该方法不需要基于搜索引擎的查询结果来识别色情查询,而是通过利用用户查询中包含的命名实体特征和语言模型特征实现了快速、有效的色情查询识别。 | ||
申请公布号 | CN103177126A | 申请公布日期 | 2013.06.26 |
申请号 | CN201310134933.5 | 申请日期 | 2013.04.18 |
申请人 | 中国科学院计算技术研究所 | 发明人 | 程学旗;熊锦华;公帅;张成;廖华明;王元卓 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京泛华伟业知识产权代理有限公司 11280 | 代理人 | 王勇 |
主权项 | 一种用于搜索引擎的色情用户查询识别方法,该方法包括:步骤1)利用训练好的用于识别色情用户查询的分类模型判断待识别的用户查询是否为色请用户查询;其中,用于训练所述分类模型的用户查询特征包括用户查询的命名实体和实体上下文主题特征。 | ||
地址 | 100190 北京市海淀区中关村科学院南路6号 |