发明名称 一种内容规则库管理系统及其编码方法
摘要 本发明涉及一种内容规则库字典编码方法,将内容规则库的字典设定为20位的字典编码体系。本发明还公开一种内容规则库管理系统,包括:内容规则库可视化管理模块、URL数据预处理分类模块、重点应用APP/网站跟踪模块、网页复原模块、网页爬虫模块、网页内容分析模块、内容规则库。本发明的优点体现在:能够对用户访问移动互联网的行为日志进行大规模全视角的分析和翻译,进而形成移动互联网用户的全息知识图谱,为后续的各种内容分析应用进行支撑。
申请公布号 CN106599160A 申请公布日期 2017.04.26
申请号 CN201611121969.X 申请日期 2016.12.08
申请人 网帅科技(北京)有限公司 发明人 胡庆勇
分类号 G06F17/30(2006.01)I;G06Q30/02(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京世誉鑫诚专利代理事务所(普通合伙) 11368 代理人 郭官厚
主权项 一种内容规则库字典编码方法,其特征在于,将内容规则库的字典设定为20位的字典编码体系,支持5级标签体系,一级分类为领域,占3位,二级分类为行业,占4位,三级分类为应用,占5位,四级分类为栏目,占4位,五级分类为搜索内容、元数据或提取内容类型,占4位;四级分类的第一位为标识符,只能为0或1,其中0代表栏目,1代表行为;五级分类的第一位为0代表搜索,1代表元数据,2代表提取,如果是元数据类型,编码为13开始,3代表ID,如果是提取类型,则编码第二位为0代表文本,1代表浮点,2代表日期,3代表ID;20位为00000000000000000000代表未知的应用。
地址 100000 北京市朝阳区安翔北里甲11号院1号楼7层701-A室