发明名称 一种基于索引文件的社会关系网络创建与检索系统及方法
摘要 一种基于索引文件的社会关系网络创建与检索系统,包括:关系计算引擎、关系存储系统及关系检索引擎;其中关系计算引擎,对输入的社会关系数据进行计算处理,分析出社会人员之间的两两原始关系数据;将关系计算引擎计算出的原始关系数据,按关系点、关系、属性、索引分类,以文件方式进行磁盘存储;关系检索引擎,对关系存储系统中的关系数据通过RSQL进行查询与过滤,返回结果给检索客户端。本发明能够在海量的社会关系数据中高效、快速地完成对人员的多层关系过滤与挖掘。
申请公布号 CN103886011B 申请公布日期 2017.04.12
申请号 CN201310751919.X 申请日期 2013.12.30
申请人 讯飞智元信息科技有限公司 发明人 冯祥;邱志超;吴波;黄忠伟;刘磊;刘磊;徐振兴;孙权;高明;汤东梅
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京科迪生专利代理有限责任公司 11251 代理人 杨学明;成金玉
主权项 一种基于索引文件的社会关系网络创建与检索系统,其特征在于包括:关系计算引擎、关系存储系统及关系检索引擎;其中:关系计算引擎,对输入的社会关系数据进行计算处理,分析出社会人员之间的两两原始关系数据,具体实现为:(1)按抽取时间戳,获取原始待处理数据,将数据按指定字段排序;(2)取第一条数据放入计算数据缓冲池,然后取第二条数据按关系规则与放入池内的数据进行比较,若符合关系规则的,生成关系数据,将关系数据存入关系型数据库;(3)依据所述关系规则,清除计算数据缓冲池中的一定范围的缓冲数据;(4)更新计算时间戳,循环执行步骤(1)‑(3),得到原始关系数据送至关系存储系统;关系存储系统,将关系计算引擎计算出的原始关系数据,按关系点、关系、属性、索引分类,以文件方式进行磁盘存储;关系检索引擎,对关系存储系统中的关系数据通过RSQL进行查询与过滤,返回结果给检索客户端,包括有以下步骤:A.通过对外接口,获取检索客户端提交的RSQL语句;B.对RSQL语句进行语法与词法分析,并从中提取开始结点编号;C.根据B中结点编号,检索关系存储系统,获取结点数据;D.从C中的结点数据中,获取该结点最后创建的关系编号;E.根据D中的关系编号,检索关系存储系统,获取关系数据;F.从E中的关系数据提取关系属性,与RSQL输入的关系参数进行比对,符合条件的,将关系结束结点作为查询结果加入结果列表,并返回关系数据;G.从F中返回的关系数据中,获取当前关系开始结点和结束结点的前一条关系编号和后一条关系编号,重复E‑F步骤;H.将检索过程中的关系和结点加入系统缓存,下次检索时直接从缓存读取数据;I.返回结果数据;所述RSQL是类SQL的关系检索语言,RSQL结构描述:Restful对外接口层用于外界将Rsql传递给检索引擎;Rsql语法解析器对外部传入的Rsql语句进行语法解析,不符合语法规范的直接抛出异 常;RSQL词法解析器对外部传入的RSQL语句进行词法解析,不符合词法规范的直接抛出异常;RSQL缓冲区检索引擎会将所有解析过的RSQL语句经过hash算法后,放入到缓冲区,当执行RSQL时,检索引擎直接从缓冲区获取对应的相关参数以提高解析效率;结果内容缓存检索引擎对所检索人员和关系使用LRU算法进行缓存;索引文件访问层检索引擎访问索引文件的适配层;RSQL语法结构如下:START:关系检索的开始,索引关系的开始结点;MATCH:用于和START绑定,定义一个查询匹配模型;WHERE:用于查询条件过滤;RETURN:用于返回结果集;CREATE:用于创建人员结点与人与人之间的关系;DELETE:用于删除人员或者关系;SET:用于设置结点或者关系的属性;FOREACH:对结点或者关系进行循环迭代操作;WITH:将查询结果切分成几个不同的部分。
地址 230088 安徽省合肥市高新区望江西路666号讯飞大厦8-10层