发明名称 构建乘客社交网络的方法
摘要 本发明涉及一种构建乘客社交网络的方法。本发明方法包括:A、建立统一的乘客信息档案;B、建立乘客事件信息记录;C、通过Hive加载事件数据到hdfs事件记录缓冲区并建立表结构;D、清洗数据;E、将乘客的档案信息转化为节点数据;F、计算两个不同乘客节点间的有向边;G、选择关系强度属性计算算法;H、计算关系类型和可能性;I提供乘客社交关系网络的可视化展示。本发明方法可以通过增加事件和计算权重指标的方式扩展,以适应航空的业务变化,相比非分布式关系型数据库应用的方式,速度提升超过百倍。
申请公布号 CN104317789A 申请公布日期 2015.01.28
申请号 CN201410167418.1 申请日期 2014.04.24
申请人 科技谷(厦门)信息技术有限公司 发明人 陈思恩;夏木;廖雅哲
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州市红荔专利代理有限公司 44214 代理人 张文
主权项 构建乘客社交网络的方法,其特征在于,包括下列步骤:步骤A、建立统一的乘客信息档案a.1、根据航空公司的乘客乘机记录,以乘客的有效证件号为唯一识别标示,建立系统唯一的乘客信息档案,存储在HBase的乘客档案表中;每一个乘客档案,将是最终形成的乘客社交网络的一个节点;a.2、关联航空公司的其他系统的乘客信息,根据有效证件或其他可识别字段,识别其他系统的乘客,并统一形成单一客户视图,单一客户视图中的乘客有一个唯一的ID来识别客户;步骤B、建立乘客事件信息记录b.1、在HBase上,建立乘客事件信息的数据结构;b.2、建立乘客事件的数据字典;b.3、通过Hive建立事件信息表结构,和HBase的数据结构建立映射关系;步骤C、通过Hive加载事件数据到hdfs事件记录缓冲区并建立表结构,事件数据包括:①、乘客PNR记录中同一航班,同PNR乘客产生的同行关系;②、会员乘客的里程积分受让数据;③、乘客的公司登记记录;④、其他相关乘客事件;步骤D、清洗数据,并将缓冲区中的事件记录,结合基础字典中的信息,加载为完整的事件数据到步骤B所建立的HBase事件记录表中;步骤E、将乘客的档案信息转化为节点数据,存储在基于图的分布式数据库中,每一个乘客为一个节点,节点上存储的属性包括:乘客的身份信息、乘客的人口统计属性、乘客的出行信息、乘客的消费信息、乘客的会员信息、乘客的企业信息、乘客的网络社交媒体信息(可选);步骤F、通过分布式运算,计算两个不同乘客节点间的有向边:乘客A和乘客B之间如果存在事件会产生关系,且还没有已有的边,则在Titan中新建两条不同的有向边A‑>B和B‑>A,在边的属性上存储此关系;如果已有边,则将此事件关系存储到边的属性上;步骤G、选择关系强度属性计算算法:在系统初始阶段,配置边的关系强度算法,在系统运行时,系统采用已配置的关系强度属性执行计算;计算通过作业执行,其参数为事件的类型、事件的算法权重和时间发生的次数等;步骤H、计算关系类型和可能性:关系类型包括:同事关系、家庭关系、好友关系等,可能性由事件的类型、事件发生的时间、事件的参数、关系强度和权重根据特定的规则算法产生;步骤I、提供乘客社交关系网络的可视化展示。
地址 361009 福建省厦门市思明区软件园二期望海路57号801-A