发明名称 |
时序数据的存储和查询方法、系统及装置 |
摘要 |
本发明公开了一种时序数据的存储方法,包括以下步骤:收集原始流信息;以第一时间粒度对所述原始流信息进行第一次汇聚并将第一次汇聚后的流信息存储为第一流信息;以及以第二时间粒度对所述第一流信息进行第二次汇聚并将第二次汇聚后的流信息存储为第二流信息,其中,所述第二时间粒度大于所述第一时间粒度。本发明还公开了一种时序数据的存储装置、时序数据的查询方法及系统。本发明可以实现对网络流量的精确统计分析和查询,从而为网络规划、网络监测等应用提供实时、可靠、准确的数据依据,从而提高运维响应的速度。 |
申请公布号 |
CN102495851B |
申请公布日期 |
2014.11.05 |
申请号 |
CN201110367018.1 |
申请日期 |
2011.11.17 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
熊亚军;彭炼钢;翦浩;侯利曼 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京清亦华知识产权代理事务所(普通合伙) 11201 |
代理人 |
张大威 |
主权项 |
一种时序数据的存储方法,其特征在于,包括以下步骤:收集原始流信息,其中,所述原始流信息包括源地址、目的地址、流入交换机端口索引、流出交换机端口索引、持续时间和开始时间;以第一时间粒度对所述原始流信息进行第一次汇聚并将第一次汇聚后的流信息存储为第一流信息;以第二时间粒度对所述第一流信息进行第二次汇聚并将第二次汇聚后的流信息存储为第二流信息,其中,所述第二时间粒度大于所述第一时间粒度;其中,所述以第一时间粒度对所述原始流信息进行第一次汇聚并将第一次汇聚后的流信息存储为第一流信息进一步包括:对所述原始流信息中在第一时间粒度内的所有流单元的四元组信息进行统计,其中,所述四元组信息包括所述源地址、目的地址、流入交换机端口索引和流出交换机端口索引;以及将统计的四元组信息进行第一次汇聚以生成第一流信息,其中,所述第一流信息包括所述四元组信息和所述四元组信息对应的第一开始时间和第一持续时间;所述以第二时间粒度对所述第一流信息进行第二次汇聚进一步包括:对所述第一流信息中在第二时间粒度内的所有第一流信息的四元组信息进行统计;以及将统计的四元组信息进行第二次汇聚以生成第二流信息,其中,所述第二流信息包括所述四元组信息和所述四元组信息对应的第二开始时间和第二持续时间,所述第二开始时间和所述第二持续时间为根据所述四元组信息对所述第一开始时间和第一持续时间汇聚得到,且所述第二持续时间小于所述第二时间粒度。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦三层 |