发明名称 基于移动代理的部落式大规模网络故障管理办法
摘要 基于移动代理的部落式大规模网络故障管理方法是一种在大规模网络环境中进行分布式的网络故障管理方法。主要用于解决大规模网络的故障管理问题,该方法包括创建部落,部署部落,多移动代理协作进行故障管理,通过利用移动代理的移动性,自治性和智能性进行拓扑发现,从而根据网络的拓扑结构进行部落的划分创建,然后由网络管理站派生分发部落管理代理进行部落的部署,这样用于故障管理的代理通过消息通讯可以在同一部落和不同部落之间进行全局的网络故障管理和部落内部的网络故障管理,利用了移动代理的智能性、移动性和自主性等特点进行网络故障管理,极大地提高了故障管理的精度及效率。
申请公布号 CN100450027C 申请公布日期 2009.01.07
申请号 CN200610038964.0 申请日期 2006.03.21
申请人 南京邮电大学 发明人 王汝传;徐喜春;徐小龙
分类号 H04L12/24(2006.01) 主分类号 H04L12/24(2006.01)
代理机构 南京经纬专利商标代理有限公司 代理人 叶连生
主权项 1.一种基于移动代理的部落式大规模网络故障管理方法,其特征在于该方法包括创建部落,部署部落,多移动代理协作进行故障管理,通过利用移动代理的移动性,自治性和智能性进行拓扑发现,从而根据网络的拓扑结构进行部落的划分创建,然后由网络管理站派生分发部落管理代理进行部落的部署,这样用于故障管理的代理通过消息通讯可以在同一部落和不同部落之间进行全局的网络故障管理和部落内部的网络故障管理,步骤如下:创建部落:收集拓扑信息是创建部落的前提,在网络管理站创建驻留代理和节点发现代理用于网络拓扑信息收集,当子网拓扑结构获得以后,网络管理站根据一定的策略来划分部落,部署部落:给每个部落指定一个子管理站和部署部落管理者代理、数据采集代理和网络监视代理,多移动代理协作进行故障管理:同一部落或不同部落的代理之间通过消息通讯,协商共同进行故障管理,主要包括全局的网络故障管理和部落内部的网络故障管理;所述的创建部落的方法为:1)在网络管理站创建驻留代理和节点发现代理,节点发现代理将网络管理站的地址作为其主地址,并通过创建节点的相关信息更新自身,2)节点发现代理在网络管理站通过访问地址解析协议缓存表进行资源发现,获得一张初始地址表;同时,根据所发现的节点数确定其漫游时间参数,确定在任一节点发现代理能被复制的次数k,这两个参数用来控制网络搜索的深度和广度;3)节点发现代理自我复制多次,使得节点发现代理能被派遣到每个节点处;4)到达每个节点处后,节点发现代理的漫游时间参数开始计时,根据节点发现代理本身携带的创建节点相关信息更新该节点,并根据当前节点更新本身;如果两个来自于同一创建节点的节点发现代理相继到达该节点,则后来的节点发现代理自动销毁;5)如果漫游时间参数到期,则节点发现代理返回创建节点根据在漫游中得到的所有节点信息来更新创建节点信息;如果参数k还未到期,则节点发现代理继续复制足够多次并将其派遣到当前节点所知的每一个节点,通过排除先前已知的节点,访问的范围逐渐减少,直到最后完成拓扑发现任务;6)网络管理站驻留代理负责发送节点发现代理以及收集整理节点返回的拓扑信息以生成子网拓扑结构;当子网拓扑结构获得以后,网络管理站根据一定的策略来划分部落,所有部落通过一个网络管理控制台进行管理;部落的划分采用子网划分的原则,即将不同的子网划分到不同的部落当中,或采用地理区域划分的原则,按不同的地理位置划分相应的部落,由于网络规模的扩大,一个部落又可以被分成若干子部落,就形成了嵌套管理部落,因此划分得到的部落形成一个树形的层次结构,系统将部落视为一种特殊的管理对象进行管理;所述的部署部落为:每个部落指定一个子管理站,由管理站驻留代理变异出部落管理代理,分别发往每个部落的子管理站上,当部落管理代理到达部落子管理站上之后,创建进行故障管理所必需的子代理:数据采集代理和网络监视代理;所述的多移动代理协作进行故障管理为:1)全局的故障管理:网络管理控制台保存所有部落管理者的地址列表,网络管理站保持对部落列表的刷新,用于全局故障管理的移动代理包括管理站代理,陷阱接收代理,信使代理,巡行代理;在网络管理控制台有管理站代理,负责维护整个网管系统的全局管理策略,即发放代理和将子网发来的拓扑信息和故障信息进行分析整理;陷阱接收代理负责接收来自网络中的陷阱报文,并且对其进行分析认证,只有通过认证的陷阱报文才会被接收,若成功接收,对陷阱报文进行过滤和解析,进行故障告警并将解析结果存入故障信息库当中;信使代理充当信使的角色,各种配置信息的传送,阈值及其他性能参数的改变,都通过信使代理来实现;部落管理代理被网络管理控制台创建,当获取网络拓扑信息完毕,便被推送到每个部落,长期驻留在此部落的子管理站上,代替上一级的管理者对部落内的设备进行故障管理;巡行代理在多个部落的管理者之间迁移,实现位置相关的计算,当巡行代理迁移到某一个部落中,便向与它相邻的网段发送icmpecho消息,记录响应时间,并将现在的响应时间与正常的响应时间对比,进行分析之后保存测量结果,巡行代理直接访问该部落管理服务器,就可以从网络对象数据库中得到该部落的拓扑信息,而不必遍历所有的节点;巡行代理返回顶级管理者之后,对所获结果进行综合处理;巡行代理要建立对迁移失败的故障处理机制,即向某部落迁移失败时,能对该失败原因进行分析,并且要绕过故障部落向地址列表中下一节点迁移;查询故障信息的方式有两种:主动信息获取和被动信息获取,主动信息获取:管理站发送查询故障信息请求,子部落管理站发送最近故障信息;被动信息获取:子部落管理站分析域内各节点运行情况,整理后向管理站发送故障管理信息;2)部落内部的网络故障管理部落内部的代理包括部落故障管理代理,数据采集代理和网络监视代理;其中部落故障管理代理是父代理,与后面两种代理是主从关系,数据采集代理与网络监视代理是对等关系;部落管理代理创建数据采集代理和网络监视代理,把数据采集代理释放到部落的每一个节点上去,成为部落里的“居民”,这些居民驻留在本地进行监测,规定该数据采集代理每隔一定时间间隔,把收集到的数据统计分析,在发现异常时,向部落子管理站报警,并且每隔一段时间向子管理站发送“alive”消息,报告当前节点的活动情况,子管理站代理可以定义超时的时限,如果某个节点在时限允许时间内没有发送消息,则认为该节点出现连接故障,子管理站代理向该节点进行连通性测试,根据测试的结果来对被管节点做出判断;网络监视代理负责本部落的成员更新,记录新加入或者是刚离开部落的节点,保存到子管理站的部落成员列表里面,等待提交给网络搜索代理,子管理站代理每隔一段时间将故障报告提交给顶级管理站代理。
地址 210003江苏省南京市新模范马路66号