发明名称 基于BitTorrent的主动式特定信息传播监测方法
摘要 本发明公开了一种基于BitTorrent的主动式特定信息传播监测方法,通过“元信息”收集器,从系统中读取“元信息”,对“元信息”收集器获取的“元信息”进行分析,通过向伪客户端主动发送模拟数据包来获取受众信息,通过DHT网络访问过程模拟,提取Peers节点列表并进行处理。由于采用了伪客户端主动发送模拟数据包来获取受众信息,能够尽可能多的获得受众信息,与现有技术相比较,本发明通过搜索和获取互联网中BitTorrent“元信息”,伪客户端获取到参与特定信息传播的受众信息,形成特定信息传播受众数据库,为网络安全监管部门提供了受众信息监测与取证手段,同时为网络安全态势宏观分析和预警预报提供了基础数据和决策依据。
申请公布号 CN101567811B 申请公布日期 2011.09.14
申请号 CN200910022722.6 申请日期 2009.05.26
申请人 西北工业大学 发明人 蔡皖东;丁军平;蒋元成
分类号 H04L12/26(2006.01)I;H04L29/08(2006.01)I;H04L12/58(2006.01)I 主分类号 H04L12/26(2006.01)I
代理机构 西北工业大学专利中心 61204 代理人 黄毅新
主权项 一种基于BitTorrent的主动式特定信息传播监测方法,其特征在于包括下述步骤:(a)通过“元信息”收集器,从系统中读取“元信息”在网页中的匹配关键字,再从系统设置信息中读取搜索起始地址,将该地址所指定的网页信息读取到本地并使用文本方式打开,对文本中的内容根据已读取的“元信息”匹配关键字进行单词匹配,将该匹配位置的后续信息作为元信息的链接地址进行下载;系统对当前网页信息进行匹配搜索,发现有链接标签:<a></a>,将链接标签中的链接地址作为后续需要处理的地址信息存放到未处理队列中,当前网页信息处理完成后,从未处理队列中读取出该队列的第一个地址重复上述的匹配处理操作,直到未处理队列中的链接地址为空为止;(b)对“元信息”收集器获取的“元信息”进行分析,根据BitTorrent协议中的规范内容,使用BitTorrent协议中的报文关键字对“元信息”中的信息进行匹配,获取文件名列表、文件大小、文件Hash值、DHT网络入口地址和端口号信息;(c)采用伪客户端方法来连接DHT网络,获取共享特定文件的Peers节点列表信息,当BT伪客户端启动时,选中已有的“元信息”进行访问过程模拟,先读取“元信息”中的DHT网络入口节点列表的地址和端口号信息,再根据BitTorrent协议,按照真实的网络链接请求信息通过UDP数据包向DHT网络入口节点发起连接请求,入口节点接收到当前连接请求后,根据DHT网络协议在DHT网络中查询可提供下载“元信息”对应文件的节点信息或者进行下一步查找操作的节点列表信息,节点列表信息使用UDP数据包返回给伪客户端;(d)BitTorrent伪客户端获取到DHT网络的返回信息后,根据BitTorrent协议对返回数据包进行分析,得到当前“元信息”对应文件下载的Peer节点列表信息,这些节点列表信息在数据包中按协议规范进行组织;当仿真客户端收到DHT网络返回信息数据包后,将数据包按照协议规范进行解析,得到节点列表信息,并对解析后可用的节点信息进行链接,获取该节点的状态信息和实际传输能力;当伪客户端获得节点列表后,根据BitTorrent协议规范,对于每个节点,使用该节点的IP地址和端口号生成仿真握手数据包,并向该节点发出握手请求,以建立用于数据传输的TCP链接;与节点之间建立TCP链接后,伪客户端模拟BitTorrent协议中的数据请求数据包,并向该节点发送,同时接收该节点的返回数据包,通过固定时间段的发送与接收,对接收到的数据量进行统计、取时间平均值,得出该节点的实际传输速率和状态信息,对于收集的“元信息”和受众信息数据中冗余和重复信息进行过滤:重复的数据只保留一条,以标准的数据格式存入受众数据库。
地址 710072 陕西省西安市友谊西路127号