发明名称 |
文件扫描系统 |
摘要 |
本发明实施例公开了一种文件扫描系统,以解决文件扫描效率低的问题。所述系统包括客户端和服务器端,其中,客户端包括文件上传模块;服务器端包括存储服务器、文件下载服务器和扫描服务器,所述存储服务器包括数据库:文件下载模块;所述扫描服务器包括文件扫描装置,所述文件扫描装置包括:概率计算模块;排序模块;抽取模块,适于获取扫描文件的个数K,从排序后的待扫描样本文件中抽取可疑概率高的K个待扫描样本文件,K为正整数;扫描模块,适于对所述K个待扫描样本文件进行扫描,鉴别出其中的可疑样本文件。本发明提高了扫描效率,并且能够尽可能多地鉴别出可疑样本文件,提高扫描样本文件的准确性。 |
申请公布号 |
CN102970283B |
申请公布日期 |
2015.08.12 |
申请号 |
CN201210428845.1 |
申请日期 |
2012.10.31 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
于春功;贺超 |
分类号 |
H04L29/06(2006.01)I |
主分类号 |
H04L29/06(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
苏培华 |
主权项 |
一种文件扫描系统,包括:客户端和服务器端,其中,客户端包括:文件上传模块,适于将样本文件上传至存储服务器中;服务器端包括:存储服务器、文件下载服务器和扫描服务器,所述存储服务器包括:数据库,适于存储所述文件上传模块上传的样本文件;所述文件下载服务器包括:文件下载模块,适于从所述存储服务器的数据库中下载样本文件并传输至扫描服务器中;所述扫描服务器包括文件扫描装置,所述文件扫描装置包括:概率计算模块,适于针对待扫描样本文件,分别计算每个待扫描样本文件被鉴别为可疑的概率;所述概率计算模块包括:时间点获取子模块,适于针对每个待扫描样本文件,获取该待扫描样本文件对应的本次扫描的时间点n<sub>2</sub>以及上次扫描的时间点n<sub>1</sub>;概率计算子模块,适于计算从时间点n<sub>1</sub>开始到时间点n<sub>2</sub>为止,所述待扫描样本文件在本次扫描中被鉴别为可疑的概率Pr(N≥n<sub>1</sub>,N≤n<sub>2</sub>│α,β)=Pr(N≥n<sub>1</sub>│α,β)‑Pr(N≥n<sub>2</sub>+1│α,β),其中,参数α和β为通过对待扫描样本文件数据进行最大似然估计得到的参数;排序模块,适于对所述待扫描样本文件按照其被鉴别为可疑的概率进行排序;抽取模块,适于获取扫描文件的个数K,从排序后的待扫描样本文件中抽取可疑概率高的K个待扫描样本文件,K为正整数;扫描模块,适于对所述K个待扫描样本文件进行扫描,鉴别出其中的可疑样本文件。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |