基于Logistic回归的中文垃圾邮件过滤方法,申请号CN200810059602.9-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	基于Logistic回归的中文垃圾邮件过滤方法
摘要	本发明公开了一种基于Logistic回归的中文垃圾邮件过滤方法。其步骤如下：1)对邮件进行解析，提取邮件标题、邮件主体及附件相关信息；2)对提取的文本信息内容进行分词；3)统计邮件中词条的词频，利用TF－IDF公式计算词的权重，将邮件表示成加权的特征向量；4)利用LIBLINEAR工具包对邮件样本进行训练得到Logistic回归模型；5)利用Logistic回归模型对新的邮件进行分类，得到邮件是否为垃圾邮件的概率值。本发明利用了Logistic回归模型具有模型简单、参数数量少，以及在样本数目和特征数目都很巨大的数据集中具有分类准确度高的优点，通过维数约简和改进的特征值计算方法，提高了垃圾邮件过滤的准确率和效率，同时，还有效解决了垃圾邮件过滤中所面临的模型训练参数选择问题。
申请公布号	CN101227435A	申请公布日期	2008.07.23
申请号	CN200810059602.9	申请日期	2008.01.28
申请人	浙江大学	发明人	徐从富;王庆幸;彭鹏
分类号	H04L12/58(2006.01);H04L29/06(2006.01);G06F17/30(2006.01);G06Q10/00(2006.01)	主分类号	H04L12/58(2006.01)
代理机构	杭州求是专利事务所有限公司	代理人	张法高
主权项	1.一种基于Logistic回归的中文垃圾邮件过滤方法，包括如下步骤：1)利用JavaMail和HTMLParser的应用程序接口对邮件进行解析，提取邮件标题、邮件文本、邮件字符集、邮件附件标题的文本信息；2)对提取的文本信息进行分词；3)统计文本信息中的词条的词频，利用TF-IDF公式计算词的权重，将邮件文本信息表示成加权特征向量，重复步骤1)～步骤3)得到加权特征向量集；4)利用LIBLINEAR工具包对邮件样本的加权特征向量集进行训练得到Logistic回归模型；5)利用得到的Logistic回归模型对邮件进行分类，得到邮件是否为垃圾邮件的概率值。
地址	310027浙江省杭州市浙大路38号

您可能感兴趣的专利

LIGHT EMITTING DIODE DISPLAY FOR DISPLAY BACK LIGHT UNIT USING MATRIALS FOR IMPROVING COLOR REPRODUCTION RANGE

A BUILT-IN AIR CURTAIN CLEANER OF SINK

AN AIR CONDITIONING SYSTEM

OPTICAL SYSTEM OF MEDICAL MICROSCOPE

CLOTHES FOR PLAYING MUSIC

NECK STRAP FOR A SAXOPHONE

MOBILE TERMINAL AND METHOD FOR CONTROLLING THE SAME

LOAD REGULATING APPARATUS FOR MEASURING NOISE OF BLOWER

ORAL GEL COMPRISING ZINC - AMINO ACID COMPLEX

VEHICLE MOVEMENT DYNAMICS CONTROL METHOD

PACKET COLLISIONS AND IMPULSIVE NOISE DETECTION

MULTILAYER PRINTED CIRCUIT BOARD AND MANUFACTURING METHOD THEREOF

SYSTEM AND METHODS FOR REDUCING GNSS RECEIVER POWER USAGE BY LEVERAGING SIGNALS OF OPPORTUNITY TO PREDICT GNSS AVAILABILITY

DIGITAL MICROPHONE WITH FREQUENCY BOOSTER

ANTIBODIES TO S. AUREUS SURFACE DETERMINANTS

MULTIPLE PUMP ARRANGEMENT

CODING AND DECODING A TRANSIENT FRAME

CYCLIC A/D CONVERTER IMAGE SENSOR DEVICE AND METHOD FOR GENERATING DIGITAL SIGNAL FROM ANALOG SIGNAL

PROCESS FOR PRODUCING SEMICONDUCTOR PORCELAIN COMPOSITION AND HEATER EMPLOYING SEMICONDUCTOR PORCELAIN COMPOSITION

DEVICE FOR STRIPPING IMPURITIES OF A BELT WEBBING FROM CONVEYOR BELT SYSTEMS