发明名称 一种文本分类的方法
摘要 本发明公开了一种文本分类的方法,其具体实现过程为:首先获取网络中的文本;对文本进行预处理,提取特征词,对网络中的文本进行分词,然后去除停用词;计算出网络文本中各特征词的权重,并将文本用向量模型进行表示。该文本分类的方法与现有技术相比,具有很强的适应性,能满足大部分不同文本的分类要求,有利于文本分类,实用性强。
申请公布号 CN104866573A 申请公布日期 2015.08.26
申请号 CN201510267849.X 申请日期 2015.05.22
申请人 齐鲁工业大学 发明人 耿玉水;杨涛;杨振宇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 济南信达专利事务所有限公司 37100 代理人 孟峣
主权项 一种文本分类的方法,其特征在于,其具体实现过程为,首先获取网络中的文本;对文本进行预处理,提取特征词,对网络中的文本进行分词,然后去除停用词;计算出网络文本中各特征词的权重,并将文本用向量模型进行表示。
地址 250353 山东省济南市西部新城大学科技园