发明名称 | 一种基于KNN算法的稿件翻译优化方法 | ||
摘要 | 一种基于KNN算法的稿件翻译优化方法,首先将比较大的稿件进行拆分,提取待译稿件中的关键词将其进行分类,通过算法匹配K值,得到最优分配结果。本发明主要在于对训练用稿件和待分类邮件数据进行预处理;将预处理后的训练用稿件和待分类邮件数据分别进行文本表示;对文本表示的训练用稿件和待分类邮件数据分别利用遗传算法进行特征提取;对提取的训练用稿件特征进行分类训练,使用经过优化样本集的KNN算法进行训练分类,构造文本分类器;将文本分类器作用于特征提取后的待分类稿件,得到待分类稿件的分类结果。本发明能够更好的应用于稿件文本信息挖掘系统。 | ||
申请公布号 | CN105005792A | 申请公布日期 | 2015.10.28 |
申请号 | CN201510406887.9 | 申请日期 | 2015.07.13 |
申请人 | 河南科技大学 | 发明人 | 郑林涛;史恒亮;俞卫华;董永生;范庆辉 |
分类号 | G06K9/62(2006.01)I | 主分类号 | G06K9/62(2006.01)I |
代理机构 | 洛阳公信知识产权事务所(普通合伙) 41120 | 代理人 | 罗民健 |
主权项 | 一种基于KNN算法的稿件翻译优化方法,其特征在于,如下步骤:对训练用稿件和待分类邮件数据进行文本预处理;将预处理后的训练用稿件和待分类邮件数据分别进行文本表示;对文本表示的训练用稿件和待分类邮件数据分别利用遗传算法进行特征提取;对提取的训练用稿件特征进行分类训练,使用经过优化样本集的KNN算法进行训练分类,构造文本分类器;将文本分类器作用于特征提取后的待分类稿件,得到待分类稿件的分类结果。 | ||
地址 | 471000 河南省洛阳市涧西区西苑路48号 |