发明名称 |
一种论文查重的方法 |
摘要 |
本发明公开了一种论文查重的方法。该方法通过对比待查文章与文本库中文章的分句指纹对比获得重复分句和重复分句在原文中的位置,然后判断重复分句在原文中的间隔是否小于M,假如重复分句在原文中的间隔小于M,则待查文章在文本库中内容有重复。本发明的论文查重的方法判重速率和响应速度快,通过精确到分句的对比可以从多个原始论文中多处摘抄中找出摘抄的原始论文。 |
申请公布号 |
CN104050299A |
申请公布日期 |
2014.09.17 |
申请号 |
CN201410319183.3 |
申请日期 |
2014.07.07 |
申请人 |
江苏金智教育信息技术有限公司 |
发明人 |
严敏;林文荟;杨华;刘志程 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
江苏银创律师事务所 32242 |
代理人 |
孙计良 |
主权项 |
一种论文查重的方法,其特征在于,包括以下步骤:S1:对文本库中的原文进行分句,并计算原文每个分句的指纹;S2:对待查文章进行分句,并计算待查文章每个分句的指纹;S3:通过待查文章各个分句的指纹与原文各个分句的指纹的对比,确定原文分句指纹与待查文章分句指纹相同的分句和分句的位置,得到重复分句和重复分句在原文中的位置;S4:根据重复分句在原文中的位置,判断重复分句在原文中的间隔是否小于M;假如重复分句在原文中的间隔小于M,则待查文章与原文的内容有重复;其中M为预先设定的常量。 |
地址 |
211100 江苏省南京市江宁经济开发区将军大道100号 |