发明名称 |
一种自动检测学术不端文献的方法及系统 |
摘要 |
本发明公开了一种自动检测学术不端文献的方法及系统,所述方法将待检测文献的层级内容及文献内表格数据创建特征;对所存有的文献层级内容及文献内的表格数据创建特征;将待检测文献的层级内容特征和待检测文献内的表格数据特征与所存有文献的层级内容特征及所存有文献内的表格特征进行匹配;判断待检测文献中是否含有学术不端内容、不端表格数据及不端内容的类型。所述系统包括待检测文献特征区、待检测文献比对资源区、分层内容特征匹配区及不端学术文献及类型判定区。本发明通过分层多阶特征结构,不仅可以对超长文献进行快速检测,而且,也满足了文献最小特征粒度短句的检测,提高了检准率和检全率;而且该发明还支持文献内表格数据特征的创建及匹配全部文献的一次性匹配。 |
申请公布号 |
CN101833579A |
申请公布日期 |
2010.09.15 |
申请号 |
CN201010168294.0 |
申请日期 |
2010.05.11 |
申请人 |
同方知网(北京)技术有限公司 |
发明人 |
张振海;孙雄勇 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京捷诚信通专利事务所 11221 |
代理人 |
魏殿绅 |
主权项 |
一种自动检测学术不端文献的方法,其特征在于,待检测文献特征与所存全部文献特征同时进行匹配,所述方法具体包括:将待检测文献的层级内容及文献内表格数据创建特征;对所存有的文献层级内容及文献内的表格数据创建特征;将待检测文献的层级内容特征和待检测文献内的表格数据特征与所存有文献的层级内容特征及所存有文献内的表格特征进行匹配;判断待检测文献中是否含有学术不端内容、不端表格数据及不端内容的类型。 |
地址 |
100084 北京市海淀区清华园清华大学36区华业大厦B1410、1412、1414室 |