发明名称 中文数位反抄袭侦测比对系统与方法
摘要 这是一种中文数位抄袭侦测比对系统与方法,本系统包含文章存取、文章拆解、搜寻比对、及评估报告等机制,运作时由中心伺服器、运算主机群和搜寻引擎共同完成。首先使用者将比对文章经由文章存取机制上传至中心伺服器以进行资料存取,中心伺服器即会将各使用者上传之比对文章分派给运算主机,该运算主机即透过系统程式所设定之文章拆解机制,将比对文章依照使用者设定、透过拆解字句演算法进行拆解而成为句子群,并将所获之句群逐句上传至搜寻引擎,透过搜寻比对机制进行搜寻,即可获得与拆解文章字句雷同的网页或文章并下载回传至运算主机,以进行比对文章与雷同网页或文章之全文比对,全文比对结果会将比对文章雷同字句与雷同之网页或文章标示并陈,并注记网页之来源,此一比对结果将会回传至中心伺服器,因此使用者即可观看比对结果。
申请公布号 TWI444838 申请公布日期 2014.07.11
申请号 TW100136908 申请日期 2011.10.12
申请人 杨纯青 高雄市三民区同盟二路49号11楼 发明人 杨纯青
分类号 G06F17/27;G06F17/30 主分类号 G06F17/27
代理机构 代理人 邱南英 台南市东区崇学路210号9楼3室
主权项 一种中文数位反抄袭侦测比对方法,包括下列步骤:第一步骤,使用者将比对文章上传至中心伺服器以进行资料存取;第二步骤,将前述比对文章以拆解字句演算法进行比对文章之拆解,前述拆解字句演算法系依照使用者所设定的拆解字数进行字句拆解,再将各字句删除标点符号,并以一搜寻比对字数进行字句的字数筛选,而得到拆解文章;第三步骤,利用搜寻引擎将前述拆解文章之各拆解字句一句一句上传搜寻后,即可获得多笔与拆解文章部分雷同的网页或文章;第四步骤,将前述搜寻到之雷同的网页或文章下载;第五步骤,将比对文章与所下载之雷同的网页或文章进行全文比对,并以比对文章与雷同的网页或文章之相似的部分进行标记及分析,即可获得比对结果,该比对结果可供审查者进行人工查验,并判断比对文章是否为抄袭文章。
地址 高雄市三民区同盟二路49号11楼
您可能感兴趣的专利