中国知网的查重算法是怎样的?就它算法而言其实没有公开,其采用的是模糊算法,以及连续13字符算重复率的规律。在实际检测中,系统会将论文进行分段检测方式,之后依次计算出每部分重复率,然后计算出论文总的重复率!那么,中国知网的查重算法是怎样的?
一、中国知网的查重算法
知网查重的算法,其实并没有公开。但是从大的方面来说,是按照一句基于“句群语义”的模糊比对方式,按照整体来解析的。并不像某些人所说的”13个字连续一样“就算为重复。所以,并不是按照以某个最小语句为单位,进行”循环对比“的传统方式计算重复。从“权威对照”这个报告单分析,我们可以看到,往往左右两组内容,并不完全一致,但是系统就判定为重复,可以验证上面的模糊对比算法是对的。
二、知网查重重复率怎么算
全文的重复率是每一章节每段重复字数除以全文总数。然而,我们可以从知网论文查重报告中看到,论文内容中有一部分是显示去除引用后的重复率。但是这部分的重复率又不同于全文的重复率。此部分的重复率是删除全文引用内容后的重复率。这也体现了知网论文查重的智能化。是按照章节进行检测的,每个章节都有对应的重复率,章节的重复率等于章节重复字数/章节总字数*100%。
三、中国知网怎么查重论文
搜索或直接打开知网查重网站,选择针对自己论文的知网查重系统,如本科生选择知网PMLC系统,硕士博士选择VIP5.3系统,你可针对自己的文章类型选择不同的查重系统,这样查重出来更准确。点击“立即检测”,进入知网查重提交页面,输入论文标题,作者,选择待测论文,点击提交论文。提交论文后,支付查重费用。支付查重费用后,进入报告下载页面,等待检测完成后,可查询报告并下载到电脑中。
综上所述:中国知网的查重算法从未公开过,网传连续13字符算重复率是总结的规律,它并非按最小句子为单位,而是采用了语义模糊检测规则。在实际检测过程中,总重复率等于每个分段章节的重复率之和。上述是“中国知网的查重算法是怎样的”全部内容。