知网查重连续多少字算重复?网传知网查重是连续13字重复,事实上该系统并非依据连续多少字算重复,而是采用了相似度的模糊算法比对。由于系统可以识别去除本人已发表文献内容,所以一般不会出现自己和自己重复。那么,知网查重连续多少字算重复?
一、知网查重连续多少字算重复
虽然知网查重系统的数据库比较全面,但是并不意味着知网查重比对数据库是无所不包的。复制了别人的一句或者一段话,没测出来,也属于正常现象。另外,中国知网从来没说过“连续13个字一样就识别为重复”这种算法,而且,类似这种非常具体的重复率算法是不可能公开的。其实,知网查重系统是按照“相似度”检测方式进行模糊比对,而非“循环比对”这种简单粗暴的原始重复率算法。
二、知网查重自己和自己重复
在2019年10月末更新的最新版知网查重报告单中,第一比例为“去除本人已发表文献复制比”,这个结果是去除掉论文作者本人已经发表过,且被知网查重系统收录论文的内容。也就是不与自己的论文重复。所以,题主这种情况是不算自己内容的。需要注意的是,在知网查重入口提交论文的时候,要正确填写自己的名字才能得到正确的“去除本人已发表文献复制比”这个结果。总之,一般会和自己查重重复的。
三、知网查重一次多少字
知网查重系统的不同版本,可以检测的字数是不同的,通常来说:硕博版本:30万字符内;本科版本:8万字符内;期刊版本:1.4万字符内。以上,均为“含空格”内的字符数。超字符则为检测失败。就查重算法而言,并没有明确提出多少字雷同就定为“重复”。检测算法是“黑匣子”,并不是简单的“多少字一样”就定义重复。如果字数相差太多的话,并且已无内容可删,那建议选择分拆查重的方法。
总结:知网查重连续多少字算重复?网上一般说是13个字算重复,但其实系统并非按连续13字算重复的,它采用的是语义级别检测算法。知网论文检测版本有多个,每个版本字符数上限是不同。最后,自己和自己不会重复。以上是“知网查重连续多少字算重复”全部内容。