将字扩充算进知网查重吗?网传知网查重一般是以连续13个字为标准,但实际上中国知网并未公开此算法,而是模糊语义算法如果过于简单的扩充依然会查重的。此外,知网查重计算的是字符数,故报告中的总字数会多出不少。那么,将字扩充算进知网查重吗?
一、将字扩充算进知网查重吗
虽然知网查重系统的数据库比较全面,但是并不意味着知网查重比对数据库是无所不包的。复制了别人的一句或者一段话,没测出来,也属于正常现象。另外,中国知网从来没说过“连续13个字一样就识别为重复”这种算法,而且,类似这种非常具体的重复率算法是不可能公开的。其实,知网查重系统是按照“相似度”检测方式进行模糊比对,而非“循环比对”这种简单粗暴的原始重复率算法,因此将字扩充不能过于简单否则会查重。
二、知网查重一般以几个字为标准
网传知网论文检测的条件是连续13个字相似或抄袭都会被红字标注,但是必须满足下面的前提条件:即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%。知网论文查重的确是以“连续13个字与别的文章重复”做为判断依据的,跟之前网上一些作者说的情况一致。该原则适用于知网论文相似性检测软件的多个子系统,包括PMLC查重系统、AMLC查重系统、SMLC查重系统等等。
三、知网查重总字数多了很多
由于检测报告中的字数也是Word计算的字符计空格,所以报告中的总字数会多了很多的。知网查重计算的总字数是Word文档里统计的字符(包含空格),并不只是单纯Word文档里统计的字数。 大多数论文都会有英文摘要与英文参考文献,英文的话占字符数就更多了,一个字母计入成一个字符,而Word文档里统计时,是一个单词记为一个字。在知网查重的时候,论文表格里的内容也会被计入字符。
总结:将字扩充算进知网查重吗?由于它是模糊算法故不能过于简单修改,在扩充的时候建议重新表述原文意思。对于连续13字为标准仅仅是网上总结,但它依然是可以给大家提供一定参考的。最后,总字数多是因为计算的是字符数。以上是“将字扩充算进知网查重吗”全部介绍。