論文提交後,知網會對提交的論文進行掃描。目前知網支持的論文文本格式有doc、docx、txt、pdf。論文提交後,知網系統會對論文進行轉碼,區分句子、段落、章節、引文、參考文獻等。另外,知網對全文上傳進行復核。
知網論文查重是以章節為單位的。連續8個單詞判定為“重復句”,連續13個單詞判定為“重復段”。判斷為重復的句子或段落,前後會著重檢測。
要檢測“重復的句子”或“重復的段落”,需要滿足以下條件:知網對論文查重的重復率設定了5%的閾值,以段落為單位檢測不到5%以下的抄襲或引用。
壹般來說,知網查重的檢測算法主要是基於文本相似度檢測。通過建立全文數據庫,收集多個文檔進行對比,可以判斷文章中是否有相似的部分。同時,知網還采用智能檢測手段,可以自動識別論文的引文、註釋等部分,避免誤判。
以上信息僅供參考。如有疑問,請訪問官網。