畢業論文AIGC檢測引爭議，不同平臺檢測結果差異大，專家：“AI率”不等同於“查重率”，建議僅供導師參考，不宜“一刀切”

極目新聞記者曹雪嬌

隨著AI技術的快速發展，近幾年不少大學針對學生的畢業論文引入AIGC檢測，即“人工智慧生成內容”檢測論文。有學校要求，如畢業生論文的AIGC檢測結果不達標，學生會推遲答辯。對此，不少學生在社交平臺大吐苦水。

近期，極目新聞記者採訪了多名大學應屆畢業生，有同學表示，目前，不同平臺的AIGC論文檢測結果差異巨大，甚至同一平臺不同時間檢測結果也可能不同論文。還有同學稱，有些“手搓”部分也會被判定為AI生成，認為檢測平臺應公開判定標準。

有專家提出，AIGC的檢測結果是文章段落疑似使用AI生成的機率，不應簡單將其與傳統的論文查重率一樣看待論文。高校僅以AIGC檢測結果作為答辯硬性限制標準是不科學的。

不同平臺檢測結果差異大

來自華東某高校的王同學是被AIGC檢測困擾的本科生之一，她是學校首批進行AIGC檢測的畢業生論文。她在維普、知網兩個平臺提交同一篇論文後，一個網站顯示AIGC檢測結果是3%，另一個網站顯示AIGC檢測結果是67%。如此兩極分化的結果讓王同學無所適從。

王同學說，之所以查兩個網站，是因為最初學校要求使用一個網站檢測，而論文定稿交在另一個網站，學生們只能兩個網站都測論文。但後來，因不少學生反映這一問題，學校最終調整為統一使用知網檢測，才解決了這一難題。

畢業論文AIGC檢測引爭議，不同平臺檢測結果差異大，專家：“AI率”不等同於“查重率”，建議僅供導師參考，不宜“一刀切”

一檢測網站的AIGC檢測頁面

最終，王同學在知網、維普各檢測三次，累計花費188元論文。王同學說，畢業季本來開支就多，同學們其實並不願意花錢檢測，但又沒辦法。

同樣受此困擾的還有今年畢業的秦同學，她所就讀的學校要求本科生畢業論文在維普網站的AIGC檢測結果不能超過30%，否則無法答辯論文。

“我覺得拿到30%以下的檢測結果難度挺大的論文。”秦同學說，她在寫論文時，確實使用了一些AI工具潤色文字，導致論文最初的AIGC檢測結果非常高。經過連續4天的熬夜修改後，她終於趕在最後一天交了改好的定稿。

展開全文

在修改時，秦同學發現，即便是同一個平臺，前後兩次檢測的結果也會出現差異論文。據其介紹，她記得，當時論文中有一段在第一次、第二次AIGC檢測時均未出現問題，因此她並沒有作出修改。但到了第三次檢測，這段話又突然出現標紅，意味著平臺認定這段話高度疑似由AI生成，她只能再次調整語序、表達方式。

社交平臺有畢業生髮帖稱AIGC檢測結果相差較多

“手搓”致謝也會被認為AI生成

為什麼同一平臺的AIGC檢測結果會發生改變？為什麼不同平臺檢測結果差距這麼大？不少畢業生對檢測平臺的認定標準十分好奇論文。

秦同學告訴記者，修改過程中，最離譜的是她純手寫的論文致謝部分在某一次AIGC檢測中被標紅論文。除此之外，她請一名外語專業同學幫忙人工翻譯的一段英文摘要，也被平臺判定為是100%是AI寫作，“改得人非常頭疼。”

最終，秦同學把英文摘要中長句全部改成了最直白的“主謂賓”句式，又把高階詞彙全部替換成常見的單詞，AIGC檢測結果才下降論文。但她不能理解為什麼明明是“手搓”的，還被判定為AI生成。

王同學稱，她也使用了“書面用語轉化口語表達”的辦法來降低AIGC檢測結果論文。答辯時，老師直接現場指出她論文中大白話過多，讓她修改。

“一些比較書面的、有邏輯的長句表達會被判定為AI生成，不明白判定為AI生成的標準是什麼？”在王同學看來，被平臺判定為AI生成後，學生只能硬著頭皮修改，連辯解的機會都沒有，“現在的檢測就像是黑箱操作，平臺應該公開判定標準論文。”

對此，記者諮詢了知網的線上客服論文。其回覆稱，AI生成文字特徵有三個判斷標準。一是內容空洞，言之無物，或同一個意思重複性地描述，上下文邏輯不清晰；二是透過專業人員鑑別，所描述內容是否符合專業描述規範或者習慣；三是二次生成對照，利用相關模型，按照文字內容含義二次生成，生成內容與論文內容相近。

另一免費第三方檢測平臺Paperpass此前曾專門發文介紹其AIGC檢測機制，稱其AIGC檢測功能是對大量人類原創文字和AI生成文字進行了深度學習和對比分析構建，最終透過對用詞、句式、文字邏輯等判斷所檢測文章是否為AI生成論文。

針對同一文章為何前後檢測結果不同這個問題，上述知網客服稱，技術在判斷某段文字是否存在AI生成行為時，不僅僅根據這一段文字，還會參考文字的上下文，當文字的上下文修改後，也會影響對該段文字的認定論文。同時，使用者對論文內容進行修改、增加、刪減等，不論從AI特徵判斷、還是字元數統計，均可能會引起AIGC檢測結果發生變化。論文修改前後的兩個版本，因為內容整體特徵有變化，檢測結果可能會有所差異，這是正常現象。

專家：需業內推動平臺最佳化升級論文，打破“演算法黑箱”

對於畢業生們的焦慮與困惑，北京郵電大學計算機學院（國家示範性軟體學院）鄂海紅教授接受極目新聞記者採訪時介紹，當前，大家對AIGC檢測結果有一定的誤解，把這個結果所謂的“AI率”當成論文查重率來看待，實際上這是完全不同的兩個概念，AIGC檢測結果不能等同於查重率論文。查重率是“字面重複”，指論文中重複或引用其他文獻內容的比例，查重結果相對明確，可以清晰呈現檢測文字與相似文字的比對證據，誤判率相對較低。透過查重率，可以清晰地看到，文章到底是作者自己撰寫還是大面積抄襲他人。但AIGC的檢測結果是文章段落疑似使用AI生成的機率，機率也就意味著結果的“不確定性”，即文章段落有一定機率是AI生成，同樣也有一定機率是人工寫出來的，與查重率這樣客觀、明確的重複文字匹配結果不同。因此，僅以AIGC檢測結果“一刀切”作為答辯硬性限制標準是不科學的。她認為，應將AIGC檢測報告作為參考，由導師據此決定學生是否能參與答辯。

不過，鄂海紅也坦言，高校取消AIGC檢測服務也不行，因為可能真的會有學生使用AI一鍵生成一篇論文論文。她認為，現在的AI應用正向著深度人機協同的方向發展，接下來的檢測模型研發也應更加細化和精準。比如未來的AIGC檢測報告需要指出哪些是人寫的，哪些是AI寫的，哪些是人寫後AI潤色的，哪些是AI寫後人潤色的，甚至是對不同的協同方式進行區分（擴寫、縮寫、改寫等）。老師或者期刊編輯基於這份細化報告瞭解作者的學術貢獻有多少，如AI寫作部分是否已超出了作者本人獨有觀點的傳遞，還是作者僅使用AI進行了輔助潤色？“這要求檢測平臺要能夠出具一份更有決策價值的檢測報告，即透過平臺工具呈現出一篇文章中AI參與寫作的程度和方式。”

她還提出，未來學位論文的授予應該是過程性的論文。即從開題到實驗，學生的研究記錄全程可追溯、可核查、可驗證，導師對每一步都能掌握瞭解，也避免了學生論文全文用AI的可能。

針對目前各大檢測平臺的檢測現狀，鄂海紅認為，目前的AIGC檢測更多關注的還是文字，實際上，論文中的影像偽造、幻覺引用、資料造假等問題也特別值得警惕，而這是目前業界做的比較少的論文。她介紹，現在AI圖片已經發展到肉眼難以辨別的程度。“沒經過真正的實驗，直接AI出了實驗結果，對學術的打擊更大。”在她看來，相較於AI技術本身，AI檢測工具的研發是滯後的，希望透過各方力量的支援，把對影像識別、引用溯源、資料核驗等檢測能力的研究轉化成普適服務。在發展AI行業的同時，也建起監督AI使用的護城河。

此外，對學生們吐槽檢測存在的問題，鄂海紅解釋，由於不同的檢測平臺所使用的訓練模型、設定的判定閾值不同，可能導致不同平臺檢測出來的AIGC檢測結果不同論文。受演算法等限制，這些檢測模型的可解釋性普遍比較薄弱，“所以也需要業內專家去推動平臺最佳化升級，提升檢測結果的可解釋性，打破演算法黑箱。”

（來源論文：極目新聞）

畢業論文AIGC檢測引爭議，不同平臺檢測結果差異大，專家：“AI率”不等同於“查重率”，建議僅供導師參考，不宜“一刀切”

海之嵐財稅公司

熱門標籤

相關詞彙

分站導航