畢業論文AIGC檢測引爭議,不同平臺檢測結果差異大,專家:“AI率”不等同於“查重率”,建議僅供導師參考,不宜“一刀切”

極目新聞記者 曹雪嬌

隨著AI技術的快速發展,近幾年不少大學針對學生的畢業論文引入AIGC檢測,即“人工智慧生成內容”檢測論文。有學校要求,如畢業生論文的AIGC檢測結果不達標,學生會推遲答辯。對此,不少學生在社交平臺大吐苦水。

近期,極目新聞記者採訪了多名大學應屆畢業生,有同學表示,目前,不同平臺的AIGC論文檢測結果差異巨大,甚至同一平臺不同時間檢測結果也可能不同論文。還有同學稱,有些“手搓”部分也會被判定為AI生成,認為檢測平臺應公開判定標準。

有專家提出,AIGC的檢測結果是文章段落疑似使用AI生成的機率,不應簡單將其與傳統的論文查重率一樣看待論文。高校僅以AIGC檢測結果作為答辯硬性限制標準是不科學的。

不同平臺檢測結果差異大

來自華東某高校的王同學是被AIGC檢測困擾的本科生之一,她是學校首批進行AIGC檢測的畢業生論文。她在維普、知網兩個平臺提交同一篇論文後,一個網站顯示AIGC檢測結果是3%,另一個網站顯示AIGC檢測結果是67%。如此兩極分化的結果讓王同學無所適從。

王同學說,之所以查兩個網站,是因為最初學校要求使用一個網站檢測,而論文定稿交在另一個網站,學生們只能兩個網站都測論文。但後來,因不少學生反映這一問題,學校最終調整為統一使用知網檢測,才解決了這一難題。

畢業論文AIGC檢測引爭議,不同平臺檢測結果差異大,專家:“AI率”不等同於“查重率”,建議僅供導師參考,不宜“一刀切”

一檢測網站的AIGC檢測頁面

最終,王同學在知網、維普各檢測三次,累計花費188元論文。王同學說,畢業季本來開支就多,同學們其實並不願意花錢檢測,但又沒辦法。

同樣受此困擾的還有今年畢業的秦同學,她所就讀的學校要求本科生畢業論文在維普網站的AIGC檢測結果不能超過30%,否則無法答辯論文

“我覺得拿到30%以下的檢測結果難度挺大的論文。”秦同學說,她在寫論文時,確實使用了一些AI工具潤色文字,導致論文最初的AIGC檢測結果非常高。經過連續4天的熬夜修改後,她終於趕在最後一天交了改好的定稿。

展開全文

在修改時,秦同學發現,即便是同一個平臺,前後兩次檢測的結果也會出現差異論文。據其介紹,她記得,當時論文中有一段在第一次、第二次AIGC檢測時均未出現問題,因此她並沒有作出修改。但到了第三次檢測,這段話又突然出現標紅,意味著平臺認定這段話高度疑似由AI生成,她只能再次調整語序、表達方式。

畢業論文AIGC檢測引爭議,不同平臺檢測結果差異大,專家:“AI率”不等同於“查重率”,建議僅供導師參考,不宜“一刀切”

社交平臺有畢業生髮帖稱AIGC檢測結果相差較多

“手搓”致謝也會被認為AI生成

為什麼同一平臺的AIGC檢測結果會發生改變?為什麼不同平臺檢測結果差距這麼大?不少畢業生對檢測平臺的認定標準十分好奇論文

秦同學告訴記者,修改過程中,最離譜的是她純手寫的論文致謝部分在某一次AIGC檢測中被標紅論文。除此之外,她請一名外語專業同學幫忙人工翻譯的一段英文摘要,也被平臺判定為是100%是AI寫作,“改得人非常頭疼。”

最終,秦同學把英文摘要中長句全部改成了最直白的“主謂賓”句式,又把高階詞彙全部替換成常見的單詞,AIGC檢測結果才下降論文。但她不能理解為什麼明明是“手搓”的,還被判定為AI生成。

王同學稱,她也使用了“書面用語轉化口語表達”的辦法來降低AIGC檢測結果論文。答辯時,老師直接現場指出她論文中大白話過多,讓她修改。

“一些比較書面的、有邏輯的長句表達會被判定為AI生成,不明白判定為AI生成的標準是什麼?”在王同學看來,被平臺判定為AI生成後,學生只能硬著頭皮修改,連辯解的機會都沒有,“現在的檢測就像是黑箱操作,平臺應該公開判定標準論文。”

對此,記者諮詢了知網的線上客服論文。其回覆稱,AI生成文字特徵有三個判斷標準。一是內容空洞,言之無物,或同一個意思重複性地描述,上下文邏輯不清晰;二是透過專業人員鑑別,所描述內容是否符合專業描述規範或者習慣;三是二次生成對照,利用相關模型,按照文字內容含義二次生成,生成內容與論文內容相近。

另一免費第三方檢測平臺Paperpass此前曾專門發文介紹其AIGC檢測機制,稱其AIGC檢測功能是對大量人類原創文字和AI生成文字進行了深度學習和對比分析構建,最終透過對用詞、句式、文字邏輯等判斷所檢測文章是否為AI生成論文

針對同一文章為何前後檢測結果不同這個問題,上述知網客服稱,技術在判斷某段文字是否存在AI生成行為時,不僅僅根據這一段文字,還會參考文字的上下文,當文字的上下文修改後,也會影響對該段文字的認定論文。 同時,使用者對論文內容進行修改、增加、刪減等,不論從AI特徵判斷、還是字元數統計,均可能會引起AIGC檢測結果發生變化。論文修改前後的兩個版本,因為內容整體特徵有變化,檢測結果可能會有所差異,這是正常現象。

專家:需業內推動平臺最佳化升級論文,打破“演算法黑箱”

對於畢業生們的焦慮與困惑,北京郵電大學計算機學院(國家示範性軟體學院)鄂海紅教授接受極目新聞記者採訪時介紹,當前,大家對AIGC檢測結果有一定的誤解,把這個結果所謂的“AI率”當成論文查重率來看待,實際上這是完全不同的兩個概念,AIGC檢測結果不能等同於查重率論文。查重率是“字面重複”,指論文中重複或引用其他文獻內容的比例,查重結果相對明確,可以清晰呈現檢測文字與相似文字的比對證據,誤判率相對較低。透過查重率,可以清晰地看到,文章到底是作者自己撰寫還是大面積抄襲他人。但AIGC的檢測結果是文章段落疑似使用AI生成的機率,機率也就意味著結果的“不確定性”,即文章段落有一定機率是AI生成,同樣也有一定機率是人工寫出來的,與查重率這樣客觀、明確的重複文字匹配結果不同。因此,僅以AIGC檢測結果“一刀切”作為答辯硬性限制標準是不科學的。她認為,應將AIGC檢測報告作為參考,由導師據此決定學生是否能參與答辯。

不過,鄂海紅也坦言,高校取消AIGC檢測服務也不行,因為可能真的會有學生使用AI一鍵生成一篇論文論文。她認為,現在的AI應用正向著深度人機協同的方向發展,接下來的檢測模型研發也應更加細化和精準。比如未來的AIGC檢測報告需要指出哪些是人寫的,哪些是AI寫的,哪些是人寫後AI潤色的,哪些是AI寫後人潤色的,甚至是對不同的協同方式進行區分(擴寫、縮寫、改寫等)。老師或者期刊編輯基於這份細化報告瞭解作者的學術貢獻有多少,如AI寫作部分是否已超出了作者本人獨有觀點的傳遞,還是作者僅使用AI進行了輔助潤色?“這要求檢測平臺要能夠出具一份更有決策價值的檢測報告,即透過平臺工具呈現出一篇文章中AI參與寫作的程度和方式。”

她還提出,未來學位論文的授予應該是過程性的論文。即從開題到實驗,學生的研究記錄全程可追溯、可核查、可驗證,導師對每一步都能掌握瞭解,也避免了學生論文全文用AI的可能。

針對目前各大檢測平臺的檢測現狀,鄂海紅認為,目前的AIGC檢測更多關注的還是文字,實際上,論文中的影像偽造、幻覺引用、資料造假等問題也特別值得警惕,而這是目前業界做的比較少的論文。她介紹,現在AI圖片已經發展到肉眼難以辨別的程度。“沒經過真正的實驗,直接AI出了實驗結果,對學術的打擊更大。”在她看來,相較於AI技術本身,AI檢測工具的研發是滯後的,希望透過各方力量的支援,把對影像識別、引用溯源、資料核驗等檢測能力的研究轉化成普適服務。在發展AI行業的同時,也建起監督AI使用的護城河。

此外,對學生們吐槽檢測存在的問題,鄂海紅解釋,由於不同的檢測平臺所使用的訓練模型、設定的判定閾值不同,可能導致不同平臺檢測出來的AIGC檢測結果不同論文。受演算法等限制,這些檢測模型的可解釋性普遍比較薄弱,“所以也需要業內專家去推動平臺最佳化升級,提升檢測結果的可解釋性,打破演算法黑箱。”

(來源論文:極目新聞)

本站內容來自使用者投稿,如果侵犯了您的權利,請與我們聯絡刪除。聯絡郵箱:835971066@qq.com

本文連結://mip.haizhilanhn.com/post/52194.html

🌐 /