來(lái)源:央視新聞、深度學(xué)術(shù)搜索
當(dāng)下正是畢業(yè)季,論文的“AI味”太濃,是高校共同面對(duì)的新難題。今年的高校畢業(yè)生在畢業(yè)論文階段,除了傳統(tǒng)的查重、盲審、答辯,畢業(yè)路上又多了一道關(guān)卡——AIGC檢測(cè),也就是人工智能生成內(nèi)容檢測(cè)。
假設(shè)你是一名畢業(yè)生,發(fā)現(xiàn)自己的論文AI率有62%,離學(xué)校規(guī)定的15%的紅線(xiàn)差了47個(gè)百分點(diǎn)。而后你打開(kāi)一個(gè)大模型,輸入“幫我把這篇論文改得像人寫(xiě)的”,改完一查——AI率竟然升到了94%。這種情況并非個(gè)案,過(guò)去一段時(shí)間不少畢業(yè)生都遇到過(guò)。學(xué)校讓AI查AI率,學(xué)生用AI降A(chǔ)I率,這都靠譜嗎?畢業(yè)論文檢測(cè),怎樣更科學(xué)?
檢測(cè)工具不完善
學(xué)生修改后AI率不降反升
多所高校在畢業(yè)論文審核中增設(shè)AI生成內(nèi)容檢測(cè)環(huán)節(jié)。然而,不少學(xué)生反映,現(xiàn)在的檢測(cè)工具似乎還不是很完善,比如自己寫(xiě)的內(nèi)容會(huì)被誤判為AI生成,反復(fù)修改后AI率不降反升。同時(shí),一些以“降A(chǔ)I率”為名的付費(fèi)服務(wù)在網(wǎng)絡(luò)上隨處可見(jiàn)。這些也給不少學(xué)生帶來(lái)困擾。
某高校畢業(yè)生 小吳:學(xué)校卡了20%的“AI率”線(xiàn),提交上去發(fā)現(xiàn)自己寫(xiě)的也被打成AI寫(xiě)的了。你就要在有限的時(shí)間內(nèi)把“AI率”降下來(lái),同時(shí)還要兼顧查重率,有時(shí)候“AI率”降下來(lái),查重率又升上去了。
除了自己寫(xiě)的文字被判定為AI生成之外,針對(duì)查出來(lái)的疑似AI生成內(nèi)容,由于檢測(cè)報(bào)告中只有整段紅色標(biāo)注,而沒(méi)有解釋為何被認(rèn)定為AI生成,學(xué)生在修改的時(shí)候也不清楚自己應(yīng)該往哪個(gè)方向改。
![]()
某高校畢業(yè)生 小孫:調(diào)整了四次,把我標(biāo)紅的那些被認(rèn)為是AI的字段,我進(jìn)行了一些擴(kuò)寫(xiě),然后我得到的結(jié)果是,我改了一個(gè)晚上,它的AI查重率從15%升到了19%。而且我第一次沒(méi)有標(biāo)紅,并且第二次也沒(méi)有修改的原文在這次標(biāo)紅了。
![]()
瞅準(zhǔn)部分高校在畢業(yè)論文審核中增設(shè)AI生成內(nèi)容檢測(cè)環(huán)節(jié),一些私人公司就打著售賣(mài)畢業(yè)論文“降A(chǔ)I率”的服務(wù),在社交媒體、網(wǎng)絡(luò)平臺(tái)上發(fā)廣告、招攬業(yè)務(wù),亂象較多,也給畢業(yè)生帶來(lái)干擾和困惑。
![]()
某高校畢業(yè)生 小劉:一方面AI查重賺一波錢(qián),然后降A(chǔ)I又賺一波錢(qián)。其實(shí)非常暴利,改一次實(shí)際的成本可能5塊錢(qián)都不要,但他收100塊錢(qián)。我覺(jué)得這個(gè)快成為一條產(chǎn)業(yè)鏈了,論文檢測(cè)平臺(tái)它有AI率的檢測(cè),外部的一些平臺(tái)它有降A(chǔ)I的服務(wù),本質(zhì)上是用AI去“降A(chǔ)I率”,它的意義也不大。
大模型如何檢測(cè)一篇文章中AI生成內(nèi)容?
學(xué)校對(duì)于學(xué)生的論文設(shè)置“AI率”檢測(cè)紅線(xiàn),但是有不少學(xué)生反映,學(xué)校檢查論文AI率也是依托指定檢測(cè)平臺(tái)、結(jié)合算法模型分析。
一般來(lái)講,目前主流高校多采用知網(wǎng)、維普、萬(wàn)方等系統(tǒng)的AIGC檢測(cè)模塊。那么,AI大模型到底是如何檢測(cè)一篇文章中有多少內(nèi)容是AI生成的呢?
![]()
記者將這一問(wèn)題拋給了多個(gè)大模型,總結(jié)相關(guān)的回答,簡(jiǎn)單來(lái)說(shuō)就是通過(guò)“困惑度與突發(fā)性”等特征來(lái)判斷。AI文本通常更“平滑”,人類(lèi)文本波動(dòng)更大。
![]()
大模型回答,困惑度指的是文本的“可預(yù)測(cè)性”,越充滿(mǎn)人類(lèi)特有的、意外的、跳出常規(guī)的表達(dá),越像人類(lèi)。突發(fā)性,就是文本節(jié)奏波動(dòng)——人類(lèi)寫(xiě)作如心電圖般起伏,AI輸出則如直線(xiàn)般平穩(wěn)。如此判斷,準(zhǔn)確嗎?
對(duì)此,專(zhuān)家告訴記者,除了困惑度、突發(fā)性等指標(biāo)外,AI文本生成的原理是通過(guò)預(yù)測(cè)下一個(gè)最有可能出現(xiàn)這種詞的概率來(lái)逐漸生成文本,可以理解為基于一種概率統(tǒng)計(jì)。所以,目前檢測(cè)AI生成內(nèi)容準(zhǔn)確性都做不到100%,誤判也時(shí)有發(fā)生。
檢測(cè)“AI率”原理基于概率而非確定性判斷
首都師范大學(xué)教育學(xué)院副院長(zhǎng) 蔡海龍:查重是將論文與語(yǔ)料庫(kù)進(jìn)行語(yǔ)句對(duì)比,從而確定這種語(yǔ)句的重復(fù)性,做出確定性的判斷。而AI檢測(cè)是運(yùn)用AI系統(tǒng)去檢測(cè)人類(lèi)文本,在語(yǔ)意、語(yǔ)言表達(dá)風(fēng)格上和AI寫(xiě)作是否存在重疊,本質(zhì)上是一種基于概率的分類(lèi),而非基于證據(jù)的確定性的判斷。
![]()
當(dāng)前AI檢測(cè)的技術(shù)瓶頸核心就在于我們是在用AI去查AI,這就導(dǎo)致我們不能明確判定這段文字是人類(lèi)作者所寫(xiě)還是AI所寫(xiě),不能對(duì)此做出明確的解釋和說(shuō)明,這是技術(shù)瓶頸最為關(guān)鍵之所在。
除此之外,中文語(yǔ)言表達(dá)方面還有另外一個(gè)特點(diǎn),它的語(yǔ)意非常豐富,語(yǔ)句的表達(dá)方式也非常豐富。這就使得人工智能系統(tǒng)在檢測(cè)人類(lèi)作者所寫(xiě)作語(yǔ)句的時(shí)候,它就會(huì)產(chǎn)生很多的歧義,它的難度,它的準(zhǔn)確率都會(huì)相應(yīng)增加,這是導(dǎo)致誤判的一個(gè)很重要的原因。
由于AI率檢測(cè)目前還不能做到十分精準(zhǔn),老師們認(rèn)為在論文審核上,應(yīng)建立透明可回溯的AI使用標(biāo)注制度,而非簡(jiǎn)單地劃定AI率“紅線(xiàn)”。在判定機(jī)制上,應(yīng)確立以人工評(píng)議為主、AI檢測(cè)為輔的“人機(jī)共判”模式。
由于公眾號(hào)改版,為防錯(cuò)過(guò)更多資源,給我們加個(gè)星標(biāo)吧
說(shuō)明:來(lái)源:央視新聞、深度學(xué)術(shù)搜索,如需轉(zhuǎn)載,請(qǐng)?jiān)陂_(kāi)頭注明來(lái)源。僅供學(xué)習(xí)交流分享使用,版權(quán)歸原作者所有,文章只代表作者本人觀點(diǎn),不代表公眾號(hào)立場(chǎng)。如有侵權(quán),請(qǐng)聯(lián)系我們(Hilib oy)刪除,感謝支持!也歡迎有興趣的朋友分享、投稿、申請(qǐng)轉(zhuǎn)載、互開(kāi)長(zhǎng)白。
了解更多信息
↓↓↓歡迎點(diǎn)贊和推薦哦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.