亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

          首頁 > 新聞 > 科技

          分享到微信

          打開微信,點擊底部的“發(fā)現(xiàn)”,
          使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

          AI垃圾充斥論文庫?科研人員稱AI痕跡難以發(fā)現(xiàn)、部分領(lǐng)域有AI造假的可能

          第一財經(jīng) 2025-01-22 15:45:29

          作者:鄭栩彤 ? 劉曉潔 ? 屠佳若    責(zé)編:劉佳

          技術(shù)的另一面是,學(xué)術(shù)造假越來越方便,學(xué)術(shù)界近期開始擔(dān)憂,AI垃圾或許會充斥論文庫。

          生成式AI在學(xué)術(shù)領(lǐng)域正在加快科學(xué)發(fā)現(xiàn),甚至因此登上了諾貝爾獎臺,但技術(shù)的另一面是,學(xué)術(shù)造假越來越方便,學(xué)術(shù)界近期開始擔(dān)憂,AI垃圾或許會充斥論文庫。

          瑞典布羅斯大學(xué)學(xué)院近期發(fā)布了一篇文章,稱研究人員在谷歌學(xué)術(shù)平臺中發(fā)現(xiàn)了上百篇疑似由AI生成的文章,研究人員認(rèn)為,由AI生成的“垃圾科學(xué)”正在侵蝕學(xué)術(shù)平臺,給同行評審系統(tǒng)帶來壓力,也對科研人員的信息素養(yǎng)提出更高要求。

          第一財經(jīng)記者留意到,近一年來,學(xué)術(shù)界出現(xiàn)了不少被質(zhì)疑使用AI生成的論文,甚至被撤稿,也出現(xiàn)了使用AI技術(shù)“潤色”論文被認(rèn)為是學(xué)術(shù)不端的事件。

          記者梳理發(fā)現(xiàn),目前可以將AI可能導(dǎo)致的學(xué)術(shù)垃圾分成兩類,一是用AI翻譯或生成部分文字表達,二是利用生成式AI學(xué)術(shù)造假,前者AI主要起到輔助寫作的作用,但可能因為論文作者不仔細檢查生成的內(nèi)容導(dǎo)致論文出錯,后者的主要問題在于AI使學(xué)術(shù)造假變得更便利。

          “我還沒有發(fā)現(xiàn)大量明顯由AI生成的論文,如果作者將AI的痕跡刪除干凈就難以發(fā)現(xiàn)。但理論上AI確實能用于輔助論文寫作,也出現(xiàn)了被懷疑使用了AI生成的論文?!币幻咝?蒲泄ぷ髡吒嬖V記者。記者采訪的多名在讀博士或科研工作者認(rèn)為,他們還沒有發(fā)現(xiàn)AI導(dǎo)致學(xué)術(shù)垃圾充斥論文庫,但AI已經(jīng)能用于做一些學(xué)術(shù)輔助工作,在不同研究領(lǐng)域使用AI學(xué)術(shù)造假的可能性則有所不同。

          AI垃圾充斥論文庫了嗎?

          擔(dān)心AI垃圾充斥論文庫的不只瑞典布羅斯大學(xué)學(xué)院研究人員。

          去年9月,莫那什大學(xué)研究人員Julian Koplin發(fā)表在The Conversation上的一篇文章稱,隨著類似ChatGPT的生成式AI工具出現(xiàn),越來越多論文疑似使用了AI輔助寫作,一些論文出現(xiàn)了AI經(jīng)常使用的表達,例如commendable(值得稱贊)、meticulously(小心翼翼)。

          還有一篇關(guān)于農(nóng)業(yè)技術(shù)的論文出現(xiàn)了明顯使用AI工具的表述:“作為AI語言模型,我無法直接訪問當(dāng)前的研究文章或研究。但是,我可以為您提供一些最新趨勢和進展的概述……”。Julian Koplin表示,AI存在幻覺問題,有時會犯嚴(yán)重的錯誤,而論文作者需要確保學(xué)術(shù)論文沒有嚴(yán)重錯誤。

          去年5月,也有消息稱,一篇未經(jīng)同行評議的預(yù)印本論文估計,通過分析寫作風(fēng)格,有上萬篇論文可能被AI以某種方式潤色了,一些論文留下了使用AI的跡象,例如出現(xiàn)了以“作為人工智能模型語言模型”開頭的句子,有研究人員認(rèn)為,濫用AI工具可能會損害公眾對科學(xué)研究的信任。

          學(xué)術(shù)論文出現(xiàn)AI常見表達還發(fā)酵成一些輿論事件。早在2023年,就有一篇發(fā)表在《Physica Scripta》期刊上的論文被發(fā)現(xiàn)使用了AI慣用的短語,隨后該論文被撤稿。去年,有論文出現(xiàn)一句疑似ChatGPT慣用回答“Certainly, here is a possible introduction for your topic:” (當(dāng)然,這里有一個關(guān)于你的主題的可參考介紹:),也被質(zhì)疑用了AI寫論文,引起了學(xué)界和媒體的關(guān)注。

          由于目前學(xué)術(shù)界已有不少存在AI痕跡的論文出現(xiàn),傳播學(xué)在讀博士李庭對第一財經(jīng)表示,某種意義上,AI生成的學(xué)術(shù)垃圾是存在的,例如加劇了模式化的表達,導(dǎo)致虛假的事實與論據(jù)污染數(shù)據(jù)庫。

          不過,需要注意的是,瑞典布羅斯大學(xué)研究人員強調(diào),出現(xiàn)了AI垃圾的谷歌學(xué)術(shù)平臺并不等同于專業(yè)學(xué)術(shù)數(shù)據(jù)庫,該平臺缺少必要的質(zhì)量保證流程。

          記者采訪的一些學(xué)術(shù)界人士認(rèn)為,不使用谷歌學(xué)術(shù)平臺而使用專業(yè)學(xué)術(shù)數(shù)據(jù)庫,可以有效篩掉低質(zhì)量論文和“AI垃圾”。不過,用AI潤色或翻譯論文變得較為普遍,使用AI或也難以發(fā)現(xiàn)其痕跡。

          一名新聞學(xué)在讀博士生告訴記者,她平時搜集中文文獻主要使用知網(wǎng),限定搜索范圍為CSSCI,搜集英文文獻主要使用web of science,限定搜索范圍為SSCI,這樣搜索到的只有國內(nèi)外相對較認(rèn)可的期刊文獻,她并未發(fā)現(xiàn)學(xué)術(shù)論文庫出現(xiàn)被AI污染的情況。

          中科院生物學(xué)博士、科研工作者劉耀文則擔(dān)心,還是會有一些研究者使用AI寫論文,并且AI痕跡可能難以發(fā)現(xiàn)。他去年就留意到一篇學(xué)術(shù)論文帶有AI生成痕跡,“可能是AI生成,審稿人還沒發(fā)現(xiàn)。這個事件曝出后,后續(xù)使用AI寫論文的人就會更注意刪掉AI痕跡了?!?/p>

          用AI寫論文背后,可能是作者用AI翻譯或潤色已經(jīng)寫好的論文,也可能是使用AI輔助后直接采用AI生成內(nèi)容。就用AI翻譯論文的需求,劉耀文表示,國內(nèi)研究者在海外期刊發(fā)表論文經(jīng)常會面臨語言問題,通常會尋求翻譯軟件的幫助,但根據(jù)經(jīng)驗,AI的效果比翻譯軟件、人工翻譯的效果更好?,F(xiàn)在已經(jīng)有很多人采用這種方式潤色論文。問題在于,AI可能生成有歧義的表達,翻譯后作者需要糾正一遍,如果不修改可能導(dǎo)致論文出現(xiàn)垃圾信息。

          至于直接使用AI寫作論文,一些受訪者認(rèn)為,AI生成的內(nèi)容表達能力尚可,但思辨性不足。上述新聞學(xué)在讀博士表示,用Kimi生成的文本應(yīng)付本科課程論文還行,寫其他論文不太行。從生成文本質(zhì)量看,AI生成的內(nèi)容邏輯和表達基本可以,但思辨性不夠,缺乏深度,缺少讓人眼前一亮的東西。劉耀文則注意到,用AI生成論文中的文字,看起來具備相當(dāng)?shù)膶I(yè)性,AI生成的文字確實缺少思辨性,不過,并不是論文中所有內(nèi)容表述都需要思辨性。

          同樣是傳播學(xué)博士的殷文則表示,AI確實可以補充學(xué)術(shù)寫作,例如幫助翻譯、潤色文字、整合文獻、激發(fā)思維。“當(dāng)你想做一個題還沒什么思路的時候,AI可以給你提供一些關(guān)鍵詞,或者整合一些前沿研究,你再看著去找自己感興趣的點,有時候你沒想到的但是AI更系統(tǒng)地去幫你想了。”殷文稱。

          “但全靠AI是別指望了,全靠它我覺得對話也挺費勁的,一點一點教它,我不如自己寫完了?!币笪恼J(rèn)為,如果AI是用來應(yīng)付作業(yè)確實會生產(chǎn)很多學(xué)術(shù)垃圾,但如果真想做點實質(zhì)性的研究,目前的大模型還是寫不出有創(chuàng)新性的內(nèi)容的。

          即便用AI做文獻綜述這類不需要太多創(chuàng)新的工作,殷文覺得“也挺雞肋的“?!敖oAI一個關(guān)鍵詞,它會選高引用的幾篇論文給你堆一堆,但分不清楚哪些是前沿,也分不清楚哪篇優(yōu)秀,另外在文獻來源上,AI還會引用一些平時根本不會用的文章,例如百家號上的。”

          殷文認(rèn)為,AI篩選的數(shù)據(jù)庫還是有很大的問題,此外AI的寫法也很笨,“誰誰誰說了什么這樣的,或者是列幾個點,反正需要作者加工的還是很多,每次折騰完了還是要自己寫。”

          有研究者認(rèn)為,目前還不用太擔(dān)心AI垃圾影響學(xué)術(shù)研究?!皩W(xué)術(shù)圈一直是優(yōu)勝劣汰的機制,真正能留下來、被反復(fù)引用和討論的文章不多。AI生成的文章如果沒有實質(zhì)內(nèi)容,很快就會被淘汰出局。不用太擔(dān)心AI垃圾充斥論文庫或滋生學(xué)術(shù)不端?!?一名理論物理學(xué)博士告訴記者。

          AI學(xué)術(shù)造假有多大空間?

          對學(xué)術(shù)而言,生成式AI有其高光時刻。

          2024年諾貝爾物理學(xué)獎和化學(xué)獎都頒發(fā)給了AI領(lǐng)域的科學(xué)家,將AI for Science(AI驅(qū)動科學(xué)研究)的關(guān)注度提升到空前的水平。諾獎得主中,既包括用物理學(xué)工具開發(fā)機器學(xué)習(xí)基礎(chǔ)方法的學(xué)者,也包括用AI模型預(yù)測蛋白質(zhì)復(fù)雜結(jié)構(gòu)的學(xué)者。越來越多科學(xué)家考慮用AI輔助科學(xué)研究了。

          一名化學(xué)研究者告訴記者,他在紫杉醇生物合成研究中全面應(yīng)用AI,例如用AI判定實驗是否生成紫杉烷類分子。一名數(shù)學(xué)物理學(xué)研究者表示,她也讓學(xué)生嘗試用AI識別少層石墨烯的層厚和轉(zhuǎn)角。

          研究者們用AI加速科學(xué)研究和使用現(xiàn)有AI工具生成論文、進行學(xué)術(shù)造假,是這個技術(shù)的一體兩面,但有著本質(zhì)的區(qū)別。

          例如,要做出像上述能輔助學(xué)術(shù)研究的AI工具,門檻頗高。從2018年推出可預(yù)測蛋白質(zhì)結(jié)構(gòu)的AlphaFold1到2024年推出AlphaFold3,谷歌DeepMind團隊花了近6年時間。記者了解到,要訓(xùn)練出可加速科學(xué)研究的AI工具,也需要研究者花費精力獲取AI訓(xùn)練所需的數(shù)據(jù),這個過程并不容易。

          而使用AI工具造假,則是更快的一條捷徑。學(xué)術(shù)界更受關(guān)注的事件似乎還是用AI輔助寫作而未將AI的痕跡刪除干凈,不過,使用AI技術(shù)進行學(xué)術(shù)造假也引起了一些擔(dān)憂。前段時間,一名中國學(xué)生使用ChatGPT潤色論文、修改部分用戶訪談內(nèi)容涉嫌學(xué)術(shù)造假而被麻省理工學(xué)院退學(xué)的事件也引起輿論關(guān)注。

          記者了解到,使用AI進行學(xué)術(shù)造假的可能性在不同研究領(lǐng)域存在區(qū)別。在一些文科研究領(lǐng)域,AI的思辨性不足可能無法讓其代替人工做學(xué)術(shù)。上述理論物理學(xué)博士告訴記者,在理論物理方向,也幾乎沒有學(xué)術(shù)造假的空間,因為論文中的推導(dǎo)層層遞進,如果有問題可以比較直接地看出來。

          一名在讀計算機博士也告訴記者,對計算機科研工作者來說,用AI造假似乎不太可行,要發(fā)頂級會議、頂級期刊的研究者無法用AI造假。學(xué)術(shù)論文要求的研究動機、方法設(shè)計、實驗驗證和分析相互對應(yīng),目前AI還不太可能符合要求。不過,他也承認(rèn),在審稿質(zhì)量低的會議或期刊上,AI技術(shù)可能讓學(xué)術(shù)不端事件容易發(fā)生。

          對于一些較依賴實驗,且實驗存在較多不確定性的學(xué)科,學(xué)術(shù)造假可能有更多潛在空間,AI也可能成為學(xué)術(shù)造假的幫手。劉耀文告訴記者,學(xué)術(shù)造假一直是問題,AI只是加重了對造假的擔(dān)憂,原因在于AI生成速度更快、生成內(nèi)容更真實。

          劉耀文表示,以往一些學(xué)術(shù)造假事件被發(fā)現(xiàn),往往是因為論文出現(xiàn)低級錯誤,例如多篇文章使用同一張圖、數(shù)據(jù)單位出錯,又或是數(shù)據(jù)存在人為痕跡(如66.7是100的2/3,可能人為編造),而不是因為其他研究者嘗試復(fù)現(xiàn)實驗。其背后,學(xué)術(shù)界重視個人聲譽,對學(xué)術(shù)權(quán)威一般不予質(zhì)疑,復(fù)現(xiàn)實驗也需要成本,生物醫(yī)學(xué)領(lǐng)域復(fù)現(xiàn)實驗的成本就非常高。即便復(fù)現(xiàn)實驗,一些研究領(lǐng)域也存在很大變量空間,就像“9點取的樣本和10點取的樣本不同”,研究者可能很難確認(rèn)無法復(fù)現(xiàn)實驗的原因,特別是在一些起步比較晚、缺少公理的研究領(lǐng)域。

          劉耀文表示,學(xué)術(shù)造假后果可以參考“心肌干細胞”論文造假事件。2018年,哈佛大學(xué)醫(yī)學(xué)院教授、心肌再生領(lǐng)域開創(chuàng)者皮耶羅·安韋薩被發(fā)現(xiàn)有31篇學(xué)術(shù)論文造假,幾乎使整個研究領(lǐng)域遭受毀滅性打擊。

          劉耀文擔(dān)心的是,有了AI技術(shù)后,論文作者可能會用AI生成看上去更專業(yè)、更真實的數(shù)據(jù),例如數(shù)據(jù)更加隨機,數(shù)據(jù)造假更難被發(fā)現(xiàn)。如果用AI生成實驗圖,看上去也更真實,實驗圖造假可能導(dǎo)致實驗結(jié)果出錯。他認(rèn)為,個人研究者很難辨別他人的論文是否造假,一個原因是很多學(xué)術(shù)論文庫不開源,難以找到足夠的論文比對判斷。

          2023年,查爾斯特大學(xué)教授Geoffrey M. Currie也在一篇論文中指出Al偽造的監(jiān)測難點。他表示,“深度偽造”或帶來圖像虛構(gòu),比如生成對抗網(wǎng)絡(luò)GAN可以去除噪點使醫(yī)學(xué)圖像更清晰,但也可能被用于生成高仿真的醫(yī)學(xué)圖像。此外,AI生成的文本可能會通過“扭曲短語(Tortured phrases)”的方式繞過抄襲軟件的監(jiān)測,AI可能會修改某些文本導(dǎo)致文本變味。

          學(xué)術(shù)期刊如何規(guī)定AI技術(shù)使用?

          就是否接收使用了AI輔助的論文、是否采取措施辨別論文是否使用AI輔助或造假、措施是否有效,第一財經(jīng)記者向知名學(xué)術(shù)期刊Natrue、Cell、The Lancet、Science、ACM、IEEE和中國圖象圖形學(xué)報發(fā)送郵件,截至發(fā)稿前未獲回復(fù)。

          不過,2023年底,來自美國加州大學(xué)和英國的團隊用文獻計量學(xué)的方法統(tǒng)計了Top 100出版社和Top 100期刊針對AI的使用規(guī)范和聲明,其分析結(jié)論發(fā)表在了《英國醫(yī)學(xué)雜志》(TheBMJ)上。

          上述研究者發(fā)現(xiàn),在前100大出版商中,24%提供了關(guān)于生成式AI使用的指導(dǎo),在前100名高排名期刊中,87%提供了生成式AI使用指導(dǎo)。在提供指導(dǎo)的出版商和期刊中,只有1%的期刊明確禁止在手稿生成過程中使用生成式AI,但96%和98%的出版商和期刊分別禁止將生成式AI作為作者。

          關(guān)于該如何聲明生成式AI的使用,不同的期刊和出版社存在差異,包括在方法部分致謝等部分,但總體他們認(rèn)為,作者應(yīng)對AI生成的內(nèi)容仔細核對,并負(fù)有全部責(zé)任。

          一名新聞學(xué)在讀博士生告訴記者,目前她只注意到新聞傳播學(xué)領(lǐng)域較知名的國際會議IAMCR對投稿論文使用AI生成技術(shù)提出要求,大致意思是可以使用AI技術(shù),但作者需要說明使用AI工具的用途等。記者也留意到,一些知名期刊要求作者說明AI工具的使用情況。Nature對論文使用AI技術(shù)的要求包括,作者需要說明文章使用了AI工具,用AI輔助文案編輯則不需聲明,但作者須對最終文本負(fù)責(zé)。Science也要求作者披露AI工具的使用,并要求作者對文章的準(zhǔn)確性負(fù)責(zé)。IEEE要求作者在致謝部分說明文章使用AI生成內(nèi)容的情況。

          由中國科學(xué)技術(shù)信息研究所牽頭制訂并于2024年9月發(fā)布的《學(xué)術(shù)出版中AIGC使用邊界指南2.0》在論文圖表制作、文字撰寫、語言潤色、同行評審等方面也提出規(guī)范做法。例如,蛋白質(zhì)印跡實驗圖、組織細胞染色圖等實驗生成類圖像不可通過AIGC直接生成,不應(yīng)用AIGC產(chǎn)生研究假設(shè)、直接撰寫整篇論文文本或解釋數(shù)據(jù),但可用于提高文本可讀性、總結(jié)其他學(xué)術(shù)出版物或生成文獻綜述部分。研究人員對AIGC提供的資料需驗證真實性和準(zhǔn)確性,并充分、正確披露和聲明AIGC使用情況。

          據(jù)李庭觀察,學(xué)界現(xiàn)在對AI的態(tài)度是,不反對用來輔助寫作,但是寫作的結(jié)果不能讓人發(fā)現(xiàn)用了AI。

          “目前行業(yè)有AI檢測網(wǎng)站,如果檢測結(jié)果顯示使用AI的可能性過高,會對學(xué)術(shù)聲譽造成影響。如果論文中出現(xiàn)了明顯是AI生成的錯誤,論文肯定是要被撤稿的,如果是學(xué)位論文甚至可能會拿不到學(xué)位?!崩钔ケ硎?,期刊目前對AI使用沒有明確的標(biāo)準(zhǔn),不同的刊物和學(xué)術(shù)機構(gòu)對于AI有支持有禁止,但是在實際操作中往往難以證明使用了AI。

          舉報
          第一財經(jīng)廣告合作,請點擊這里
          此內(nèi)容為第一財經(jīng)原創(chuàng),著作權(quán)歸第一財經(jīng)所有。未經(jīng)第一財經(jīng)書面授權(quán),不得以任何方式加以使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財經(jīng)保留追究侵權(quán)者法律責(zé)任的權(quán)利。
          如需獲得授權(quán)請聯(lián)系第一財經(jīng)版權(quán)部:banquan@yicai.com
          相關(guān)閱讀

          當(dāng)消費遇上AI|人工智能向醫(yī)療設(shè)備滲透,醫(yī)療行業(yè)的“寒武紀(jì)”要來了?

          AI對醫(yī)療設(shè)備行業(yè)的顛覆,正從效率工具轉(zhuǎn)變?yōu)椤爸悄軈f(xié)作者”。但醫(yī)療AI的發(fā)展仍任重道遠,大模型仍很難替代醫(yī)生,目前在數(shù)據(jù)獲取、學(xué)習(xí)能力、問題的可學(xué)習(xí)性上依舊存在挑戰(zhàn)。

          386 04-14 14:35

          特朗普為何對美國科學(xué)界揮出“大棒”?將發(fā)生什么?

          郭英劍表示,科研之所以受損,不是因為科技不重要,而是因為高校作為科技載體,不符合特朗普主義的政治與文化傾向。

          586 04-03 18:19

          “代謝組學(xué)之父”:解密健康長壽為何更依賴表型組學(xué)

          對很多個體來說,科學(xué)進步可以顯著提升生命質(zhì)量,這就是精準(zhǔn)醫(yī)學(xué)。

          92 04-01 22:14

          博鰲亞洲論壇2025年年會側(cè)記|什么樣的AI是“好AI”?

          更多人意識到,舊地圖找不到新的世界。

          105 03-28 16:23

          尋找大模型應(yīng)用落地 “最后一公里” ,第一財經(jīng)《數(shù)新風(fēng)|洞見“?!绷Α分v述“AI+”新故事

          “應(yīng)用為王”這一理念在大模型技術(shù)發(fā)展與落地中尤為重要,已經(jīng)成為產(chǎn)業(yè)界、企業(yè)界最迫切解決的一個課題。

          54 03-27 11:51
          一財最熱
          點擊關(guān)閉