分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
第一財經(jīng) 2024-07-02 21:18:16 聽新聞
作者:陳兵 ? 傅小鷗 責編:任紹敏
目前,我國生成式人工智能技術創(chuàng)新、產(chǎn)品開發(fā)與應用還處在早期階段。雖然日常生活場景領域出現(xiàn)了譬如AI復活、AI音樂等,但也由于生成式人工智能訓練中的數(shù)據(jù)瑕疵、數(shù)據(jù)濫用等問題,給數(shù)據(jù)安全保護和有序開發(fā)開放及流通帶來了巨大挑戰(zhàn)。
數(shù)據(jù)訓練是保證人工智能應用高質(zhì)量落地的核心。隨著生成式人工智能大模型產(chǎn)品的廣泛應用,數(shù)據(jù)訓練過程關涉到用戶基本數(shù)據(jù)、各主體行為軌跡及多元主體復雜的權(quán)益變動,這可能對市場競爭、企業(yè)創(chuàng)新甚或國家安全產(chǎn)生負面影響。
由此,需確保數(shù)據(jù)來源的合法性,提升數(shù)據(jù)質(zhì)量的可信度,遵循“數(shù)據(jù)來源合法—數(shù)據(jù)質(zhì)量可信—數(shù)據(jù)價值釋放”的基本要求對標數(shù)據(jù)訓練的不同階段。在數(shù)據(jù)計算與應用階段,應注意深度合成技術帶來的訓練數(shù)據(jù)污染和運行數(shù)據(jù)異常;在數(shù)據(jù)開放和共享階段,應全面準確審視個人信息保護和知識產(chǎn)權(quán)侵權(quán)風險,遵循科技發(fā)展的規(guī)律,平衡技術可及性、實踐可行性以及價值正當性之間的關系,在夯實安全發(fā)展的基礎上為創(chuàng)新發(fā)展預留空間。生成式人工智能數(shù)據(jù)訓練應在優(yōu)化協(xié)同監(jiān)管架構(gòu)及方法的同時,促進創(chuàng)新發(fā)展,兼顧多元主體的正當權(quán)益。
以安全為底線,健全制度規(guī)則及標準
法律法規(guī)的制定不僅要注重科技發(fā)展的規(guī)律,還應當在夯實安全發(fā)展的基礎上為創(chuàng)新發(fā)展預留空間。對生成式人工智能數(shù)據(jù)訓練的治理不能固守以往慣用的數(shù)據(jù)控制安全保護模式,僅僅把住數(shù)據(jù)的閘口,而是應當以安全為底線,健全制度規(guī)則,在最大范圍內(nèi)提升數(shù)據(jù)使用的自由度,避免對合理的數(shù)據(jù)采集、獲取行為施加不必要的限制,但對篡改、編造、非法儲存、濫用數(shù)據(jù)以及惡意植入數(shù)據(jù)偏見等行為要加以規(guī)制。
第一,加快完善數(shù)據(jù)格式等標準體系,在降低數(shù)據(jù)流通使用成本的同時,更好保障數(shù)據(jù)流通安全。為更好地規(guī)范生成式人工智能數(shù)據(jù)訓練,需要根據(jù)數(shù)據(jù)作為生產(chǎn)要素的特點,從數(shù)據(jù)定價、數(shù)據(jù)爬取、數(shù)據(jù)反壟斷、數(shù)據(jù)流通技術保障等方面配置實現(xiàn)數(shù)據(jù)社會價值的新型產(chǎn)權(quán)規(guī)則。數(shù)據(jù)權(quán)利配置不是對數(shù)據(jù)控制的保護,而是旨在保護數(shù)據(jù)加工使用和流通利用之利益,以實現(xiàn)數(shù)據(jù)社會化流通利用為目標,促進數(shù)據(jù)等語料庫的有效流通使用。因此,各業(yè)務系統(tǒng)需要依據(jù)國標、行標、企業(yè)內(nèi)部數(shù)據(jù)標準等,在業(yè)務系統(tǒng)建設時準確落標,明確責任,保證數(shù)據(jù)質(zhì)量實現(xiàn)全過程的管理。
第二,合理制定數(shù)據(jù)訓練中知識產(chǎn)權(quán)利益分配規(guī)則,實現(xiàn)高質(zhì)量語料跨平臺調(diào)取和使用,依法依規(guī)避免侵權(quán)風險。科技的高速發(fā)展與迭代帶來了語料庫海量數(shù)據(jù)的累積與實時的數(shù)據(jù)更新,我國與人工智能、數(shù)據(jù)相關的法律制度主要有《民法典》《著作權(quán)法》《數(shù)據(jù)安全法》《個人信息保護法》以及《生成式人工智能服務管理暫行辦法》,在此基礎上需要繼續(xù)完善相關的法律制度,在知識產(chǎn)權(quán)保護層面,還需要針對生成式人工智能數(shù)據(jù)訓練形成體系化的法律規(guī)定,建構(gòu)起貫穿數(shù)據(jù)訓練全周期的保護體系。
第三,提升數(shù)據(jù)標注水平及人才培養(yǎng),做好數(shù)據(jù)事前審查,有效保障生成式人工智能的高質(zhì)量、高效率輸出。《中國AIGC數(shù)據(jù)標注產(chǎn)業(yè)全景報告(2023)》顯示,我國數(shù)據(jù)標注服務貫穿大模型全生命周期,數(shù)據(jù)標注朝著知識密集型轉(zhuǎn)移,上下游合作關系緊密耦合,而且標注人才缺口較大。為此,在規(guī)范生成式人工智能數(shù)據(jù)訓練,提升數(shù)據(jù)事前審查水平,注重數(shù)據(jù)標注的客觀化的同時,還應加快培養(yǎng)高水平復合型數(shù)字人才,為生成式人工智能的高質(zhì)量發(fā)展提供人才保障。
以規(guī)范為基線,優(yōu)化協(xié)同監(jiān)管架構(gòu)及方法
規(guī)范是生成式人工智能數(shù)據(jù)訓練的治理基線,發(fā)展是生成式人工智能數(shù)據(jù)訓練的治理目標。社會結(jié)構(gòu)中的不同治理主體應基于不同的價值追求和思維導向構(gòu)建并優(yōu)化生成式人工智能數(shù)據(jù)訓練監(jiān)管框架。當前生成式人工智能數(shù)據(jù)訓練需在健康規(guī)范的秩序下開展,在法治框架下由多方主體協(xié)同合作促進其規(guī)范發(fā)展。政府、產(chǎn)業(yè)界和學術界在規(guī)范生成式人工智能開發(fā)和使用方面都扮演著至關重要的角色,生成式人工智能服務的提供者、相關行業(yè)組織以及中央和地方各級主管部門都應依法維護生成式人工智能的規(guī)范發(fā)展。
從政府層面出發(fā),政府部門一方面應積極制定數(shù)據(jù)安全標準,確定違規(guī)行為。制定明確的數(shù)據(jù)安全標準是確保生成式人工智能系統(tǒng)的安全性的關鍵步驟,這些標準應該包括數(shù)據(jù)采集、存儲、傳輸和處理的最佳實踐,以及數(shù)據(jù)驗證和過濾的要求。政府在制定數(shù)據(jù)安全標準方面應發(fā)揮領導作用,確保標準的制定具有權(quán)威性和可強制執(zhí)行性。另一方面,政府還需要確保已制定的法律法規(guī)能夠得到嚴格執(zhí)行。《數(shù)據(jù)安全法》《個人信息保護法》《生成式人工智能服務管理暫行辦法》等法律法規(guī)是維護生成式人工智能數(shù)據(jù)訓練高效合規(guī)的主要規(guī)范。執(zhí)法部門應以這些規(guī)范為治理基線,明確判斷數(shù)據(jù)污染、惡意攻擊以及其他危害AI系統(tǒng)和用戶的行為是否違法,對違法行為依法處罰,切實將執(zhí)法必嚴、違法必究落地落實。
從產(chǎn)業(yè)界和學術界的層間出發(fā),產(chǎn)業(yè)界和學術界應該與政府部門加強合作,共同探索科學合理的監(jiān)管邊界。生成式人工智能加速和深化了跨部門的數(shù)據(jù)共享、流程再造和業(yè)務聯(lián)動,面對數(shù)據(jù)訓練運行場景的多維性、商業(yè)模式的多樣性及行為的復雜性,全能政府思維下單一的強監(jiān)管模式,難以適應生成式人工智能的發(fā)展趨勢,甚至會遏制生成式人工智能產(chǎn)業(yè)的創(chuàng)新發(fā)展。因此,需要產(chǎn)業(yè)界和學術界進行優(yōu)勢整合,并與政府協(xié)同合作,共同助力生成式人工智能的數(shù)據(jù)訓練。
通過政府、產(chǎn)業(yè)界和學術界的合作成立專業(yè)的數(shù)據(jù)治理機構(gòu),進行全面的數(shù)據(jù)治理,制定可行的數(shù)據(jù)管理制度及運營規(guī)則,創(chuàng)新數(shù)據(jù)安全監(jiān)測預警技術,綜合運用非現(xiàn)場、物聯(lián)感知、穿透式等新型監(jiān)管手段,形成具有實際效果的數(shù)據(jù)合規(guī)監(jiān)管體系,為生成式人工智能的開發(fā)和使用提供良好的法治環(huán)境。同時,完善數(shù)據(jù)質(zhì)量監(jiān)測模型、健全數(shù)據(jù)備案制度和危機管理機制,對數(shù)據(jù)違規(guī)行為依法處理。
以發(fā)展為主線,兼顧多元主體正當權(quán)益
近年來,生成式人工智能不斷進行顛覆式創(chuàng)新,在知識、技術與應用層面的發(fā)展勢如破竹。在積極推進生成式人工智能數(shù)據(jù)訓練創(chuàng)新發(fā)展的同時,應堅持科技以人為本,在科技創(chuàng)新活動中權(quán)衡效率與安全、利益與風險的價值沖突,兼顧維護多元主體權(quán)益。
第一,堅持以人為本,恪守生成式人工智能數(shù)據(jù)訓練服務于人的需要。作為數(shù)據(jù)主體、決策主體、勞動主體的數(shù)據(jù)用戶,在享受智慧便捷的數(shù)字生活中逐漸喪失了自主選擇權(quán)。因此,應堅持科技以人為本的理念,維護數(shù)據(jù)用戶的自主選擇權(quán),這是生成式人工智能數(shù)據(jù)訓練治理的基本導向。
第二,堅持公平公正,避免生成式人工智能數(shù)據(jù)訓練中的偏見、歧視或隱私侵權(quán)等問題。生成式人工智能始終是人類設計和控制的產(chǎn)品,盡管其數(shù)據(jù)訓練過程已經(jīng)從簡單的計算演進為機器自學習編碼,但其依然不具備自主自為性?;诖耍诓渴鹕墒饺斯ぶ悄軘?shù)據(jù)訓練時,要提高其透明性和可解釋性,特別要尊重用戶的隱私權(quán)、自決權(quán)等人格權(quán)利,保障用戶的算法解釋權(quán)充分實現(xiàn),讓用戶知道生成式人工智能是如何收集和使用他們的數(shù)據(jù)的,以及用戶應如何控制和保護自己的數(shù)據(jù)。在評估生成式人工智能數(shù)據(jù)訓練時,要考慮其對不同群體和利益相關者的影響,并及時糾正或改進數(shù)據(jù)訓練中存在的問題或缺陷。
第三,堅持公開透明,提高生成式人工智能數(shù)據(jù)訓練行為的可解釋性。生成式人工智能數(shù)據(jù)訓練的提供方與接受方在信息和技術上處于明顯的不對等地位,用戶無法了解數(shù)據(jù)訓練的運行規(guī)則,其中難免存在對接受方不公平的因素。自主學習與自我迭代使生成式人工智能數(shù)據(jù)訓練成為難以解釋的技術黑箱,由此引發(fā)問責的倫理難題。因此,應通過數(shù)據(jù)備案、數(shù)據(jù)風險評估、數(shù)據(jù)審查等方式使數(shù)據(jù)訓練透明可釋。
第四,堅持開放包容,加強生成式人工智能數(shù)據(jù)訓練過程及產(chǎn)業(yè)的國際合作。目前,各國針對生成式人工智能數(shù)據(jù)訓練仍未制定單獨的成文法,生成式人工智能的跨國性意味著國際合作至關重要,基于制度銜接與法律秩序穩(wěn)定性的考量,我國可以借鑒域外對文本與數(shù)據(jù)挖掘技術的法律規(guī)制。各國應加強數(shù)據(jù)訓練協(xié)同合作,通過制定國際標準和協(xié)議,更好地應對生成式人工智能數(shù)據(jù)訓練風險。
對生成式人工智能數(shù)據(jù)訓練的治理是一項復雜且長期的工程。《生成式人工智能服務管理暫行辦法》作為我國在新興領域的立法成果,體現(xiàn)了我國對新技術新應用規(guī)制的持續(xù)推進?!渡墒饺斯ぶ悄芊展芾頃盒修k法》第七條雖然為生成式人工智能服務提供者數(shù)據(jù)訓練指引了方向,但是仍存在制度設計上的不足,這就需要進一步明確生成式人工智能數(shù)據(jù)訓練的定位、定向與定則,夯實基本原則,健全相關制度規(guī)則及標準,優(yōu)化協(xié)同監(jiān)管架構(gòu)及方法,兼顧多元主體的正當權(quán)益,為生成式人工智能數(shù)據(jù)訓練提供可靠可信可行的法治保障,著實有效提升生成式人工智能創(chuàng)新發(fā)展的質(zhì)量。
(陳兵系南開大學競爭法研究中心主任、法學院副院長,傅小鷗系南開大學競爭法研究中心研究助理)
檢察機關提醒,盡早建立健全企業(yè)數(shù)據(jù)管理制度,嚴格數(shù)據(jù)訪問權(quán)限管理,加強對從業(yè)人員及離職人員管理,明確數(shù)據(jù)泄露應急響應流程。
中國的對外貿(mào)易結(jié)構(gòu)化高價值數(shù)據(jù),為什么國內(nèi)市場上沒有,反而可以在國際市場上買到?
胡文輝表示,調(diào)查顯示,2024年企業(yè)發(fā)明專利產(chǎn)業(yè)化率達到53.3%,創(chuàng)新成果加快向現(xiàn)實生產(chǎn)力轉(zhuǎn)化。
政策再提消費品以舊換新,家電終端零售有望實現(xiàn)量價齊升;加強數(shù)據(jù)安全保護相關政策出臺,行業(yè)市場規(guī)模有望增長;大飛機基礎研究聯(lián)合基金第一批項目指南發(fā)布。
自當年1月1日起累計向境外提供10萬人以上、不滿100萬人個人信息(不含敏感個人信息)或者不滿1萬人敏感個人信息。