分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2024-10-31 10:01:08 聽新聞
作者:科創(chuàng)Z世代 責(zé)編:秦妮
乘坐著自動(dòng)駕駛的汽車去上班,在單位使用人工智能助手畫圖、翻譯、整理會(huì)議紀(jì)要、制作PPT,下班前呼叫AI煮飯、啟動(dòng)洗衣機(jī)……這些曾經(jīng)科幻電影中才有的情節(jié)今天都變成了現(xiàn)實(shí),大模型和Agent智能體正為我們帶來(lái)前所未有的智能體驗(yàn)。
但是,你是否擔(dān)心過(guò),有一天自動(dòng)駕駛的汽車可能會(huì)突然擅自改變了路線、AI會(huì)在你的會(huì)議紀(jì)要中偷偷動(dòng)起了手腳,而你家里的所有電子設(shè)備也可能聯(lián)合起來(lái)一起罷工。
甚至有一天,你身邊的人工智能會(huì)像《流浪地球》中的智能量子計(jì)算機(jī)MOSS一樣,認(rèn)為“延續(xù)人類文明的唯一辦法就是毀滅人類”,而最終成為了你的敵人……
確保大模型和智能體能夠安全、可靠地按照人類的指令運(yùn)行,在今天已經(jīng)成為了越來(lái)越重要的事情,我們的主人公就是這樣一位每天在和大模型的安全打交道的人。
孫博文,1991年出生,螞蟻集團(tuán)可信AI“蟻天鑒”技術(shù)負(fù)責(zé)人、AI工程基礎(chǔ)設(shè)施總監(jiān),主要從事AI安全相關(guān)的技術(shù)研發(fā)。
孫博文
螞蟻集團(tuán)可信AI“蟻天鑒”技術(shù)負(fù)責(zé)人
AI工程基礎(chǔ)設(shè)施總監(jiān)
從機(jī)器人的身體到大腦
和很多男生一樣,孫博文在中學(xué)就對(duì)機(jī)械產(chǎn)生了濃厚的興趣,他被機(jī)器人的鋼鐵外殼深深吸引,于是選修了學(xué)校開辦的機(jī)器人編程課。在課堂上他學(xué)會(huì)了給機(jī)器人的大腦編寫程序,把識(shí)別到的信號(hào)變成機(jī)器人的運(yùn)行策略,讓機(jī)器人可以按照設(shè)定路線行走、避障。
在這個(gè)過(guò)程中他逐漸發(fā)現(xiàn),機(jī)器人有一個(gè)漂亮的外殼并不是最酷的,讓機(jī)器人能根據(jù)人的指令完成各種各樣的動(dòng)作才更厲害。從那時(shí)開始,他的興趣從機(jī)器人的身體變成了機(jī)器人的大腦。
在清華大學(xué)自動(dòng)化系的機(jī)器人實(shí)驗(yàn)室里,他了解了更多人工智能的知識(shí),并嘗試把它們應(yīng)用在傳感器技術(shù)和算法上。那段時(shí)間,人工智能領(lǐng)域發(fā)生了很多讓孫博文大受震撼的事情,比如在英國(guó)雷丁大學(xué)舉辦的一場(chǎng)圖靈測(cè)試中,計(jì)算機(jī)軟件第一次通過(guò)了測(cè)試,成功地讓人類相信它是一個(gè)13歲的男孩,這臺(tái)計(jì)算機(jī)也成為了有史以來(lái)第一個(gè)具有人類思考能力的人工智能設(shè)備。
而在之后當(dāng)阿爾法狗戰(zhàn)勝了圍棋世界冠軍李世石,從小就下圍棋的孫博文更加強(qiáng)烈地意識(shí)到人工智能如果都已經(jīng)可以在圍棋上戰(zhàn)勝人類,那么未來(lái)它一定有無(wú)數(shù)可以發(fā)展的領(lǐng)域。本科畢業(yè)后,帶著對(duì)人工智能的無(wú)限期待,他前往美國(guó)繼續(xù)學(xué)習(xí)計(jì)算機(jī)。
捍衛(wèi)自己的算法,我和面試官吵了一架
碩士畢業(yè)后,孫博文做出了回國(guó)的決定。當(dāng)時(shí)出行領(lǐng)域非?;鸨X得有很多事情可以做,自己手上又有一套可行的算法,他相信這套算法可以用來(lái)撮合乘客和司乘關(guān)系,比如規(guī)劃行車路徑怎么走會(huì)更快、讓用戶等車時(shí)間更短等等,最終實(shí)現(xiàn)運(yùn)力和用戶需求的匹配。
他打算帶著這套算法去一家出行企業(yè)的研究院尋找工作機(jī)會(huì)。前幾輪面試都還順利,但在最后一輪面試的時(shí)候,他卻和院長(zhǎng)因?yàn)閷?duì)算法的態(tài)度不同而發(fā)生了激烈的爭(zhēng)執(zhí)。
這次并不順利的面試沒(méi)有影響孫博文對(duì)自己算法的信心,他決定換個(gè)地方把它實(shí)現(xiàn)。最終他帶著算法加入了一家初創(chuàng)的出行公司,他的想法也在公司用戶的快速增長(zhǎng)中得到了印證,他努力捍衛(wèi)的算法得到了回報(bào)。
2020年,在這家初創(chuàng)公司事業(yè)上小有成就的孫博文,因?yàn)閻矍閺谋本﹣?lái)到了上海,加入了螞蟻金服團(tuán)隊(duì),而這一次,他覺得自己迫切需要挑戰(zhàn)的是人工智能飛速發(fā)展帶來(lái)的安全問(wèn)題。
打造大模型安全測(cè)評(píng)“智能體”,用魔法打敗魔法
ChatGPT引爆了新一輪AI浪潮,在人們期待大模型能夠?yàn)楦餍懈鳂I(yè)帶來(lái)顛覆性變革的同時(shí),也不得不承認(rèn),大模型創(chuàng)造了新機(jī)遇,但也帶來(lái)了新的安全風(fēng)險(xiǎn)。在支付寶,孫博文就負(fù)責(zé)大模型安全項(xiàng)目的技術(shù)研發(fā),目標(biāo)是確保人工智能系統(tǒng)在生成內(nèi)容時(shí)的準(zhǔn)確性和安全性。
他和團(tuán)隊(duì)的產(chǎn)品名叫“蟻天鑒”,它分為“蟻鑒”和“天鑒”兩部分,既能進(jìn)行大模型安全的智能檢測(cè),同時(shí)又對(duì)檢測(cè)出的風(fēng)險(xiǎn)做出防御。這個(gè)“智能體”檢測(cè)平臺(tái)提供全流程自動(dòng)化的安全測(cè)評(píng)工具,同時(shí)還能給大模型拍X光,針對(duì)大模型的內(nèi)在神經(jīng)元進(jìn)行X光掃描來(lái)做探查和判斷,定位可能引發(fā)風(fēng)險(xiǎn)的神經(jīng)元,并進(jìn)行編輯修正。這個(gè)過(guò)程也被我們戲稱為“用魔法打敗魔法”。
在日常的研發(fā)過(guò)程中,孫博文和他的團(tuán)隊(duì)像打游戲一樣,用紅藍(lán)攻防模式來(lái)提升大模型的安全性。紅隊(duì)負(fù)責(zé)構(gòu)造攻擊場(chǎng)景、模擬攻擊手段,藍(lán)隊(duì)則負(fù)責(zé)防御和修復(fù)漏洞。孫博文笑著告訴我們,攻防缺一不可,只有這種以攻促防的不斷博弈,攻防雙方才都會(huì)成長(zhǎng)起來(lái)。
做一個(gè)清醒的“淡人”
隨著大模型的興起,AI能夠處理越來(lái)越復(fù)雜、越來(lái)越廣泛的任務(wù),它不再局限于某一個(gè)特定領(lǐng)域,醫(yī)療、教育、金融、娛樂(lè)等多個(gè)行業(yè)都希望能在大模型的加持下加速實(shí)現(xiàn)自己行業(yè)的迭代升級(jí)。
同時(shí),隨著“百模大戰(zhàn)”后大模型價(jià)格戰(zhàn)燃起,大模型團(tuán)隊(duì)也在面臨更激烈的競(jìng)爭(zhēng)。在孫博文眼中,這正是一個(gè)“蓬勃而又混亂”的AI時(shí)代。而在兩個(gè)多小時(shí)的采訪中,我們發(fā)現(xiàn)身處在這種“蓬勃而又混亂”中的孫博文,卻是一個(gè)名副其實(shí)的“淡人”。他始終都在淡淡地講述,淡淡地回憶,即使在談到過(guò)去幾年技術(shù)上遇到的驚濤駭浪時(shí),他也一直保持著淡淡的笑容。
孫博文說(shuō),AI安全這個(gè)表面風(fēng)平浪靜、實(shí)則危機(jī)四伏的行業(yè)適合自己,也鍛煉了自己。這個(gè)領(lǐng)域未來(lái)涉及面會(huì)更廣、技術(shù)迭代會(huì)更快,很多人可能覺得目前的安全評(píng)測(cè)機(jī)制相對(duì)落后于技術(shù)本身的發(fā)展,但事實(shí)上,先生長(zhǎng)再抑制它的問(wèn)題,是很多科技創(chuàng)新領(lǐng)域都會(huì)遇到的正?,F(xiàn)象。
現(xiàn)在,不論是政府還是企業(yè)都在越來(lái)越重視AI包括大模型和智能體帶來(lái)的安全問(wèn)題。2023年國(guó)家網(wǎng)信辦已經(jīng)發(fā)布意見稿,進(jìn)一步規(guī)范生成式人工智能的發(fā)展,讓大家既能用上AIGC的能力,又讓它安全可控,各個(gè)部門都在嘗試把安全防控盡量往前置去做,也正因?yàn)槿绱耍麑?duì)用魔法打敗魔法始終充滿了信心。
騰訊云大模型知識(shí)引擎已率先接入MCP,拓展AI應(yīng)用邊界;阿里通義萬(wàn)相開源首尾幀生視頻模型。
民營(yíng)經(jīng)濟(jì)是推動(dòng)上海城市發(fā)展的重要力量和經(jīng)濟(jì)增長(zhǎng)的重要引擎。
科創(chuàng)板ETF凈值表現(xiàn)已經(jīng)有分化跡象。
在安全領(lǐng)域,深信服安全大模型可24小時(shí)不間斷工作,將需要多次手動(dòng)操作的安全運(yùn)營(yíng)工作量減少了92%。
①M(fèi)eta發(fā)布人工智能新模型系列Llama 4;②微軟公布基于Muse AI生成的《Quake II》游戲技術(shù)演示DEMO;③廣西高速公路啟用AI治理?yè)矶隆?/p>