分享到微信打開微信,點擊底部的“發(fā)現”, |
乘坐著自動駕駛的汽車去上班,在單位使用人工智能助手畫圖、翻譯、整理會議紀要、制作PPT,下班前呼叫AI煮飯、啟動洗衣機……這些曾經科幻電影中才有的情節(jié)今天都變成了現實,大模型和Agent智能體正為我們帶來前所未有的智能體驗。
但是,你是否擔心過,有一天自動駕駛的汽車可能會突然擅自改變了路線、AI會在你的會議紀要中偷偷動起了手腳,而你家里的所有電子設備也可能聯合起來一起罷工。
甚至有一天,你身邊的人工智能會像《流浪地球》中的智能量子計算機MOSS一樣,認為“延續(xù)人類文明的唯一辦法就是毀滅人類”,而最終成為了你的敵人……
確保大模型和智能體能夠安全、可靠地按照人類的指令運行,在今天已經成為了越來越重要的事情,我們的主人公就是這樣一位每天在和大模型的安全打交道的人。
孫博文,1991年出生,螞蟻集團可信AI“蟻天鑒”技術負責人、AI工程基礎設施總監(jiān),主要從事AI安全相關的技術研發(fā)。
孫博文
螞蟻集團可信AI“蟻天鑒”技術負責人
AI工程基礎設施總監(jiān)
從機器人的身體到大腦
和很多男生一樣,孫博文在中學就對機械產生了濃厚的興趣,他被機器人的鋼鐵外殼深深吸引,于是選修了學校開辦的機器人編程課。在課堂上他學會了給機器人的大腦編寫程序,把識別到的信號變成機器人的運行策略,讓機器人可以按照設定路線行走、避障。
在這個過程中他逐漸發(fā)現,機器人有一個漂亮的外殼并不是最酷的,讓機器人能根據人的指令完成各種各樣的動作才更厲害。從那時開始,他的興趣從機器人的身體變成了機器人的大腦。
在清華大學自動化系的機器人實驗室里,他了解了更多人工智能的知識,并嘗試把它們應用在傳感器技術和算法上。那段時間,人工智能領域發(fā)生了很多讓孫博文大受震撼的事情,比如在英國雷丁大學舉辦的一場圖靈測試中,計算機軟件第一次通過了測試,成功地讓人類相信它是一個13歲的男孩,這臺計算機也成為了有史以來第一個具有人類思考能力的人工智能設備。
而在之后當阿爾法狗戰(zhàn)勝了圍棋世界冠軍李世石,從小就下圍棋的孫博文更加強烈地意識到人工智能如果都已經可以在圍棋上戰(zhàn)勝人類,那么未來它一定有無數可以發(fā)展的領域。本科畢業(yè)后,帶著對人工智能的無限期待,他前往美國繼續(xù)學習計算機。
捍衛(wèi)自己的算法,我和面試官吵了一架
碩士畢業(yè)后,孫博文做出了回國的決定。當時出行領域非?;鸨X得有很多事情可以做,自己手上又有一套可行的算法,他相信這套算法可以用來撮合乘客和司乘關系,比如規(guī)劃行車路徑怎么走會更快、讓用戶等車時間更短等等,最終實現運力和用戶需求的匹配。
他打算帶著這套算法去一家出行企業(yè)的研究院尋找工作機會。前幾輪面試都還順利,但在最后一輪面試的時候,他卻和院長因為對算法的態(tài)度不同而發(fā)生了激烈的爭執(zhí)。
這次并不順利的面試沒有影響孫博文對自己算法的信心,他決定換個地方把它實現。最終他帶著算法加入了一家初創(chuàng)的出行公司,他的想法也在公司用戶的快速增長中得到了印證,他努力捍衛(wèi)的算法得到了回報。
2020年,在這家初創(chuàng)公司事業(yè)上小有成就的孫博文,因為愛情從北京來到了上海,加入了螞蟻金服團隊,而這一次,他覺得自己迫切需要挑戰(zhàn)的是人工智能飛速發(fā)展帶來的安全問題。
打造大模型安全測評“智能體”,用魔法打敗魔法
ChatGPT引爆了新一輪AI浪潮,在人們期待大模型能夠為各行各業(yè)帶來顛覆性變革的同時,也不得不承認,大模型創(chuàng)造了新機遇,但也帶來了新的安全風險。在支付寶,孫博文就負責大模型安全項目的技術研發(fā),目標是確保人工智能系統(tǒng)在生成內容時的準確性和安全性。
他和團隊的產品名叫“蟻天鑒”,它分為“蟻鑒”和“天鑒”兩部分,既能進行大模型安全的智能檢測,同時又對檢測出的風險做出防御。這個“智能體”檢測平臺提供全流程自動化的安全測評工具,同時還能給大模型拍X光,針對大模型的內在神經元進行X光掃描來做探查和判斷,定位可能引發(fā)風險的神經元,并進行編輯修正。這個過程也被我們戲稱為“用魔法打敗魔法”。
在日常的研發(fā)過程中,孫博文和他的團隊像打游戲一樣,用紅藍攻防模式來提升大模型的安全性。紅隊負責構造攻擊場景、模擬攻擊手段,藍隊則負責防御和修復漏洞。孫博文笑著告訴我們,攻防缺一不可,只有這種以攻促防的不斷博弈,攻防雙方才都會成長起來。
做一個清醒的“淡人”
隨著大模型的興起,AI能夠處理越來越復雜、越來越廣泛的任務,它不再局限于某一個特定領域,醫(yī)療、教育、金融、娛樂等多個行業(yè)都希望能在大模型的加持下加速實現自己行業(yè)的迭代升級。
同時,隨著“百模大戰(zhàn)”后大模型價格戰(zhàn)燃起,大模型團隊也在面臨更激烈的競爭。在孫博文眼中,這正是一個“蓬勃而又混亂”的AI時代。而在兩個多小時的采訪中,我們發(fā)現身處在這種“蓬勃而又混亂”中的孫博文,卻是一個名副其實的“淡人”。他始終都在淡淡地講述,淡淡地回憶,即使在談到過去幾年技術上遇到的驚濤駭浪時,他也一直保持著淡淡的笑容。
孫博文說,AI安全這個表面風平浪靜、實則危機四伏的行業(yè)適合自己,也鍛煉了自己。這個領域未來涉及面會更廣、技術迭代會更快,很多人可能覺得目前的安全評測機制相對落后于技術本身的發(fā)展,但事實上,先生長再抑制它的問題,是很多科技創(chuàng)新領域都會遇到的正?,F象。
現在,不論是政府還是企業(yè)都在越來越重視AI包括大模型和智能體帶來的安全問題。2023年國家網信辦已經發(fā)布意見稿,進一步規(guī)范生成式人工智能的發(fā)展,讓大家既能用上AIGC的能力,又讓它安全可控,各個部門都在嘗試把安全防控盡量往前置去做,也正因為如此,他對用魔法打敗魔法始終充滿了信心。
以廣州金控母基金為首的8家創(chuàng)投機構將近2億元真金白銀的投入,也體現了國資在推動科技成果轉化方面的帶頭作用,帶動了社會資本對于科技成果轉化的積極投入。
已超額完成5億元首關目標,明年將完成二關目標,實現首期總規(guī)模10億元。
上交所公告上證50、上證180、上證380等指數定期調整結果
相比于2021年百強榜單,山東、浙江、廣東、湖北、河北、福建等地入榜城市數量增加。其中,山東表現突出,新入榜3個城市。