分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
大家好!我是來自復(fù)旦大學(xué)計算機學(xué)院的張奇。
從事人工智能領(lǐng)域的研究20年?;叵肫?022年11月,Chatgpt猶如一顆璀璨的新星橫空出世,瞬間讓大模型和通用人工智能成為大眾關(guān)注的焦點。大模型如今的發(fā)展勢頭可謂極其迅猛,這也使得不少人產(chǎn)生一種錯覺,仿佛通用人工智能在短短幾年內(nèi)就能成為現(xiàn)實。然而,通用人工智能究竟距離人類還有多久呢?人類要怎樣準(zhǔn)備迎接?今天,我就圍繞這個話題,從通用人工智能實際進(jìn)化方向和程度,及其為人類在科技進(jìn)步、學(xué)習(xí)就業(yè)、科學(xué)倫理方面產(chǎn)生的影響,這兩方面分享我的見解與思考。
首先,明確一下通用人工智能,其英文是 artificial General Intelligence,簡稱 AGI。自 1956 年人工智能這個名詞誕生起,它就成為了人工智能領(lǐng)域始終不懈追求的終極目標(biāo)。
從名字看通用人工智能意味著擁有如同人類一樣的認(rèn)知能力,是可以處置多種類別任務(wù)的人工智能體系。這和以往那些專注于單一特定任務(wù),像是語音識別、圖像分類之類的狹義人工智能大不一樣。AGI 能夠去理解、去學(xué)習(xí),并且能在形形色色的領(lǐng)域以及任務(wù)情境當(dāng)中展開推理,進(jìn)而解決問題。
通用人工智能所設(shè)定的目標(biāo)極為宏大,其愿景是能夠完全取代人類所從事的所有腦力勞動。然而,如此宏偉的目標(biāo)并非一蹴而就,必然要經(jīng)歷一個漫長且復(fù)雜的發(fā)展過程。雖然人工智能的發(fā)展進(jìn)程并不完全與人類的認(rèn)知能力發(fā)展軌跡相契合。但當(dāng)下,已經(jīng)有大量的相關(guān)工作逐步開展起來了。
比如 2024 年眾多手機廠商紛紛推出了具備一定程度自主決策能力的手機。這些手機能夠依據(jù)用戶所下達(dá)的指令,在多個APP之間自如切換,并且可以根據(jù)用戶的具體要求,自主地對界面內(nèi)容進(jìn)行分析,進(jìn)而完成諸如搜索、點選等操作,甚至在某些情況下還能夠直接替用戶下單??梢韵胂螅痪弥笪覀兓蛟S就能夠直接通過語音控制手機,輕松地讓它幫我們完成訂外賣、修改各種APP中的設(shè)置等一系列操作,這無疑將為用戶帶來極大的便利。
有了上述簡單的基礎(chǔ)分析之后,接下來我們回到這次的核心問題,通用人工智能距離我們還有多遠(yuǎn)?當(dāng)前,大模型普遍被認(rèn)為是實現(xiàn)AGI最有可能的道路,也是目前絕大部分公司和研究人員所走的道路。那么大模型真的是實現(xiàn) AGI 的必由之路嗎?
當(dāng)下大模型的推理能力究竟處于怎樣的一個水平呢?我們注意到了幾個具有代表性的實驗以及相關(guān)現(xiàn)象。
蘋果AI研究院,近期采用了和我們類似的思路,針對小學(xué)應(yīng)用題開展了相關(guān)測試。比如,原題是 “小明在星期五摘了44個獼猴桃,然后在星期六摘了58個獼猴桃,星期天,他摘的獼猴桃數(shù)量是星期五的兩倍。小明一共摘了多少個獼猴桃?” 而蘋果AI研究院的研究人員在這道題目的最后增加了一個與題目原本計算并無直接關(guān)聯(lián),但是又包含數(shù)字的問題,比如 “但其中 5 個比平均大小要小”。在面對這樣經(jīng)過修改的題目時,GPT O1 模型的分?jǐn)?shù)下降了18分,其他模型在這種情況下分?jǐn)?shù)下降得更為嚴(yán)重,有的模型甚至下降了 60 分。
不難發(fā)現(xiàn)就目前的情況來看,大模型似乎尚未真正地理解各個知識點,或者說至少還沒有能夠做到對知識點進(jìn)行靈活自如地運用。
現(xiàn)階段,大模型所采用的是純數(shù)據(jù)驅(qū)動的學(xué)習(xí)方式。這種學(xué)習(xí)方式倘若不加以改變,那么它將很難真正學(xué)習(xí)到因果邏輯。要知道,構(gòu)建不了因果邏輯,也就很難完成真正意義上的推理。就拿在大數(shù)據(jù)分析領(lǐng)域經(jīng)常被提及的一個經(jīng)典問題來說吧,在網(wǎng)上小超市商品購買的情境下,從銷售數(shù)據(jù)上我們會發(fā)現(xiàn)一個有趣的現(xiàn)象,那就是小孩子尿布和啤酒這兩種商品經(jīng)常會一起出現(xiàn)在顧客的購物清單當(dāng)中。并且,如果我們將尿布的陳列位置和啤酒的陳列位置擺放得較為靠近,啤酒的銷量還會進(jìn)一步增加。實際上,這是因為在小超市購買尿布的情況大多是應(yīng)急性使用,而前來購買尿布的更多的是男人,所以他們在購買尿布的同時,順道購買一瓶啤酒的概率就會很高。然而,像這樣的因果邏輯關(guān)系,僅僅通過數(shù)據(jù)是很難被學(xué)習(xí)到的。
盡管如此,現(xiàn)階段的大模型也已經(jīng)展現(xiàn)出了很多此前小模型所沒有的能力,包括長上下文建模、多任務(wù)學(xué)習(xí)、跨語言遷移以及文本生成等能力。 這些能力都是之前小模型所不具備的,倘若能夠充分利用好這些能力,同樣可以發(fā)揮出非常不錯的作用。例如,現(xiàn)在的AI搜索就完整地利用了上述大模型所具備的這些能力,它能夠高效地幫助我們解決以往在搜索結(jié)果中需要我們自己仔細(xì)閱讀大量內(nèi)容才能解決的問題。所以說,根據(jù)大模型所已經(jīng)驗證過的能力,去積極探尋與之匹配的應(yīng)用場景,也是當(dāng)下一個極為重要的發(fā)展方向。
但是我自己覺得僅靠加大模型參數(shù)量,使用更多的數(shù)據(jù),很難達(dá)到解決人類水平問題的AGI系統(tǒng)。需要進(jìn)一步考慮如何使得AI系統(tǒng)具備真正的推理能力,這不僅僅是參數(shù)量和數(shù)據(jù)量的問題,更多的是如何設(shè)計模型架構(gòu),訓(xùn)練方法以及人工智能理論上的突破,而這個時間很難預(yù)估。可能明天出現(xiàn)了新的人工智能理論,1個月就可以實現(xiàn) Level5能力的AGI系統(tǒng),也可能我們沿著大模型的道路走了10年也無法真正達(dá)到 Level2 水平的AGI系統(tǒng)。 這需要更多更基礎(chǔ)性的研究。
接下來我想通過梳理AGI或者AI給人類社會帶來哪些影響,聊聊人類又該如何接招呢?
第一個思考:無法分割。
無法否認(rèn) AI 已然悄無聲息地融入了我們的日常生活,成為其中不可或缺的一部分。就拿日常使用的輸入法來說吧。早期的拼音輸入法十分機械、 刻板,每次輸入拼音,呈現(xiàn)字詞的順序固定不變,全然不顧此前輸入的內(nèi)容,這極大限制了輸入效率,打字速度慢得讓人著急。隨著計算機運算速度的不斷提升,研究人員開始將語言模型開始引入輸入法。它能依據(jù)用戶此前輸入的文字,精準(zhǔn)預(yù)測當(dāng)下要打出字的概率,把最復(fù)合的詞語優(yōu)先推送出來,極大地提高了輸入速度,現(xiàn)在的拼音輸入法使得我們幾乎不需要對文字進(jìn)行選擇,僅輸入拼音串就可以完成文字輸入。再比如我們使用的搜索引擎,我說的不是現(xiàn)在的AI搜索,而是傳統(tǒng)搜索,我們每次輸入關(guān)鍵詞,背后有超過 200 個模型從各個層面協(xié)同工作,為我們找到最相關(guān)的文檔。再比如我們?nèi)粘g覽的短視頻、新聞、外賣等 APP,也都使用了大量AI技術(shù),支撐產(chǎn)品服務(wù)。但是,這些 AI 技術(shù)都隱藏在產(chǎn)品的背后,大眾并不容易直接感知到。
第二個思考:事實偏差。
AI 技術(shù)也宛如一把雙刃劍,在為我們帶來巨大效率提升與優(yōu)質(zhì)服務(wù)時,也裹挾著一系列潛在問題。AI 能夠依據(jù)所學(xué)到的大量知識和模式快速生成文本、圖像等各類內(nèi)容,其表述往往看似合理且頗具邏輯性。比如生成一篇新聞報道或?qū)W術(shù)論文片段,初看可能很難發(fā)現(xiàn)其中的不實之處。但AI可能存在對知識理解不夠深入準(zhǔn)確的情況,或者因數(shù)據(jù)偏差等原因編造出不符合事實的內(nèi)容。而且,由于其生成速度快、產(chǎn)量大,在缺乏嚴(yán)格審核機 制的情況下,就很容易讓大量真假混雜的內(nèi)容流入網(wǎng)絡(luò)等傳播渠道,進(jìn)而誤導(dǎo)讀者、干擾正常的信息獲取與判斷,給人們在辨別信息真實性上增加了不小的難度。
思考三:興趣繭房。
AI 驅(qū)動的個性化推薦系統(tǒng)無處不在,社交APP們依據(jù)用戶過往瀏覽偏好、點贊評論行為,精準(zhǔn)推送契合個人喜好的內(nèi)容。長此以往,用戶仿若置身于一間無形的“繭房”之中,目光所及皆是熟悉、認(rèn)同的信息,難以接觸多元觀點與異質(zhì)思維。人們不自覺地被困在思維定勢里,對復(fù)雜現(xiàn)實的認(rèn)知越發(fā)片面,偏見越發(fā)根深蒂固,進(jìn)而在重大議題上判斷失誤,加劇社會群體間的認(rèn)知隔閡與分歧。比如,關(guān)注娛樂八卦的用戶,頁面會被海量明星資訊填滿,無暇顧及科技前沿、民生百態(tài);熱衷某類偏激觀點的受眾,持續(xù)接收同類信息,越發(fā)篤定自身立場,不愿換位思考、理性探討,致使社會輿論環(huán)境越發(fā)浮躁、極端,給公共理性討論空間帶來擠壓。“新型信息繭房”正悄然筑起。
當(dāng)然解決這些問題,絕非單一主體能夠解決,而是迫切需要法律層面筑牢根基、企業(yè)主動擔(dān)當(dāng)、政府有力引導(dǎo)、個人積極適應(yīng),凝聚全社會之力,協(xié)同尋求破局之策。
最后說說人類要如何應(yīng)對呢?
大模型的發(fā)展速度著實驚人,其迅猛程度甚至讓我這個在人工智能領(lǐng)域工作了20年的從業(yè)者都深感焦慮與巨大壓力?;仡櫷?,人工智能的發(fā)展原本就在逐年加速,然而之前的模型往往只能解決單一的特定問題,所以每當(dāng)一種新算法問世,便能夠開拓出眾多嶄新的研究方向。但如今的大模型卻截然不同,其具備多任務(wù)處理和多語言交互的特性,這使得原本需要幾十個不同任務(wù)模型和研究方向的工作,如今都能夠整合到一個大模型的研究框架之中。不僅如此,大模型的研究對資金的需求極為龐大,相較于以往,其所需資金常常是過去的數(shù)百倍之多。一個千億模型完成一次訓(xùn)練需要花費近千萬的費用。在這樣激烈的競爭環(huán)境下,如果研發(fā)速度稍有遲緩,就極有可能陷入落后的困境,進(jìn)而陷入惡性循環(huán)難以自拔。
就拿2022年11月 ChatGPT 的橫空出世來說,在其后的半年時間里,我們整個實驗室?guī)缀跞珕T處于每周7天、每天14個小時連軸轉(zhuǎn)的高強度工作狀態(tài)。不過,辛勤的付出也換來了相應(yīng)的回報,復(fù)旦自然語言處理實驗室相繼成功發(fā)布了 MOSS 以及多模態(tài)模式模型等成果,同時還推出了許多關(guān)鍵技術(shù)。但是回顧整個過程,其實大模型的發(fā)展也對人工智能研究界產(chǎn)生了巨大的影響,很多原來的研究方向已經(jīng)消失或者不再重要,大量的低能力水平人工智能研究員面臨淘汰,大模型最直接最快速影響到的崗位其實是我們?nèi)斯ぶ悄艿难芯繂T。
所以即便是我們這樣的行業(yè)從業(yè)者,也必須以積極的心態(tài)面對,擁抱它,接受它,使用它。
大模型在很多領(lǐng)域也彰顯出其強大的影響力與巨大潛力。在客服領(lǐng)域,其替代率從過去的60%大幅躍升至80%。在編程領(lǐng)域,工作效率普遍提升了 20%左右,對于一些簡單常見的編程任務(wù),效率提升幅度甚至能夠達(dá)到 40%。而這些顯著的變化僅僅發(fā)生在短短一年內(nèi)。我今天的分享也是在書寫完初稿之后,使用大模型進(jìn)行了潤色和修改,我覺得整體上節(jié)省了我超過 2 天的時間。再以圖像生成領(lǐng)域為例,如果我們將現(xiàn)在的模型與2023年底的模型進(jìn)行對比,就會由衷地驚嘆于圖像質(zhì)量提升的速度之快。然而,這些技術(shù)的飛速進(jìn)步也不可避免地導(dǎo)致了許多崗位數(shù)量的減少。例如,隨著大模型強大的多語言回答能力的出現(xiàn),小語種崗位的人力需求在短時間內(nèi)迅速萎縮。從短期來看,美工、客服、程序員等,以及算法研究員崗位都存在大幅度減少的可能性;從長遠(yuǎn)視角出發(fā),當(dāng)前人們從事的工作中可以被自動化技術(shù)所涵蓋的部分,都極有可能被AI逐步替代。
這一嚴(yán)峻的形勢無疑對我們提出了更高的要求,促使我們必須努力提升自身的能力,以便能夠勝任那些需要更高技能水平與深度思考的工作,而不是僅僅局限于簡單的文字整理、數(shù)據(jù)收集等基礎(chǔ)工作。
其實我想要著重倡導(dǎo)的是,我們務(wù)必積極主動地?fù)肀?AI。無論 AGI 是否會在短期內(nèi)得以實現(xiàn),AI 早已悄無聲息地滲透進(jìn)我們生活的方方面面。唯有不斷提升自我能力,更加積極地將自身工作與新技術(shù)深度融合,通過提升工作效率、持續(xù)不斷學(xué)習(xí)新知識,才能夠在工作中不斷取得進(jìn)步,從而在 AI 浪潮洶涌澎湃的時代中站穩(wěn)腳跟,實現(xiàn)個人與社會的協(xié)同發(fā)展。
謝謝大家,我在第一財經(jīng)一財號等你。
此為第一財經(jīng)一財號2024“年度財經(jīng)思想者”盛典上年度行業(yè)新銳演說原稿。
(本文內(nèi)容僅代表作者本人觀點)
合力投資張敏:人工智能一定會出現(xiàn)萬億甚至10萬億級的公司