分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2025-04-06 11:26:38 聽(tīng)新聞
作者:錢(qián)童心 責(zé)編:李娜
當(dāng)?shù)貢r(shí)間4月5日,Meta公司發(fā)布了最新的開(kāi)源人工智能軟件Llama 4的首批大模型版本Llama 4 Scout和Llama 4 Maverick。這也是該公司迄今為止最強(qiáng)大的兩款A(yù)I大型語(yǔ)言模型(LLM)。
不過(guò)Meta表示,更強(qiáng)大的一款被命名為L(zhǎng)lama 4 Behemoth的大模型仍在訓(xùn)練中,該模型將在Meta的混合專(zhuān)家模型(MoE)架構(gòu)中充當(dāng)“新模型的老師”。
這也是Meta基于Llama軟件首次采用的MoE模型架構(gòu)。在MoE模型中,單個(gè)token僅激活總參數(shù)的一部分。Meta表示,MoE架構(gòu)在訓(xùn)練和推理時(shí)計(jì)算效率更高,在固定訓(xùn)練FLOPs預(yù)算下,相比密集模型提供更高的質(zhì)量。
以Llama 4 Maverick模型為例,該模型擁有170億激活參數(shù)和4000億總參數(shù)。Meta采用交替的密集層和混合專(zhuān)家(MoE)層來(lái)提高推理效率。在這種方式下,盡管所有參數(shù)都存儲(chǔ)在內(nèi)存中,但在服務(wù)這些模型時(shí),只有總參數(shù)的一部分被激活。
Meta最新大模型的發(fā)布也意味著科技巨頭在生成式人工智能大潮中的投資競(jìng)賽進(jìn)一步升級(jí)。此前有報(bào)道稱(chēng),Meta推遲了大模型最新版本的發(fā)布,因?yàn)樵陂_(kāi)發(fā)過(guò)程中,Llama 4 在技術(shù)基準(zhǔn)方面沒(méi)有達(dá)到Meta的期望,特別是在推理和數(shù)學(xué)任務(wù)方面。
“我們的目標(biāo)是打造世界領(lǐng)先的人工智能,將其開(kāi)源,并使其普遍可用,讓世界上的每個(gè)人都能從中受益。”Meta公司創(chuàng)始人CEO馬克·扎克伯格在Instagtam上的一段視頻中說(shuō)道,“我認(rèn)為開(kāi)源人工智能軟件將構(gòu)建出領(lǐng)先的模型,而隨著Llama 4的出現(xiàn),這種情況開(kāi)始發(fā)生了。”
谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)也在社交媒體上就Llama最新模型的發(fā)布表示祝賀。他說(shuō)道:“人工智能的世界永遠(yuǎn)不會(huì)無(wú)聊!祝賀Llama團(tuán)隊(duì),繼續(xù)前進(jìn)!”
此外,Meta將于4月29日舉辦首屆LlamaCon AI大會(huì)。該公司預(yù)計(jì)還將在今年第二季度推出Meta AI聊天機(jī)器人的獨(dú)立應(yīng)用程序。
Meta公司首席產(chǎn)品官Chris Cox上個(gè)月表示,Llama 4將推動(dòng)AI智能體(AI Agent)的發(fā)展,使其具備更高水平的推理和行動(dòng)能力。這些AI智能體將能上網(wǎng)并處理大量對(duì)消費(fèi)者和企業(yè)有用的任務(wù)。
與此同時(shí),Meta正在對(duì)AI基礎(chǔ)設(shè)施進(jìn)行大量投入。該公司計(jì)劃今年斥資650億美元擴(kuò)建AI基礎(chǔ)設(shè)施,其中可能包括一個(gè)耗資近10億美元在美國(guó)威斯康星州中部建立的數(shù)據(jù)中心項(xiàng)目。
不過(guò),就在Meta新模型發(fā)布之前,該公司人工智能研究主管喬爾·皮諾(Joelle Pineau)上周宣布離職。皮諾是Meta公司的頂尖人工智能研究人員之一,自2023年以來(lái)一直領(lǐng)導(dǎo)該公司的基礎(chǔ)人工智能研究部門(mén)(FAIR),負(fù)責(zé)公司的前沿計(jì)算機(jī)科學(xué)相關(guān)研究,包括Meta的開(kāi)源Llama系列AI模型和其他技術(shù)。
專(zhuān)家建議需重視既懂產(chǎn)業(yè)又懂AI技術(shù)的復(fù)合型人才培養(yǎng)
歐盟反壟斷監(jiān)管機(jī)構(gòu)對(duì)蘋(píng)果公司開(kāi)出5億歐元罰單,并對(duì)Meta公司開(kāi)出2億歐元罰單。
①高盛預(yù)計(jì)今年美國(guó)逼近零增長(zhǎng) 通脹大幅走高 對(duì)美元非常悲觀;②銷(xiāo)售業(yè)績(jī)不及預(yù)期 奢侈品行業(yè)領(lǐng)頭羊LVMH跌近8%;③Meta反壟斷案開(kāi)庭 收入引擎Instagram和WhatsApp面臨分拆風(fēng)險(xiǎn)。
OpenAI創(chuàng)始人Sam Altman:將在幾周內(nèi)發(fā)布o(jì)3、o4-MINI;谷歌宣布一個(gè)新的實(shí)驗(yàn)性人工智能模型Sec-Gemini V1。
“應(yīng)用為王”這一理念在大模型技術(shù)發(fā)展與落地中尤為重要,已經(jīng)成為產(chǎn)業(yè)界、企業(yè)界最迫切解決的一個(gè)課題。