分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2025-02-01 10:50:18 聽(tīng)新聞
作者:鄭栩彤 責(zé)編:寧佳彥
當(dāng)?shù)貢r(shí)間1月31日,OpenAI宣布推出新一代推理模型o3系列的mini版本。據(jù)OpenAI介紹,o3-mini是其最具成本效益的推理模型,在科學(xué)、數(shù)學(xué)、編程等領(lǐng)域的能力較強(qiáng),同時(shí)兼具o1-mini的低成本和低延遲特點(diǎn),o3-mini可與聯(lián)網(wǎng)搜索功能搭配使用,不過(guò)o3-mini還不支持視覺(jué)功能。
“o3-mini的能力可設(shè)置為低等、中等、高等。能力設(shè)置為中等的o3-mini與o1在數(shù)學(xué)、編程和科學(xué)方面的表現(xiàn)相當(dāng),但反應(yīng)速度更快。專家測(cè)試人員的評(píng)估表明,o3-mini給出的答案比o1-mini更準(zhǔn)確且清晰。測(cè)試者觀察到,在有關(guān)現(xiàn)實(shí)世界的難題上,o3-mini的主要錯(cuò)誤減少了39%。”OpenAI表示。
從能力上看,作為mini版本,o3-mini在一些測(cè)試中的表現(xiàn)略超o1。在數(shù)學(xué)測(cè)試AIME 2024、博士水平測(cè)試GPQA Diamond、競(jìng)賽編碼測(cè)試Codeforces、軟件工程測(cè)試sw -bench中,o3-mini得分分別為87.3、79.7、2130、49.3,高于o1的得分83.3、78、1891、48.9。
此外,o3-mini在編碼測(cè)試LiveBench中表現(xiàn)優(yōu)于o1,在一般知識(shí)測(cè)試General knowledge中表現(xiàn)優(yōu)于o1-mini。從速度上看,o3-mini在A/B測(cè)試(一種對(duì)比測(cè)試)中的平均響應(yīng)時(shí)間為7.7秒,響應(yīng)速度比o1-mini快24%。
此前國(guó)內(nèi)大模型公司DeepSeek發(fā)布DeepSeek-R1,并稱該模型性能對(duì)標(biāo)OpenAI o1正式版,該模型不僅開(kāi)源,API(接口)價(jià)格還明顯低于o1。DeepSeek-R1輸入(緩存命中)、輸出定價(jià)分別為每百萬(wàn)tokens1元、6元,低于o1的55元、438元?;蚴瞧扔趬毫?,OpenAI CEO山姆·奧爾特曼(Sam Altman)在當(dāng)?shù)貢r(shí)間1月23日宣布,OpenAI將推出新一代o3系列的o3-mini版本,且ChatGPT免費(fèi)用戶將能使用o3-mini。
此次OpenAI正式推出o3-mini后,OpenAI再次強(qiáng)調(diào),ChatGPT是首次向免費(fèi)用戶提供推理模型,用戶可以在消息編輯器中選擇“Reason”來(lái)嘗試使用OpenAI 3-mini。不過(guò),付費(fèi)用戶的使用范圍更廣,可以使用o3-mini的高等能力。ChatGPT Plus和Team用戶的流量限制從01 -mini的每日50條增加到03 -mini的每日150條,Pro用戶則可以無(wú)限制地使用o3-mini。
OpenAI也在提供越來(lái)越低的API調(diào)用價(jià)格,據(jù)其介紹,自GPT-4推出以來(lái),每個(gè)token的定價(jià)下降了95%。o3-mini輸入(緩存命中)、輸出每百萬(wàn)tokens的定價(jià)為0.55美元、4.4美元,仍高于DeepSeek-R1。
雖然DeepSeek并未公開(kāi)DeepSeek-R1的訓(xùn)練成本,但此前DeepSeek公開(kāi)了另一個(gè)模型DeepSeek-v3的訓(xùn)練預(yù)算為“2048個(gè)GPU、2個(gè)月、近600萬(wàn)美元”,外界認(rèn)為DeepSeek-R1在能力對(duì)標(biāo)o1的同時(shí),訓(xùn)練成本可能也偏低,這可能意味著DeepSeek團(tuán)隊(duì)的技術(shù)水平較高。隨著DeepSeek近期受到關(guān)注,OpenAI客觀上也承受了一定壓力。
OpenAI正在采取措施維持自身的優(yōu)勢(shì),除了推出o3-mini“應(yīng)戰(zhàn)”,近日還有消息稱,OpenAI正在就新一輪融資進(jìn)行談判,擬籌資金額高達(dá) 400 億美元,該輪融資將由軟銀集團(tuán)牽頭,使OpenAI的估值達(dá)到3000億美元,不過(guò)該傳言尚未得到OpenAI證實(shí)。
抄底英偉達(dá)與否并非核心問(wèn)題,關(guān)鍵在于技術(shù)的發(fā)展將加速“模型平價(jià)”(model parity),這將惠及更多消費(fèi)者。
投資者對(duì)DeepSeek的追捧從2月5日競(jìng)價(jià)階段就開(kāi)始了,相關(guān)概念股競(jìng)價(jià)期間幾乎全線漲停。
DeepSeek的技術(shù)創(chuàng)新已經(jīng)重要到很難被禁用,因?yàn)槿虻膶?shí)驗(yàn)室都在爭(zhēng)相復(fù)刻DeepSeek的成功。
農(nóng)歷25年開(kāi)盤,AI應(yīng)用領(lǐng)域迎來(lái)開(kāi)門紅!截至13:06,計(jì)算機(jī)指數(shù)漲7.00%、軟件服務(wù)指數(shù)漲8.53%,計(jì)算機(jī)指數(shù)成分股衛(wèi)寧健康漲20.06%、金山辦公漲19.68%、潤(rùn)和軟件漲14.70%。
DeepSeek火爆有望提升春季行情的AI風(fēng)偏