分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2025-02-01 19:44:02 聽(tīng)新聞
作者:寧佳彥 責(zé)編:彭海斌
“這是一個(gè)非常好的模型!我們將生產(chǎn)出更好的模型,但領(lǐng)先優(yōu)勢(shì)將比前幾年有所減弱。”當(dāng)?shù)貢r(shí)間1月31日,OpenAI CEO山姆·奧爾特曼(Sam Altman)在發(fā)布新一代推理模型o3系列的mini版本(o3-mini)后還點(diǎn)評(píng)了一家中國(guó)公司的模型。它由中國(guó)杭州的深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(下稱(chēng)“DeepSeek”)研發(fā),其同名App DeepSeek一舉登頂美國(guó)和英國(guó)蘋(píng)果應(yīng)用商店最受歡迎免費(fèi)應(yīng)用榜單,成功吸引了全球?qū)Υ竽P皖I(lǐng)域的新一輪關(guān)注。
這款中國(guó)模型讓美國(guó)新任總統(tǒng)特朗普宣稱(chēng)其崛起“為美國(guó)科技企業(yè)敲響了警鐘”,引發(fā)投資者思考它對(duì)英偉達(dá)股價(jià)的威脅有多大,而第一財(cái)經(jīng)星翼大模型的技術(shù)開(kāi)發(fā)團(tuán)隊(duì)知道,當(dāng)初做的技術(shù)模型基座選擇,對(duì)了!
第一財(cái)經(jīng)星翼大模型是由上海廣播電視臺(tái)旗下第一財(cái)經(jīng)自主研發(fā)的一款專(zhuān)為財(cái)經(jīng)領(lǐng)域設(shè)計(jì)的大模型技術(shù)底座及智能應(yīng)用平臺(tái),目前已迭代到3.0版本。作為服務(wù)于財(cái)經(jīng)融媒體內(nèi)容生產(chǎn)的AI智能體,第一財(cái)經(jīng)星翼大模型可調(diào)用多個(gè)開(kāi)源模型,依托超10億token的高質(zhì)量財(cái)經(jīng)媒體數(shù)據(jù)和專(zhuān)業(yè)領(lǐng)域知識(shí),并運(yùn)用創(chuàng)新的跨模型融合推理技術(shù),實(shí)現(xiàn)高精準(zhǔn)度的內(nèi)容輸出,在財(cái)經(jīng)內(nèi)容創(chuàng)作和智能分析領(lǐng)域始終保持著領(lǐng)先地位。
“最早注意到幻方量化這家公司,是因?yàn)樾侣剤?bào)道中有提到它當(dāng)時(shí)是少數(shù)幾家擁有英偉達(dá)萬(wàn)卡的公司之一。”DeepSeek是幻方量化旗下的AI公司,而第一財(cái)經(jīng)技術(shù)中心團(tuán)隊(duì)正是憑借新聞敏感性和專(zhuān)業(yè)能力,持續(xù)關(guān)注了公司和產(chǎn)品。這是第一財(cái)經(jīng)“專(zhuān)業(yè)創(chuàng)造價(jià)值”的基礎(chǔ),由敏銳的洞察力、準(zhǔn)確的判斷力、快速的反應(yīng)能力和深入的挖掘能力來(lái)支撐。
2024年5月7日,DeepSeek發(fā)布了MoE架構(gòu)的DeepSeek V2。兩天后,第一財(cái)經(jīng)技術(shù)中心就對(duì)DeepSeek發(fā)布的技術(shù)報(bào)告和模型進(jìn)行了深度分析與研究。經(jīng)過(guò)嚴(yán)謹(jǐn)?shù)脑u(píng)估,團(tuán)隊(duì)認(rèn)為DeepSeek V2在架構(gòu)設(shè)計(jì)、性能表現(xiàn)等方面與財(cái)經(jīng)垂類(lèi)大模型的需求高度契合,于是果斷決定將基座模型遷移至DeepSeek V2,并迅速啟動(dòng)了以DeepSeek V2為主力基座模型的財(cái)經(jīng)垂類(lèi)大模型的訓(xùn)練與應(yīng)用研發(fā)工作。
2024年7月,在世界人工智能大會(huì)上,第一財(cái)經(jīng)星翼大模型正式亮相,重磅推出了財(cái)經(jīng)智能生產(chǎn)套件及財(cái)經(jīng)智能助手兩大系列應(yīng)用,為財(cái)經(jīng)融媒體內(nèi)容生產(chǎn)及資本市場(chǎng)分析提供了強(qiáng)大的智能化支持。
在隨后的半年時(shí)間里,第一財(cái)經(jīng)技術(shù)團(tuán)隊(duì)持續(xù)對(duì)星翼大模型進(jìn)行優(yōu)化升級(jí),先后完成2次大版本升級(jí)。其中,主力基座模型版本進(jìn)一步升級(jí),復(fù)雜任務(wù)由本地部署且自行微調(diào)的DeepSeekV2.5模型完成,使星翼大模型在財(cái)經(jīng)數(shù)據(jù)處理、語(yǔ)義理解、智能分析等方面的能力得到了顯著提升。在此過(guò)程中,第一財(cái)經(jīng)與DeepSeek一直保持密切溝通,圍繞模型技術(shù)細(xì)節(jié)、應(yīng)用場(chǎng)景等方面進(jìn)行了多次深入的技術(shù)交流,同時(shí)也就潛在的合作方向展開(kāi)了多輪洽談。
如今,星翼大模型3.0將多模態(tài)能力擴(kuò)展至視頻領(lǐng)域,實(shí)現(xiàn)圖、文、視任意模態(tài)的跨模態(tài)內(nèi)容檢索。升級(jí)后重磅推出的新聞傳播數(shù)據(jù)分析AI智能體——星眼,不僅能為內(nèi)容創(chuàng)作團(tuán)隊(duì)提供多維度的AI智能輔助與數(shù)據(jù)診斷,還能為讀者理解紛繁復(fù)雜的商業(yè)世界提供對(duì)照和分析。
“未來(lái),第一財(cái)經(jīng)將繼續(xù)依托DeepSeek的技術(shù)優(yōu)勢(shì),結(jié)合自身海量?jī)?yōu)質(zhì)的財(cái)經(jīng)數(shù)據(jù)和專(zhuān)業(yè)的行業(yè)洞察,持續(xù)優(yōu)化星翼大模型,深入挖掘財(cái)經(jīng)數(shù)據(jù)價(jià)值,進(jìn)一步提升模型在復(fù)雜財(cái)經(jīng)場(chǎng)景下的分析能力,為金融從業(yè)者、投資者以及廣大財(cái)經(jīng)內(nèi)容愛(ài)好者提供更具深度和前瞻性的智能化的財(cái)經(jīng)信息服務(wù)。”第一財(cái)經(jīng)技術(shù)團(tuán)隊(duì)負(fù)責(zé)人說(shuō)。
目前,第一財(cái)經(jīng)已依據(jù)相關(guān)規(guī)定,正式向網(wǎng)信辦提交星翼大模型備案申請(qǐng)。在備案材料中,明確闡述了第一財(cái)經(jīng)星翼大模型以DeepSeek V2.5為基座模型,同時(shí)輔以多個(gè)分類(lèi)模型構(gòu)建基礎(chǔ)架構(gòu),以確保模型在財(cái)經(jīng)領(lǐng)域的專(zhuān)業(yè)性、準(zhǔn)確性和穩(wěn)定性。
“買(mǎi)菜無(wú)需豪華車(chē)”,大模型落地前廠(chǎng)商需要考慮成本和性能的平衡。
向老師學(xué)習(xí),老師的智能就是天花板;向自然學(xué)習(xí),就可以突破人類(lèi)智能的極限。所以AI的優(yōu)勢(shì)在可擴(kuò)展性,它發(fā)展的絕對(duì)瓶頸常在數(shù)據(jù)和能源。
這一模型迭代可能預(yù)示著R2模型將是另一個(gè)重大飛躍。
據(jù)悉該模型參數(shù)為6850億。
怎么才能用好如今“百模大戰(zhàn)”之下各種層出不窮的AI模型?關(guān)鍵就是要分清楚它們所處的層次,以匹配你想達(dá)到的目的。