分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2025-02-26 08:56:23 聽新聞
作者:一財(cái)資訊 責(zé)編:羅懿
中國聯(lián)通近日宣布,繼1月開源元景“自適應(yīng)慢思考”思維鏈大模型后,又針對DeepSeek系列模型進(jìn)行了“自適應(yīng)慢思考”優(yōu)化升級,平均可節(jié)省約30%的推理計(jì)算量,現(xiàn)已開源。這也是目前業(yè)界首個(gè)對DeepSeek系列思維鏈模型做“自適應(yīng)慢思考”優(yōu)化升級的工作。
中國聯(lián)通稱,除了通過對DeepSeek-R1模型進(jìn)行自適應(yīng)慢思考優(yōu)化升級外,還在推進(jìn)對DeepSeek-R1系列模型的能力邊界量化和安全價(jià)值觀增強(qiáng)等相關(guān)工作的探索。未來,中國聯(lián)通將持續(xù)與以DeepSeek為代表的先進(jìn)開源模型深度融合,不斷升級元景基礎(chǔ)模型能力和MaaS平臺(tái)功能,貫徹開源普惠理念,推進(jìn)算力普惠、模型普惠、應(yīng)用普惠,以先進(jìn)數(shù)智水平賦能社會(huì)千行百業(yè)。
阿里云方面表示,性能大幅提升的同時(shí),千問3的部署成本大幅下降,僅需4張H20即可部署千問3滿血版,顯存占用僅為DeepSeek-R1的三分之一。
第一財(cái)經(jīng)記者從了解黃仁勛中國之行細(xì)節(jié)的人士方面證實(shí),黃仁勛全程未與DeepSeek會(huì)面。
企業(yè)希望通過降低機(jī)器人的開發(fā)門檻,拉更多的生態(tài)參與者“入伙”。
這一模型迭代可能預(yù)示著R2模型將是另一個(gè)重大飛躍。
據(jù)悉該模型參數(shù)為6850億。