分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
4月29日凌晨,阿里巴巴開(kāi)源新一代通義千問(wèn)模型Qwen3(簡(jiǎn)稱(chēng)千問(wèn)3),參數(shù)量為DeepSeek-R1的1/3,成本大幅下降。千問(wèn)3是“混合推理模型”,“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,對(duì)簡(jiǎn)單需求可低算力“秒回”答案,對(duì)復(fù)雜問(wèn)題可多步驟“深度思考”,節(jié)省算力消耗。
千問(wèn)3總參數(shù)量235B,激活僅需22B。阿里稱(chēng)僅需4張H20即可部署千問(wèn)3滿血版,顯存占用僅為性能相近模型的三分之一。
千問(wèn)3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。API可按需設(shè)置“思考預(yù)算”(即預(yù)期最大深度思考的tokens數(shù)量),進(jìn)行不同程度的思考,滿足AI應(yīng)用和不同場(chǎng)景對(duì)性能和成本的多樣需求。比如,4B模型面向手機(jī)端,8B可在電腦和汽車(chē)端側(cè)部署應(yīng)用等。
騰訊混元3D生成模型發(fā)布2.5版本新模型;小鵬自研通用模型今年或?qū)婇_(kāi)放;OpenAI重組為營(yíng)利性公司的目標(biāo)遇阻。
針對(duì)開(kāi)發(fā)者面臨的數(shù)據(jù)難獲取、模型難訓(xùn)練、開(kāi)發(fā)成本高、工程門(mén)檻高等問(wèn)題,Genie Studio推出“數(shù)據(jù)采集、模型訓(xùn)練,仿真評(píng)測(cè)、模型推理”四大核心模塊。
弘信電子2025年一季度歸母凈利潤(rùn)同比大幅下滑75.8%,毛利率下滑3.49個(gè)百分點(diǎn),AI算力業(yè)務(wù)的可持續(xù)性和盈利水平存疑。
蓮花控股今年以來(lái)終止的算力服務(wù)合同金額達(dá)2.52億元。
平臺(tái)服務(wù)和保障上海市高校、科研院所、中小企業(yè)的智能算力和科學(xué)計(jì)算需求。