分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
OpenAI GPT-4o推出圖像生成功能
北京時(shí)間3月26日凌晨,OpenAI進(jìn)行了直播,對GTP-4o和Sora進(jìn)行更新,在ChatGPT和Sora中推出GPT-4o的圖像生成功能。OpenAI此次強(qiáng)調(diào)了新功能在精準(zhǔn)理解文本描述、準(zhǔn)確生成文本方面的優(yōu)勢。據(jù)介紹,GPT-4o圖像生成功能擅長準(zhǔn)確呈現(xiàn)文本,并精準(zhǔn)遵循提示詞,該功能還會將GPT-4o的知識庫和聊天上下文作為靈感來源,這有助于使用者與圖像生成工具更有效地溝通并提高生成圖像的質(zhì)量。
點(diǎn)評:生成圖像中的文字,此前是圖像生成領(lǐng)域的一個(gè)難題。國內(nèi),去年豆包升級文生圖能力,支持一鍵生成指定文本。今年3月,智譜AI發(fā)布了首個(gè)支持生成漢字的開源文生圖模型CogView4。OpenAI這個(gè)新的圖像生成功能生成文字的能力比較強(qiáng),可以生成白板上的字、菜單、實(shí)驗(yàn)示意圖等,但OpenAI表示,該功能也有一些限制,例如在呈現(xiàn)非拉丁語言時(shí)容易出現(xiàn)幻覺。
Manus公布收費(fèi)方案:最高每月199美元
3月28日下午,目前還處于非公開測試階段的AI Agent產(chǎn)品Manus,宣布開始向用戶收費(fèi),這距離其發(fā)布預(yù)覽版本還不足1個(gè)月時(shí)間。據(jù)悉,此次付費(fèi)版本分為Manus Starter和Manus Pro,均為Beta版本。Manus Starter每月收費(fèi)39美元,用戶可獲得3900積分,最多可以同時(shí)運(yùn)行2個(gè)任務(wù)。 Manus Pro每月收費(fèi)199美元,用戶可獲得19900積分,最多可以同時(shí)運(yùn)行5個(gè)任務(wù),同時(shí)支持使用高投入模式和其他測試功能。積分是Manus使用的標(biāo)準(zhǔn)計(jì)量單位,任務(wù)越復(fù)雜或越耗時(shí),所需積分越多。
點(diǎn)評:Manus是今年以來中國AI圈又一個(gè)爆款。3月5日,成立于2023年的AI初創(chuàng)公司Butterfly Effect(蝴蝶效應(yīng))發(fā)布Manus的早期預(yù)覽版,將其稱為“全球首款通用智能體產(chǎn)品”。從介紹來看,使用者只需要給Manus一個(gè)簡單的指令,它就能自動完成復(fù)雜的任務(wù)。但上線一天后,對于Manus的評論出現(xiàn)兩極,有人批評公司“以邀請碼為噱頭,營銷味太重”,但也有人為Manus的創(chuàng)新點(diǎn)贊。
OpenAI預(yù)計(jì)今年?duì)I收增長兩倍以上:將達(dá)127億美元
3 月 27 日,據(jù)彭博社報(bào)道并經(jīng) CNBC 等多家媒體核實(shí),在付費(fèi)人工智能軟件強(qiáng)勁實(shí)力的有力推動下,OpenAI 預(yù)估其 2025 年?duì)I收將達(dá)到 127 億美元(約合人民幣922.31億元),相比2024年?duì)I收(37 億美元)增長兩倍還多。在此基礎(chǔ)上,OpenAI 預(yù)計(jì)其 2026 年?duì)I收將達(dá)到 294 億美元(約合人民幣2135.12 億元),2029 年更將超過1250億美元(約合人民幣9077.9 億元)。作為 OpenAI 主要投資者及戰(zhàn)略合作伙伴的微軟,其第四季度年度經(jīng)常性收入已達(dá) 130 億美元,同比增幅達(dá) 175%。
點(diǎn)評:去年9月,OpenAI對外宣布,公司版ChatGPT的付費(fèi)用戶數(shù)量已成功突破100萬大關(guān)。然而,在收入一路飆升的背后,OpenAI也面臨著諸多嚴(yán)峻挑戰(zhàn),開發(fā)尖端模型需要投入巨額成本,涵蓋芯片采購、數(shù)據(jù)中心建設(shè)以及高端人才招募等多個(gè)方面。據(jù)知情人士透露,OpenAI預(yù)計(jì)在2029年之前難以實(shí)現(xiàn)現(xiàn)金流轉(zhuǎn)正。
DeepSeek-V3模型更新,編程能力大大提升
3月25日晚,DeepSeek在海內(nèi)外官方賬號宣布V3模型完成小版本升級的消息,并介紹了新版本DeepSeek-V3-0324模型的提升細(xì)節(jié),包括推理、前端開發(fā)、中文寫作、中文搜索幾個(gè)方面的能力優(yōu)化。根據(jù)官方展示的對比圖,在數(shù)學(xué)、代碼類相關(guān)評測集上新版V3模型分?jǐn)?shù)排在第一,超過了GPT-4.5、Claude-Sonnet-3.7以及阿里云的Qwen-Max,但在百科知識上新模型稍弱于GPT-4.5。
點(diǎn)評:“這是開放權(quán)重模型首次成為領(lǐng)先的非推理模型,對于開源來說是一個(gè)里程碑。”海外專業(yè)AI模型評測機(jī)構(gòu) Artificial Analysis官方表示,此版本可以說比DeepSeek的R1模型更令人印象深刻,并且可能預(yù)示著R2模型將是另一個(gè)重大飛躍。此次發(fā)布的新版V3模型采用MIT許可(允許模型蒸餾、商用),意味著其可以被自由用于商業(yè)用途。
微軟再提DeepSeek,有意向開發(fā)獨(dú)立大模型
微軟董事長兼首席執(zhí)行官薩蒂亞·納德拉 (Satya Nadella)今日在接受采訪時(shí)表示微軟有意向獨(dú)立開發(fā)AI模型。他同時(shí)表示這一開發(fā)作為與 OpenAI 合作的補(bǔ)充,可以為客戶提供附加價(jià)值。他在面向員工的內(nèi)部講話中再次提到了DeepSeek,稱其R1模型為微軟的 AI 發(fā)展設(shè)定了“新標(biāo)準(zhǔn)”,因?yàn)镈eepSeek通過200人的團(tuán)隊(duì)打造出了應(yīng)用商店排名第一的產(chǎn)品。在1月DeepSeek引發(fā)了巨大反響后,微軟迅速在Azure 平臺上部署了 DeepSeek 的 R1模型。
點(diǎn)評:雖然有意向獨(dú)立開發(fā)AI模型,但微軟對于和Open AI的合作一直持正向態(tài)度。此前在2025財(cái)年第二財(cái)季電話會議上,被問及對Open AI后續(xù)的投資態(tài)度時(shí),薩蒂亞·納德拉回應(yīng)稱對與 OpenAI 的合作仍感到非常滿意。他同時(shí)提及成本的問題,并表示在人工智能領(lǐng)域,需要注意的關(guān)鍵一點(diǎn)是不能只是推出前沿模型,如果其服務(wù)成本過高,那就毫無用處,它不會產(chǎn)生任何需求。因此平臺必須進(jìn)行優(yōu)化,使推理成本降低,從而能夠被廣泛使用。
傳阿里前高管的創(chuàng)業(yè)公司將賣給英偉達(dá)
有消息稱,英偉達(dá)即將達(dá)成收購Lepton AI的交易,交易價(jià)值數(shù)億美元。Lepton AI是一家成立了兩年的人工智能初創(chuàng)公司,致力于為企業(yè)提供高效、可擴(kuò)展的AI應(yīng)用平臺,是由AI領(lǐng)域的頂級科學(xué)家、阿里巴巴前高管賈揚(yáng)清創(chuàng)辦。
點(diǎn)評:有市場分析認(rèn)為,英偉達(dá)收購Lepton AI是為了進(jìn)軍云計(jì)算和企業(yè)軟件市場,英偉達(dá)希望與亞馬遜、谷歌等云計(jì)算提供商競爭。不過,目前該消息并未得到英偉達(dá)或Lepton AI證實(shí),賈揚(yáng)清回應(yīng)稱“無法評論”。
谷歌發(fā)布推理模型Gemini 2.5 Pro,沖上榜一
3月26日谷歌發(fā)布Gemini 2.5系列人工智能推理模型,該系列模型在回答問題前會“思考”片刻。實(shí)驗(yàn)版Gemini 2.5 Pro是該系列上線的首款推理模型,被谷歌稱為“目前最智能的模型”。作為原生多模態(tài)大模型,Gemini 2.5 Pro可以處理來自音視頻和大型數(shù)據(jù)集等多模態(tài)輸入,還能夠理解編碼項(xiàng)目的整個(gè)代碼存儲庫。目前,實(shí)驗(yàn)版Gemini 2.5 Pro以39分的顯著優(yōu)勢在測試人類偏好的大模型競技場Chatbot Arena榜上排名第一。
點(diǎn)評:自從OpenAI于2024年9月發(fā)布首個(gè)人工智能推理模型o1以來,科技行業(yè)紛紛爭相開發(fā)推理模型,想要匹配或超越o1的性能。目前,Anthropic、DeepSeek、谷歌和xAI等公司均已推出各自的推理模型,這些模型在輸出答案之前先進(jìn)行事實(shí)核查和邏輯推演。推理技術(shù)使得模型在數(shù)學(xué)與編程任務(wù)中實(shí)現(xiàn)突破,行業(yè)認(rèn)為,推理模型將成為智能體的重要組成部分,但成本也更高。
騰訊元寶接入DeepSeek-V3最新版本
騰訊元寶近日進(jìn)行了多次更新。3月26日,騰訊元寶接入DeepSeek V3-0324最新模型后發(fā)布了更新,支持實(shí)時(shí)預(yù)覽HTML代碼,用戶輸入一句話就可以生成網(wǎng)頁代碼并看到可運(yùn)行的網(wǎng)頁,也可以輸入一句話生成UI組件、編寫小游戲。3月28日,元寶再次更新,支持用戶上傳和解析36種格式的文件,包括Word、Excel、PPT、PDF 等常見辦公文檔和.py、.java、.cpp、.json 等數(shù)十種開發(fā)文件格式。
點(diǎn)評:有用戶體驗(yàn)后發(fā)現(xiàn),DeepSeek-V3最新版本在代碼能力方面有所增強(qiáng),這體現(xiàn)在了元寶的更新中。騰訊元寶增加可上傳文件的格式則增加了該應(yīng)用的實(shí)用性。2月13日至今,騰訊元寶已進(jìn)行了30多次更新。更新的同時(shí),騰訊元寶還在線上線下加大宣傳廣告的力度。
Dyna Robotics完成數(shù)千萬美元種子輪融資,打造AI驅(qū)動機(jī)器人
3月27日,Dyna Robotics 宣布完成數(shù)千萬美元的種子輪融資。本輪融資由硅谷風(fēng)投CRV和First Round Capital領(lǐng)投,真格基金參與投資。Dyna Robotics由Lindon Gao、YorkYang和Jason Ma于2024年 9月共同創(chuàng)立,總部位于美國硅谷,上海設(shè)有硬件研發(fā)中心。據(jù)悉,Dyna Robotics致力于為各類企業(yè)打造AI驅(qū)動的機(jī)器人。公司機(jī)器人通過“一次專注一個(gè)任務(wù)”的方式,從折疊到備餐等各類任務(wù)入手,讓其具身智能基礎(chǔ)模型能在真實(shí)生產(chǎn)場景中以高性價(jià)比不斷學(xué)習(xí)和成長,最終邁向通用型具身智能的目標(biāo)。
點(diǎn)評:盡管語言、圖像與視頻模型已發(fā)展蓬勃,但具身智能仍未真正破解難題。Dyna Robotics聯(lián)合創(chuàng)始人兼CEOLindon Gao表示,“機(jī)器人基礎(chǔ)模型需要大量高保真、真實(shí)世界的數(shù)據(jù),我們正圍繞包裝、清潔馬桶等具體任務(wù)采集大量數(shù)據(jù),在提供實(shí)際商業(yè)價(jià)值的同時(shí),系統(tǒng)性地推動具身智能的發(fā)展。”
黃仁勛此次訪華正值美國收緊對英偉達(dá)人工智能芯片的出口管制。在這一背景下,包括DeepSeek在內(nèi)的人工智能企業(yè)未來能否獲取符合管制要求的AI芯片備受關(guān)注。
a16z擬募資200億美元基金投向人工智能領(lǐng)域;王小川反思百川智能此前戰(zhàn)線拉得太長。
智能體行業(yè)的可解釋性難題需要企業(yè)與院校共同努力攻克。
《工業(yè)和信息化領(lǐng)域人工智能安全治理標(biāo)準(zhǔn)體系建設(shè)指南(2025)(征求意見稿)》公開征求意見;傳英偉達(dá)有意收購Lepton AI,賈揚(yáng)清回應(yīng)“無法評論”。
百度發(fā)布文心大模型4.5及X1;Manus光谷研發(fā)團(tuán)隊(duì)大量招聘,涉及10余個(gè)崗位。