分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2024-12-08 10:02:35 聽新聞
作者:鄭栩彤 責(zé)編:劉佳
李飛飛首個(gè)“空間智能”模型發(fā)布
“AI教母”、斯坦福大學(xué)教授李飛飛在當(dāng)?shù)貢r(shí)間12月2日公布了她第一個(gè)創(chuàng)業(yè)項(xiàng)目World Labs的成果——能用單張靜態(tài)圖片生成3D世界的AI產(chǎn)品。這一模型亮點(diǎn)在于:直接生成3D場景,且場景具有交互性、可編輯、可擴(kuò)圖。該AI工具有可預(yù)測3D場景能力,即利用AI技術(shù)對3D空間中的物體、環(huán)境結(jié)構(gòu)及其動(dòng)態(tài)變化進(jìn)行預(yù)測和理解,讓AI工具僅憑部分圖片就能“擴(kuò)圖”,想象出整個(gè)3D場景。在World Labs的博客中,該團(tuán)隊(duì)展示了他們?nèi)绾螌?shí)現(xiàn)短視頻上流行的“希區(qū)柯克式變焦”,模擬調(diào)節(jié)景深效果、產(chǎn)生虛化營造專業(yè)的攝影效果等。
點(diǎn)評(píng):此前李飛飛表示,空間智能與語言智能一樣重要,甚至在某些方面可能更古老、更基礎(chǔ)。她還提到,AI的發(fā)展不會(huì)局限于處理平面圖像或文本,而是會(huì)邁向?qū)θS世界的理解,這是智能發(fā)展的自然延伸。據(jù)官方消息,World Labs已經(jīng)完成超過2.3億美元的融資,投資方包括硅谷風(fēng)投a16z、NEA和Radical Ventures等。
谷歌DeepMind發(fā)布基礎(chǔ)世界模型Genie 2
在李飛飛發(fā)布了其首個(gè)“空間智能”模型后,12月5日凌晨,谷歌DeepMind在官網(wǎng)發(fā)布了大型基礎(chǔ)世界模型Genie 2,可通過單張圖片和文字描述生成種類多樣的可玩3D世界。作為今年初推出的 Genie 模型的升級(jí)版,Genie 2標(biāo)志著人工智能在虛擬世界生成領(lǐng)域的又一次突破。
DeepMind透露,Genie 2具備從不同視角(如第一人稱視角與等距視角)生成連貫世界的能力,這些生成的世界可持續(xù)時(shí)間長達(dá)一分鐘,但多數(shù)情況下維持在10秒到20秒之間。
點(diǎn)評(píng):谷歌對世界模型研究的投入正在持續(xù)擴(kuò)大。今年 10 月,DeepMind 聘請了OpenAI前視頻生成項(xiàng)目負(fù)責(zé)人Tim Brooks,同時(shí)兩年前從Meta挖來了以開放式實(shí)驗(yàn)聞名的Tim Rockt?schel。
朱嘯虎、楊植麟分別回應(yīng)月之暗面仲裁案風(fēng)波
金沙江創(chuàng)投聯(lián)合多家循環(huán)智能投資機(jī)構(gòu)向月之暗面創(chuàng)始人楊植麟、聯(lián)合創(chuàng)始人兼CTO張宇韜提起仲裁后,12月5日,金沙江創(chuàng)投主管合伙人朱嘯虎連發(fā)兩條朋友圈,提到月之暗面本來是循環(huán)智能內(nèi)部已開發(fā)2年的項(xiàng)目,分拆至今未得到循環(huán)智能股東決議的簽字,金沙江創(chuàng)投前合伙人張予彤向基金合伙人、其他循環(huán)智能投資人/股東隱瞞自己在新拆分的公司有巨大的免費(fèi)股份的事實(shí),違反了基金合伙人對LP的受托責(zé)任。
12月6日晚,楊植麟發(fā)文回應(yīng)稱,循環(huán)董事會(huì)決議通過了月之暗面成立新公司的安排,月之暗面授予張予彤股份的本質(zhì)是其作為公司聯(lián)合創(chuàng)始人對公司后續(xù)多年持續(xù)工作的對價(jià),跟循環(huán)及其股東對于自己離開循環(huán)重新創(chuàng)業(yè)的決策是獨(dú)立的。
點(diǎn)評(píng):此事的所有細(xì)節(jié)還未全部清晰,朱嘯虎又表示楊植麟的回應(yīng)回避了關(guān)鍵問題。此外,朱嘯虎認(rèn)為張予彤向基金合伙人等人隱瞞自己在月之暗面有大額免費(fèi)股份,楊植麟的說法則是授予股份與循環(huán)及其股東對于自己重新創(chuàng)業(yè)的決策、部分股東沒有投資月之暗面的決策是獨(dú)立的,雙方各執(zhí)一詞。矛盾凸顯后,雙方可能會(huì)尋找方法達(dá)成和解。
阿里對通義前員工周暢起訴索賠
原阿里通義千問技術(shù)負(fù)責(zé)人周暢近期被曝加入字節(jié)跳動(dòng),記者從知情人士處了解到,目前,阿里巴巴已起訴周暢違反競業(yè)協(xié)議。公開資料顯示,周暢于2017年7月入職阿里。今年7月,周暢以創(chuàng)業(yè)為由提出離職,并簽署競業(yè)協(xié)議。
點(diǎn)評(píng):大模型“搶人”大戰(zhàn)愈演愈烈。國內(nèi)人工智能人才的稀缺和大廠對大模型的持續(xù)投入,讓各家企業(yè)在人才競爭中的壓力日漸加大。大廠間的大模型競爭尚未形成定局,技術(shù)比拼之外,大廠也在進(jìn)入持續(xù)投入、組織快速迭代能力等深度比拼。
具身智能初創(chuàng)公司穹徹智能完成數(shù)億元融資
12月5日,具身智能初創(chuàng)公司穹徹智能(Noematrix)宣布完成數(shù)億元人民幣Pre-A+輪融資,本輪融資由紅杉中國領(lǐng)投,老股東Prosperity7 Ventures、小苗朗程及璞躍中國(Plug and Play China)持續(xù)加注。據(jù)悉,穹徹智能專注具身智能基礎(chǔ)模型和系統(tǒng)的研發(fā),提供覆蓋智能機(jī)器人應(yīng)用開發(fā)全周期的軟硬件工具和平臺(tái)。新一輪融資將主要用于加速穹徹的產(chǎn)品研發(fā)、人才招募、推動(dòng)商業(yè)化和生態(tài)合作,進(jìn)一步強(qiáng)化技術(shù)壁壘。
點(diǎn)評(píng):在人工智能如火如荼的2024年,具身智能正成為科技圈最炙手可熱的賽道。從天使輪迅速推進(jìn)至Pre-A+輪,穹徹智能一年內(nèi)已完成三輪融資。除了穹徹智能外,僅在上個(gè)月,就至少有星海圖、自變量機(jī)器人、埃斯頓酷卓、銀河通用、戴盟機(jī)器人5家人形機(jī)器人廠商完成億元級(jí)融資。
微信公眾號(hào)后臺(tái)新增 AI 配圖功能
12月2日消息,微信公眾號(hào)近日正在測試全新的 AI 配圖功能,在后臺(tái)文章編輯選擇插入圖片時(shí),除了原本從圖片庫選擇和本地上傳之外,多了一個(gè)新的選項(xiàng)——“AI配圖”。點(diǎn)擊這個(gè)選項(xiàng),創(chuàng)作者會(huì)進(jìn)入一個(gè)AI圖像生成頁面,只需要輸入一段文字描述想要的配圖,然后等上十幾秒,系統(tǒng)就會(huì)生成四張照片。根據(jù)這四張照片,可以進(jìn)一步選擇圖片風(fēng)格和比例,然后對圖片進(jìn)一步生成修訂,直到滿意之后,將其插入到文章當(dāng)中。目前該功能尚未全面上線。
點(diǎn)評(píng):這項(xiàng)功能的加入,意味著以后微信公眾號(hào)的配圖都可以通過AI生成解決,創(chuàng)作者也不必再因?yàn)閳D片版權(quán)的風(fēng)險(xiǎn)而擔(dān)憂了。微信公眾號(hào)不是第一個(gè)更新這項(xiàng)功能的平臺(tái)。2023年初,百家號(hào)在文心一言剛發(fā)布不久就上線了類似的功能。微信公眾號(hào)更新的意義在于,作為行業(yè)最早、影響力最大,但更新最緩慢的平臺(tái),它的改變代表一個(gè)新階段的開始。
騰訊混元開源130億參數(shù)視頻模型
12月3日,騰訊混元大模型上線了視頻生成能力,并開源了這個(gè)參數(shù)量130億的視頻生成大模型HunYuan-Vieo。據(jù)稱該模型是業(yè)界參數(shù)最大的開源視頻模型,可生成5秒視頻。據(jù)混元團(tuán)隊(duì)公布的文生視頻模型效果評(píng)估,混元視頻生成模型總體評(píng)分41.3%,高于未公開名稱的國內(nèi)模型A和B以及海外的GEN-3 alpha和Luma1.6。
點(diǎn)評(píng):此前已有多家大模型廠商發(fā)布了視頻大模型,不過騰訊現(xiàn)在入局也不能算太晚,因?yàn)橐曨l大模型整體還未進(jìn)入商業(yè)化階段。騰訊混元多模態(tài)生成技術(shù)負(fù)責(zé)人凱撒也認(rèn)為,文生視頻還不處于很成熟的階段,各模型成功率都不高,至少文生視頻的技術(shù)程度在混元內(nèi)部的評(píng)估中,還沒有到大規(guī)模商業(yè)化的程度。技術(shù)上,視頻大模型還要解決不符合物理規(guī)律、視頻時(shí)長較短等各種問題。
MiniMax副總裁劉華:基礎(chǔ)大模型賽道將只剩個(gè)位數(shù)的企業(yè)
接受第一財(cái)經(jīng)等媒體采訪時(shí),MiniMax副總裁劉華表示,基礎(chǔ)大模型賽道將會(huì)局限在個(gè)位數(shù)的企業(yè),其中包括大廠和創(chuàng)業(yè)公司,除此之外,很多人要轉(zhuǎn)去做AI應(yīng)用。目前國內(nèi)AI產(chǎn)業(yè)總體上沒有太多泡沫,此前之所以行業(yè)存在一些資源浪費(fèi),是因?yàn)樘嗥髽I(yè)認(rèn)為自己能做基礎(chǔ)大模型。泡沫撇去,更好的情況將是大家認(rèn)識(shí)到能做基礎(chǔ)模型的企業(yè)不多,更多人有志于做大模型應(yīng)用。
點(diǎn)評(píng):近期一些業(yè)內(nèi)人士發(fā)聲都認(rèn)為大模型創(chuàng)業(yè)公司未來至少能有一家留在牌桌上,目前的幾家獨(dú)角獸公司都有機(jī)會(huì)。與能在多個(gè)領(lǐng)域同時(shí)出擊的科技大廠不同,資源相對較少的創(chuàng)業(yè)企業(yè)要找到自己的發(fā)力點(diǎn),做好基礎(chǔ)大模型的同時(shí)布局商業(yè)化,讓商業(yè)化齒輪轉(zhuǎn)動(dòng)起來。
OpenAI首發(fā)o1正式版和200美元/月Pro會(huì)員
北京時(shí)間12月6日凌晨,OpenAI舉行了“12天12場直播”活動(dòng)的首秀,正式推出名為ChatGPT Pro的套餐,每月訂閱收費(fèi)200美元。OpenAI稱,該套餐的訂閱用戶可以無限制訪問OpenAI最智能的模型 OpenAI o1以及同系列較小模型o1-mini、GPT-4o、類人的ChatGPT高級(jí)語音模式Advanced Voice。ChatGPT Pro的套餐中還可以包括名為o1 pro mode的新o1版本,也是ChatGPT Pro獨(dú)有的o1版本。OpenAI稱,這個(gè)新版本使用更多的計(jì)算,能更深入地思考,并為最困難的問題提供更好的答案。
點(diǎn)評(píng):OpenAI宣布將開啟“12天12場直播”活動(dòng)后,就有人預(yù)測o1正式版將在直播中亮相,因?yàn)閛1預(yù)覽版已經(jīng)在今年9月推出了。此次直播活動(dòng)中,最大的懸念還是視頻大模型Sora是否會(huì)推出,不過,如此密集的產(chǎn)品更新活動(dòng)可能還是以比較零散的新功能為主。一個(gè)月訂閱收費(fèi)200美元的ChatGPT Pro推出后,則有人稱之為“世界最貴的大模型”。
OpenAI推出強(qiáng)化微調(diào)技術(shù)
北京時(shí)間12月7日,OpenAI推出強(qiáng)化微調(diào)技術(shù)(Reinforcement Fine-Tuning),幫助開發(fā)者和機(jī)器學(xué)習(xí)工程師打造針對特定復(fù)雜領(lǐng)域任務(wù)的專家模型。該項(xiàng)目通過全新的模型定制技術(shù),讓開發(fā)者可以使用高質(zhì)量任務(wù)集對模型進(jìn)行微調(diào),并利用參考答案評(píng)估模型的響應(yīng),從而提升模型在特定領(lǐng)域任務(wù)中的推理能力和準(zhǔn)確性。OpenAI CEO山姆·奧爾特曼(Sam Altman)表示,強(qiáng)化微調(diào)的效果非常棒,這是他今年最大的驚喜之一。
點(diǎn)評(píng):強(qiáng)化微調(diào)可以降低大模型的錯(cuò)誤率,據(jù)OpenAI研究員演示,強(qiáng)化微調(diào)后的o1 mini測試通過率比正式版o1高24%,比未強(qiáng)化微調(diào)的o1 mini提高了82%。在一些對準(zhǔn)確率要求嚴(yán)格的領(lǐng)域,例如生物化學(xué)、安全、法律和醫(yī)療保健,強(qiáng)化微調(diào)將能讓大模型有更好的表現(xiàn)。
這款智能體可以處理重復(fù)的瀏覽器任務(wù),比如填寫表格、訂購雜貨、創(chuàng)建表情包等。
這些大模型企業(yè)年初釋放的信號(hào)可能指明了今年大模型領(lǐng)域的競爭方向。
OpenAI首席執(zhí)行官Sam Altman公布了2025年即將發(fā)布的技術(shù)產(chǎn)品。
用戶可通過撥打號(hào)碼(1-800-242-8478)或通過WhatsApp發(fā)送消息,用戶每月有15分鐘的語音通話額度。
朱嘯虎需要楊植麟與張予彤切割,楊植麟強(qiáng)調(diào)公司最重要的任務(wù)是將技術(shù)和產(chǎn)品做好。