分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
2020年,面對新冠肺炎疫情巨大沖擊和復(fù)雜嚴峻的國內(nèi)外環(huán)境,人工智能的賦能效應(yīng)充分發(fā)揮。伴隨人工智能邁入工業(yè)化大生產(chǎn)階段,夯實人工智能底層創(chuàng)新能力更顯迫切。
日前,上海市經(jīng)信委發(fā)布了“2020年度上海人工智能發(fā)展十件大事”,在這份極具風(fēng)向標(biāo)意義的榜單上,商湯科技啟動建設(shè)的新一代人工智能計算與賦能平臺重點項目名列其中。
占地面積約5.8萬平方米,總投資約56億元,僅用168天就順利完成結(jié)頂。商湯搭建的AI計算平臺究竟與傳統(tǒng)互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)有何差別?會給商湯自身業(yè)務(wù),以及整個人工智能軟硬件產(chǎn)業(yè)鏈的國產(chǎn)化帶來哪些支撐?針對這些問題商湯科技聯(lián)合創(chuàng)始人楊帆接受了第一財經(jīng)專訪,闡述了商湯斥巨資搭建新一代AI計算平臺背后的底層邏輯和長遠思考。
超前預(yù)判構(gòu)筑AI時代的新型數(shù)據(jù)中心
商湯智能計算中心坐落于上海臨港新片區(qū),這座宛若芯片的建筑預(yù)計于2021年底投入試運營。項目全部建成后AI計算峰值速度將達到3740 Petaflops(1 petaflop等于每秒1千萬億次浮點運算),成為國際一流的AI計算平臺。
在如此短的時間內(nèi)建設(shè)如此大規(guī)模的AI計算中心,在國內(nèi)甚至全世界范圍內(nèi)尚屬先例,背后的艱辛也不言而喻。
“168天完成開工到封頂,項目建設(shè)確實充滿挑戰(zhàn),但更大的挑戰(zhàn)源自對前沿技術(shù)和行業(yè)變革認知的提升。伴隨著國家2020年初提出新基建戰(zhàn)略,以及近期國外相關(guān)技術(shù)的進展,幾乎是最近幾個月才有越來越多的人關(guān)注超大規(guī)模人工智能算力,提出人工智能計算中心的觀點。”楊帆告訴第一財經(jīng)。
事實上早在2018年4月,商湯就開始布局人工智能計算原型機研制項目。在沒有任何可供參照的案例經(jīng)驗和實驗場地條件下,商湯甚至在總部辦公大樓內(nèi),犧牲辦公空間搭建原型機的核心機房,總投資近7億元,進行項目預(yù)研。
今天商湯在臨港建設(shè)的人工智能計算中心,正是基于原型機項目建設(shè)的研制成果和技術(shù)積累。
“最初進行人工智能計算與賦能平臺項目申報時,不少資歷豐富的評審專家都表示沒有經(jīng)歷過這么大的科研項目。”楊帆表示,早于行業(yè)預(yù)判并敢于快速布局本身就不容易,還要讓周圍的人去理解、去相信、去接受也很難,幸運的是商湯做到了。
外界常常將商湯智能計算中心簡單理解為IDC,但商湯認為兩者有本質(zhì)區(qū)別,并將其首次定義為AI時代的新型數(shù)據(jù)中心,即人工智能計算中心(Artificial Intelligence Data Center),簡稱為AIDC。
楊帆表示,IDC更像是一個“數(shù)字地產(chǎn)”,本身帶來的產(chǎn)業(yè)附加值是極低的。而AIDC則從AI的賦能屬性出發(fā),幫助更多傳統(tǒng)行業(yè)提升效率。從國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中的戰(zhàn)略目標(biāo)來看,人工智能自身的行業(yè)產(chǎn)值和它所帶動的其他行業(yè)的附加值,大約是一個1:10的杠桿。也就是說人工智能每產(chǎn)生一萬元的產(chǎn)能,它實際上對它所服務(wù)的行業(yè)會帶來10萬元的經(jīng)濟效益,這是人工智能最大的價值。
“我們希望通過這個平臺提升產(chǎn)業(yè)效率并帶動行業(yè)自身需求,觸發(fā)存量環(huán)境下的一個新增長。這其實是中國經(jīng)濟動能轉(zhuǎn)換,邁向高質(zhì)量發(fā)展的一個核心基礎(chǔ)。”楊帆表示。
對于商湯而言,AIDC不僅是未來業(yè)務(wù)破局發(fā)展和高速增長的基石,也是商湯支撐芯片國產(chǎn)化、攻關(guān)超大模型、以及打造開源算法生態(tài)的著力點與破局點。
加速芯片國產(chǎn)化進程
在復(fù)雜的國際局勢驅(qū)動下,加速芯片國產(chǎn)化,實現(xiàn)安全可控,成為中國半導(dǎo)體產(chǎn)業(yè)發(fā)展的一大目標(biāo)。反觀當(dāng)下,我國AI產(chǎn)業(yè)發(fā)展是建立在以英偉達為主的國外企業(yè)構(gòu)建的軟硬件生態(tài)基礎(chǔ)之上,這種依賴性使得我國AI產(chǎn)業(yè)的未來發(fā)展受制于人,也給供應(yīng)鏈安全帶來巨大風(fēng)險。
楊帆認為英偉達芯片之所以能在AI領(lǐng)域處于相對壟斷地位,一方面源自國外在集成電路硬件相關(guān)技術(shù)上領(lǐng)先國內(nèi),在芯片制程及制作工藝上存在一定的代差。另一重要原因在于英偉達多年培育積累的強大配套基礎(chǔ)計算平臺(即CUDA)生態(tài)。
在龐大的開發(fā)者生態(tài)基礎(chǔ)上,有為數(shù)眾多的AI開發(fā)者基于CUDA提供的基礎(chǔ)計算功能開發(fā)出針對不同場景的各類高階功能封裝。開發(fā)者大部分是面向具體問題,從價值閉環(huán)的角度解決場景需求。所以開發(fā)者生態(tài)既降低了芯片應(yīng)用的門檻,又因為在具體行業(yè)場景中的價值體現(xiàn)進一步拉動了芯片的需求。
“一個真正好的產(chǎn)品一定不是在實驗室里做出來的,他必須要經(jīng)過市場的打磨,才能變得更好。”楊帆說道。商湯智能計算中心可以給專注于半導(dǎo)體技術(shù)本身的國產(chǎn)芯片廠商提供從場景需求牽引,到軟件價值生態(tài)全鏈條的配套支持。
這如同提供了一整套高質(zhì)量的考卷,上面所包含的考題足夠多,難度足夠大,案例足夠復(fù)雜,區(qū)分度足夠明顯,只有答好并通過這套綜合試卷的檢驗,國產(chǎn)化芯片廠商才能從眾多競爭者中脫穎而出。
“國外芯片頭部企業(yè)背后都有一個強大的生態(tài)體系進行支撐。而國內(nèi)的現(xiàn)狀是專注應(yīng)用場景的算法廠商較少涉足芯片領(lǐng)域,而芯片廠商反過來又很難接觸到行業(yè)一線的反饋,沒有形成一個迭代的良性閉環(huán),但這恰恰是AI生態(tài)建立的必由之路。”楊帆表示,商湯希望通過自己的經(jīng)驗積累與快速迭代,為二者建立一座連接的橋梁,推動國內(nèi)AI生態(tài)的建立。
據(jù)了解,到2024年所有服務(wù)器全部到位的時候,商湯智能計算中心國產(chǎn)化的硬件比例將超過50%。
商湯AIDC對算力的海量需求可以為各類國產(chǎn)芯片提供大規(guī)模應(yīng)用的環(huán)境,真實從需求端拉動國產(chǎn)芯片的大規(guī)模發(fā)展,助力國產(chǎn)化芯片市場化打磨,從而對國產(chǎn)化芯片的研制形成體系性支撐。
攻關(guān)AI超大模型訓(xùn)練
超大規(guī)模預(yù)訓(xùn)練模型是當(dāng)前AI領(lǐng)域研究熱點。2020年7月,國際知名科研機構(gòu)OpenAI發(fā)布的具有1750億參數(shù)量的GPT-3模型具備著通用性以及零樣本泛化的能力,構(gòu)建起了其在自然語言處理領(lǐng)域的超大模型研究技術(shù)壟斷。2021年1月,Google發(fā)布了自然語言模型Switch Transformer,參數(shù)量更是達到萬億規(guī)模。
從技術(shù)研究視角而言,超大模型是下一個促進技術(shù)突破的關(guān)鍵點,也是構(gòu)建起算力壁壘和性能壁壘的核心。“解決特定行業(yè)中的多場景長尾算法需求,需要用足夠多的數(shù)據(jù)、足夠大的算法,去訓(xùn)練一個足夠大的通用模型,然后在通用模型下再去做小的場景模型,成本就會降低。”楊帆告訴第一財經(jīng)。
但不容忽視的是,支撐超大模型訓(xùn)練所需要付出的算力成本也是驚人的。2019年,微軟與人工智能研究實驗室OpenAI共同規(guī)劃構(gòu)建的Azure人工智能算力平臺為例,投資規(guī)模就達到10億美元。此外,僅僅是完整訓(xùn)練一遍GPT-3這樣的超大模型就需要花費1200萬美元。
對此楊帆認為,“這并不意味著國內(nèi)企業(yè)做數(shù)字化轉(zhuǎn)型升級都需要去做這樣大的一個投入。在這個過程中,需要將算力變成公共基礎(chǔ)設(shè)施,集約化的去做產(chǎn)業(yè)升級。”而以上海為龍頭的長三角區(qū)域,乃至整個國家的數(shù)字化轉(zhuǎn)型,正是需要這樣的“新基建”投入,讓開發(fā)者、數(shù)據(jù)科學(xué)家和商業(yè)客戶都可以低門檻應(yīng)用AI,加速新產(chǎn)業(yè)應(yīng)用場景的出現(xiàn)和技術(shù)落地。
值得關(guān)注的是,商湯已經(jīng)在超大模型技術(shù)研究方面取得一定成績。例如在計算機視覺的卷積神經(jīng)網(wǎng)絡(luò)(CNN)領(lǐng)域,通常模型參數(shù)都在1億以下,商湯的AI框架SenseParrots支持50億參數(shù)超大視覺模型的訓(xùn)練。
商湯將在現(xiàn)有積累上,持續(xù)推進計算機視覺超大模型無人區(qū)技術(shù)探索輸出超大規(guī)模神經(jīng)網(wǎng)絡(luò)設(shè)計研發(fā)體系,構(gòu)建高精度模型壁壘,推動整個視覺領(lǐng)域的性能邊界突破。以CNN領(lǐng)域為例,商湯AIDC完全投入使用后,計劃支持的超大視覺模型訓(xùn)練參數(shù)可達更高的數(shù)量級。
開源算法生態(tài)助力“新基建”
不同于互聯(lián)網(wǎng)時代開源軟件框架,AI時代開源的核心是算法。以往的互聯(lián)網(wǎng)企業(yè)做數(shù)字化,主要是給企業(yè)提供一個信息化的基礎(chǔ)設(shè)施,剩下的信息化工作由企業(yè)自己完成。
但AI時代真正能給尋求AI產(chǎn)業(yè)升級的客戶帶來閉環(huán)價值的,是整個應(yīng)用閉環(huán)的場景落地能力。因此單純開放一個訓(xùn)練框架,沒有生態(tài)的牽引與配合,難以給整個產(chǎn)業(yè)升級帶來很大的價值。
“算法、算力、數(shù)據(jù)之外,應(yīng)用才是所有東西更有價值的部分,而應(yīng)用的解決離不開超大算力支撐、海量算法的生態(tài)建設(shè)以及數(shù)據(jù)的安全保護。”楊帆告訴第一財經(jīng)。
例如在智慧城市場景下,伴隨城市數(shù)字化進程加深,城市治理開始從以人為主,拓展至對城市物體、事件的關(guān)注。如共享單車違停、泥頭車違規(guī)拋灑、高空拋物等一直困擾著城市居民和管理者的城市治理問題,都需要AI提供新的解決思路。在這個背景下,算法的工業(yè)級生產(chǎn)能力變成AI深入長尾場景,完善客戶價值閉環(huán)的關(guān)鍵。
商湯很早就意識到這一問題,在開源算法領(lǐng)域進行了多年探索,并打造了OpenMMLab人工智能算法開源體系,涉及了超過10個研究方向,開源了超過130種算法、1000種預(yù)訓(xùn)練模型。從2018年10月啟動至今,OpenMMLab已經(jīng)在GitHub累計收獲30000個關(guān)注,遙遙領(lǐng)先于其他單個垂直領(lǐng)域的算法和框架。
基于SenseParrots和OpenMMlab積累的平臺優(yōu)勢,商湯智能計算中心向下可以接入更多的硬件廠商,把硬件算力轉(zhuǎn)化為產(chǎn)業(yè)價值;向上可以支持更多的企業(yè)落地AI服務(wù),支撐AI向產(chǎn)業(yè)賦能,形成發(fā)散式的產(chǎn)業(yè)鏈結(jié)構(gòu)。
“通過這個平臺商湯希望完成堅持原創(chuàng)和賦能百業(yè)的初心,另一方面通過搭建公共服務(wù)平臺,去推動整個AI產(chǎn)業(yè)更蓬勃健康的發(fā)展。”楊帆說道。
談及將智能計算中心落地上海的原因,楊帆認為上海乃至長三角區(qū)域是傳統(tǒng)重型工業(yè)和制造業(yè)最集中、發(fā)達的區(qū)域,這些產(chǎn)業(yè)都面臨轉(zhuǎn)型升級,如果能夠激活它們進行數(shù)字化轉(zhuǎn)型,會對整個經(jīng)濟產(chǎn)生很強的杠桿促進作用,也會給商湯帶來更多的產(chǎn)業(yè)客戶,一起創(chuàng)造雙贏。此外上海的政策支持和營商環(huán)境也給予商湯更強的落地信心。
上海市經(jīng)信委人工智能發(fā)展處副處長孫躍告訴第一財經(jīng),智能計算中心是支撐人工智能產(chǎn)業(yè)發(fā)展和城市數(shù)字化轉(zhuǎn)型很重要的基礎(chǔ)設(shè)施,通過超大規(guī)模、集約化的算力部署,可以降低AI技術(shù)和成本門檻,讓AI真正賦能百業(yè),起到降本、增效和提質(zhì)的作用。
另一方面,智能計算中心也是貫通產(chǎn)業(yè)鏈上下游很重要的載體和平臺,它可以有效帶動上游國產(chǎn)芯片的發(fā)展,為國產(chǎn)智能芯片提供一個真實的應(yīng)用場景,也可以帶動下游智能軟件和應(yīng)用的發(fā)展。
“通過這一平臺可以將AI整個軟硬件產(chǎn)業(yè)鏈打通,構(gòu)建人工智能大生態(tài),有效推動整個產(chǎn)業(yè)鏈上下游的發(fā)展,同時也能將AI能力更好地應(yīng)用于經(jīng)濟社會發(fā)展和城市治理,這將進一步推動上海以人工智能為載體打造‘國內(nèi)大循環(huán)的中心節(jié)點、國內(nèi)國際雙循環(huán)的戰(zhàn)略鏈接’。”孫躍表示。
美格智能公告,預(yù)計2025年第一季度歸屬于上市公司股東的凈利潤為4000萬元–5200萬元,同比增長518.53%-704.09%。
埃夫特與華為云合作,探索具身智能新生態(tài);“天衍”量子計算云平臺訪問量突破2700萬;ChatGPT大幅提升記憶能力。
廣東近年來在省重點領(lǐng)域研發(fā)計劃中連續(xù)布局“新一代人工智能”“智能機器人與裝備制造”重大專項。
高質(zhì)量數(shù)據(jù)作為人工智能應(yīng)用的底座,不僅對通用大模型具有很強的保障支撐作用,對行業(yè)大模型更加重要。
服務(wù)機器人廠商擎朗智能發(fā)布人形機器人XMAN-R1