分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
在9月21日召開的第一屆空天信息技術(shù)大會上,我國研究團(tuán)隊(duì)發(fā)布了全球首個(gè)百億級遙感解譯基礎(chǔ)模型。遙感大模型通過遙感影像數(shù)據(jù)結(jié)合人工智能數(shù)據(jù),提供精準(zhǔn)精細(xì)化服務(wù),在多個(gè)行業(yè)具有廣泛的應(yīng)用場景。
據(jù)悉,最新發(fā)布的全球首個(gè)百億級遙感解譯基礎(chǔ)模型為“空天·靈眸”3.0版,由中國科學(xué)院空天信息創(chuàng)新研究院科研團(tuán)隊(duì)聯(lián)合鵬城實(shí)驗(yàn)室研發(fā)。研究團(tuán)隊(duì)基于中國算力網(wǎng)“鵬城云腦II”樞紐節(jié)點(diǎn),歷時(shí)數(shù)月攻關(guān)完成了在4億張國產(chǎn)化多模態(tài)空天遙感數(shù)據(jù)樣本上的預(yù)訓(xùn)練,基礎(chǔ)模型參數(shù)規(guī)模首次超過百億。
近年來,我國遙感數(shù)據(jù)獲取能力不斷增強(qiáng),已進(jìn)入遙感大數(shù)據(jù)時(shí)代,人工智能等新型數(shù)據(jù)處理方式也為數(shù)據(jù)服務(wù)模式的變革提供了可能。模型的參數(shù)越大,能捕捉和處理復(fù)雜信息的能力就越強(qiáng),從而更加準(zhǔn)確、精細(xì)地完成更困難、更復(fù)雜的任務(wù)。
中國科學(xué)院空天信息創(chuàng)新研究院研究員孫顯介紹,“空天·靈眸”3.0版內(nèi)核工作架構(gòu)是基于熱傳導(dǎo),這是聯(lián)合團(tuán)隊(duì)自主研發(fā)的一套小而精的原創(chuàng)性架構(gòu)。受傳熱學(xué)物理思想啟發(fā),聯(lián)合團(tuán)隊(duì)將場景目標(biāo)間視覺語義傳播建模為熱能擴(kuò)散過程,從而使該架構(gòu)有效突破了遙感模型推理的性能和速度瓶頸,計(jì)算速度較傳統(tǒng)結(jié)構(gòu)模型提升2.4倍以上。
目前,“空天·靈眸”3.0版在覆蓋場景分類、目標(biāo)檢測、語義分割、變化檢測等6大類任務(wù)的23個(gè)國際基準(zhǔn)數(shù)據(jù)集上測試,指標(biāo)均達(dá)到領(lǐng)先水平,并已在應(yīng)急、國土、海洋、住建等多個(gè)行業(yè)部署試運(yùn)行,特別是在最具挑戰(zhàn)性的復(fù)雜要素精細(xì)分類、運(yùn)動小目標(biāo)連續(xù)跟蹤等任務(wù)上性能卓越,為天臨空地一體化應(yīng)用提供了一套行之有效的解決方案。
隨著遙感技術(shù)的高速發(fā)展,遙感領(lǐng)域持續(xù)生產(chǎn)了海量的多時(shí)相的遙感數(shù)據(jù)。據(jù)介紹,這些數(shù)據(jù)有接近自然影像的可見光影像,也有光譜信息比較多的多光譜數(shù)據(jù),還有雷達(dá)SAR影像,這些數(shù)據(jù)來自不同的衛(wèi)星,不同的傳感器,可將其視為不同模態(tài)的數(shù)據(jù)。但過去,這些數(shù)據(jù)都是沒有經(jīng)過標(biāo)注的,而且標(biāo)注這些數(shù)據(jù)不僅費(fèi)時(shí)費(fèi)力,在很多情況下只有依賴于專家經(jīng)驗(yàn)才能進(jìn)行。
近年來,業(yè)界出現(xiàn)了很多遙感影像數(shù)據(jù)獲取的渠道,比如歐空局哥白尼平臺,谷歌GEE平臺,中國資源衛(wèi)星中心的數(shù)據(jù)平臺,這些平臺都為研究人員獲得遙感數(shù)據(jù)提供了便利。結(jié)合視覺大模型的成功經(jīng)驗(yàn),這些因素為遙感大模型的研發(fā)提供了發(fā)展契機(jī)和動力。
第一財(cái)經(jīng)記者了解到,在國內(nèi),自2021年以來,業(yè)界就開始使用無監(jiān)督預(yù)訓(xùn)練的算法做遙感影像的識別,2022年中國科學(xué)院空天院發(fā)布了RingMo模型,2023年發(fā)布了Satlas模型,復(fù)旦大學(xué)也發(fā)布了GRAFT模型,模型的數(shù)據(jù)和參數(shù)的規(guī)模越來越大,性能越來越強(qiáng)。
從遙感模型的發(fā)展趨勢來看,呈現(xiàn)出三大趨勢:從支持單模態(tài)的數(shù)據(jù)到融合多模態(tài)的數(shù)據(jù);從只能覆蓋單一數(shù)據(jù)源的影像到可以融合多數(shù)據(jù)源的影像;從僅支持單張靜態(tài)影像的解譯到融合整個(gè)時(shí)序影像的信息。
包括螞蟻集團(tuán)在內(nèi)的公司都在開發(fā)遙感大模型。在今年的上海全球人工智能大會(2024 WAIC)上,螞蟻集團(tuán)遙感大模型負(fù)責(zé)人王劍介紹,螞蟻集團(tuán)基于螞蟻百靈大模型平臺,已經(jīng)研發(fā)了20億參數(shù)多模態(tài)遙感模型SkySense。通過在數(shù)據(jù)、模型架構(gòu)和無監(jiān)督預(yù)訓(xùn)練算法等方面的技術(shù)創(chuàng)新,SkySense在土地利用監(jiān)測、地物變化檢測等7種常見遙感感知任務(wù)。
一位空間科學(xué)資深研究人員對第一財(cái)經(jīng)記者表示,遙感大模型在多個(gè)應(yīng)用領(lǐng)域都展現(xiàn)出潛力,例如環(huán)境監(jiān)測與保護(hù)、農(nóng)業(yè)與自然資源管理、城市規(guī)劃與發(fā)展、應(yīng)急響應(yīng)與災(zāi)害管理等,同時(shí),也越來越多地應(yīng)用在碳中和領(lǐng)域。
據(jù)介紹,此前在森林保護(hù)項(xiàng)目中,已經(jīng)能通過遙感大模型支持自然風(fēng)化的變化檢測和人為破壞的變化檢測,從而實(shí)現(xiàn)大規(guī)模林地定期監(jiān)測和保護(hù);而遙感大模型也能夠在像素級別對主糧作物做出精準(zhǔn)識別。
古特雷斯表示,在無監(jiān)管的情況下發(fā)展人工智能可能使人工智能被用作欺騙工具,擾亂經(jīng)濟(jì)和勞動力市場。
林劍表示,之友小組將依托聯(lián)合國這個(gè)最具普遍性、權(quán)威性、代表性的政府間國際組織,打造人工智能能力建設(shè)的國際交流合作平臺。
通知明確加強(qiáng)中小學(xué)人工智能教育的總體要求。