解碼元翌智能:昇騰AI創(chuàng)新大賽金獎(jiǎng)得主的技術(shù)拼圖
過去兩年里,大模型可以說外界討論最多的技術(shù)話題,且?guī)缀趺恳淮味紩?huì)出現(xiàn)這樣的疑問:大模型的價(jià)值到底在哪里?
不少人曾嘗試給出答案。
在日常工作中,生成式AI的能力漸漸成為一種標(biāo)配,寫文案、生成圖像、文本翻譯、編程等應(yīng)用越來越成熟。
在日常生活中,一個(gè)個(gè)智能體深度影響了人們的生活,醞釀出了聊天對話、圖生視頻、幫點(diǎn)外賣等新奇玩法。
不久前舉辦的昇騰AI創(chuàng)新大賽,從另一個(gè)角度進(jìn)行了回答:在千行萬業(yè)的細(xì)分場景中,大模型正在和產(chǎn)業(yè)需求深度融合,通過破解阻礙行業(yè)發(fā)展的技術(shù)性難題,迸發(fā)出了實(shí)實(shí)在在的新質(zhì)生產(chǎn)力。
比如用大模型實(shí)現(xiàn)遙感影像解譯的元翌智能。
01 被解譯環(huán)節(jié)“困”住的千億級市場
目前全球在軌運(yùn)行遙感衛(wèi)星達(dá)1659顆,其中中國已經(jīng)發(fā)射451顆,并且高分系列遙感衛(wèi)星的分辨率已經(jīng)提升至亞米級,被廣泛應(yīng)用于國土資源與環(huán)境監(jiān)測、農(nóng)作物監(jiān)測與估產(chǎn)、森林碳匯估算等領(lǐng)域。
根據(jù)中國地理信息產(chǎn)業(yè)協(xié)會(huì)的數(shù)據(jù),2023年國內(nèi)地理信息產(chǎn)業(yè)總值達(dá)到了8111億元,約是2015年的2.3倍。參考衛(wèi)星遙感信息服務(wù)10%左右的占比,等待商業(yè)遙感的將是一個(gè)千億級的藍(lán)海市場。
按照上中下游的模式拆解遙感產(chǎn)業(yè)鏈:上游是數(shù)據(jù)生產(chǎn),即遙感衛(wèi)星的數(shù)據(jù)采集;中游是數(shù)據(jù)處理、地物監(jiān)測信息等服務(wù),直接關(guān)系到產(chǎn)業(yè)前景;下游是農(nóng)業(yè)、林業(yè)、國土、測繪等應(yīng)用需求。
當(dāng)前被限制的,正是中游的解譯環(huán)節(jié)。
遙感衛(wèi)星獲取到的信息,通常是以復(fù)雜的光學(xué)或雷達(dá)信號形式呈現(xiàn)的,需要將信息解譯成可理解、可應(yīng)用的形式。
其中的難點(diǎn)在于,不同復(fù)雜場景的多模態(tài)觀測機(jī)理差異大、地表要素解譯受自然/人為因素影響大、復(fù)雜多樣的地表要素特征變化大,導(dǎo)致大規(guī)模遙感數(shù)據(jù)處理平臺建設(shè)與共享等方面存在諸多困難。
譬如國內(nèi)在測繪、國土、林業(yè)、農(nóng)業(yè)等行業(yè)遙感調(diào)查與更新,主要采用的還是人工目視解譯的工作方式,耗時(shí)、費(fèi)力、成本高、周期長,無法滿足快速提取與更新的需求,直接制約了商業(yè)遙感的市場應(yīng)用。
打一個(gè)比方的話:遙感衛(wèi)星拍攝的地球圖像就像是對地球表面做了一次“體檢”,記錄下了各類“身體指標(biāo)”(比如植被覆蓋率、水體分布等),解譯人員就像醫(yī)生,通過經(jīng)驗(yàn)和專業(yè)知識分析“體檢數(shù)據(jù)”,找出重要的信息(比如哪里是森林、哪里是城市、哪里可能存在問題)。擺脫對人的依賴,將是商業(yè)遙感爆發(fā)的核心一環(huán)。
為了改變?nèi)斯そ庾g的低效局面,國內(nèi)外學(xué)者在2013年就開始深度學(xué)習(xí)方法進(jìn)行智能遙感解譯的研究,涉及目標(biāo)與場景檢索、目標(biāo)檢測、地物分類、變化檢測、三維重建等,而且部分成果達(dá)到了實(shí)用水平。
問題在于,遙感影像比目標(biāo)識別復(fù)雜得多,特別是自然地物分類方面,一直無法滿足業(yè)務(wù)化的應(yīng)用需求。
好在向AI要解法始終是遙感產(chǎn)業(yè)上下游的共識,其中就包括西安電子科技大學(xué)的人工智能學(xué)院遙感大數(shù)據(jù)解譯團(tuán)隊(duì),在衛(wèi)星遙感領(lǐng)域深耕了20多年,近五年獲省部級一等獎(jiǎng)3項(xiàng)、獲得國際國內(nèi)競賽冠亞季軍100多項(xiàng)、發(fā)表論文250余篇、獲批專利100余項(xiàng),一直在尋找技術(shù)解決方案。
02 智算中心“埋下的種子開出了花”
時(shí)間來到2021年9月,位于雁塔區(qū)的西安未來人工智能計(jì)算中心正式上線,可提供300P的昇騰算力。
同樣是在2021年,西安電子科技大學(xué)人工智能學(xué)院遙感大數(shù)據(jù)解譯團(tuán)隊(duì)在華為的支持下入駐智算中心,帶著“讓遙感賦能千行百業(yè)”的愿景走出實(shí)驗(yàn)室,創(chuàng)辦了陜西元翌智能科技有限公司。
和AI的數(shù)據(jù)、算法、算力三要素相似,遙感影像解譯也有三大核心要素:遙感影像樣本數(shù)據(jù)庫、遙感解譯大模型和大規(guī)模計(jì)算中心。到了2022年,用大模型解譯遙感影像的條件越來越成熟。
在遙感影像樣本數(shù)據(jù)方面,國內(nèi)高分系列衛(wèi)星提供了超過300萬+平方公里遙感數(shù)據(jù),訓(xùn)練數(shù)據(jù)總量超過100T;在算力資源方面,西安未來人工智能計(jì)算中心的智能算力,提供了充沛的算力資源。
元翌智能開始研發(fā)元翌遙感影像解譯大模型,針對廣域場景遙感影像解譯、大規(guī)模網(wǎng)絡(luò)并行訓(xùn)練等難題,設(shè)計(jì)了大場景預(yù)處理、地物要素提取、變化檢測等專用算子,并在技術(shù)架構(gòu)上進(jìn)行了一系列自主創(chuàng)新。
一個(gè)是全要素提取方案,針對地物類別不均勻、數(shù)據(jù)跨度大、實(shí)時(shí)解譯困難,元翌智能構(gòu)建了任務(wù)決策引導(dǎo)的可解釋學(xué)習(xí)框架,實(shí)現(xiàn)了人造地表要素、林草地要素、耕地要素、災(zāi)變要素等復(fù)雜場景下的全要素提取;
另一個(gè)是復(fù)雜場景多要素高精度綜合解譯,元翌智能團(tuán)隊(duì)基于地學(xué)知識圖譜構(gòu)建了場景多要素復(fù)合關(guān)系模型,通過場景知識和解譯知識的因果推斷,實(shí)現(xiàn)了立體交疊、平面交織等多要素沖突下的判別和消歧。
集齊了“天時(shí)、地利、人和”的元翌智能,通過元翌遙感影像解譯大模型交出了一份亮眼的成績單:
通過多層次的解譯體系,能夠覆蓋100+類別地物,實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的精準(zhǔn)分析;實(shí)現(xiàn)廣域真實(shí)場景下多任務(wù)并行高精度實(shí)時(shí)解譯,而且平均解譯精度達(dá)到了85%以上;原本至少需要1人·月的億級像素遙感影像,現(xiàn)在只有10分內(nèi)就能完成解譯工作。
深諳遙感產(chǎn)業(yè)現(xiàn)狀的元翌智能,讓遙感產(chǎn)業(yè)告別陷入困境的同時(shí),還打通了大模型落地的“最后一公里”。
相對應(yīng)的是元翌智能的大模型架構(gòu)體系:面向全域全要素的L0基礎(chǔ)大模型,關(guān)注給定區(qū)域內(nèi)所有與生產(chǎn)生活相關(guān)的地物要素,可滿足國土測繪調(diào)研等需求;面向特定領(lǐng)域的L1行業(yè)大模型,可滿足農(nóng)業(yè)、林業(yè)、水利等不同行業(yè)的地物要素需求;面向精準(zhǔn)場景和特定要素的L2場景大模型,可以滿足農(nóng)作物分類、鐵路沿線安全檢測等個(gè)性化需求……進(jìn)一步打通了商業(yè)遙感的可行路徑。
03 釋放智慧遙感產(chǎn)業(yè)的“無限可能”
近十年里,國內(nèi)在遙感領(lǐng)域累計(jì)投入的經(jīng)費(fèi)超過3600億元,遙感衛(wèi)星的數(shù)量占到了在軌衛(wèi)星的60%以上,僅民用對地觀測衛(wèi)星每天接收的原始數(shù)據(jù)就超過了10TB。
但相當(dāng)長的一段時(shí)間里,遙感的價(jià)值并不被外界所理解。
打破了遙感圖像“解譯”瓶頸的元翌遙感大模型,疏通了遙感產(chǎn)業(yè)上下游的堵點(diǎn),讓上游的數(shù)據(jù)價(jià)值被發(fā)揮出來,下游的迫切需求得到了滿足,釋放出了隱藏在智慧遙感產(chǎn)業(yè)背后的新質(zhì)生產(chǎn)力。
比如在自然資源監(jiān)管方面。通過分析不同時(shí)間點(diǎn)的遙感影像,可以對某地區(qū)的自然資源變化進(jìn)行監(jiān)管。
陜西省渭南市臨渭區(qū)是國內(nèi)著名的獼猴桃產(chǎn)區(qū),當(dāng)?shù)刂鞴懿块T利用元翌遙感影像解譯大模型進(jìn)行了獼猴桃地物種植區(qū)域識別的微調(diào)工作,對全域約6.7萬畝獼猴桃種植區(qū)域進(jìn)行精準(zhǔn)解譯,精度高達(dá)95%以上,極大地縮短了對不同種植階段獼猴桃種植區(qū)的長勢特點(diǎn)的考察時(shí)間和成本。
比如在生態(tài)文明建設(shè)方面。通過分析一段時(shí)間里的自然環(huán)境變化,為生態(tài)環(huán)境的精準(zhǔn)檢察提供數(shù)據(jù)參考。
西安市秦嶺生態(tài)保護(hù)局使用元翌遙感影像解譯大模型監(jiān)測了秦嶺光頭山2015年到2022年的生態(tài)環(huán)境,監(jiān)測草甸、植被、樹木、建筑物、道路等地物要素的變化情況;相似的一幕還出現(xiàn)在陜西省人民檢察院對安康旬陽礦區(qū)的監(jiān)測,監(jiān)測耕地、植被、河流、大小道路等地物特征的變化。
再比如災(zāi)害應(yīng)急管理方面。借助遙感圖像進(jìn)行洪災(zāi)監(jiān)測和評估,或者是地震、泥石流等災(zāi)情的緊急分析。
2023年8月,西安灃峪口發(fā)生了洪澇災(zāi)情,陜西省應(yīng)急廳與陜西省高分中心協(xié)調(diào)獲取了災(zāi)后高分系列衛(wèi)星數(shù)據(jù),借助元翌遙感大模型進(jìn)行解譯后,用來分析主要受災(zāi)點(diǎn)的情況,對災(zāi)情反饋、道路搶修以及居民安置起到重要參考作用,為災(zāi)害應(yīng)急的科學(xué)管理和部署提供了準(zhǔn)確的數(shù)據(jù)支撐。
可以找到的案例還有很多。
或許對于很多人來說,“遙感大模型”的概念依舊比較陌生,但距離我們的生活并不遙遠(yuǎn),在環(huán)境監(jiān)測、災(zāi)害預(yù)警、城市規(guī)劃等社會(huì)的方方面面,都離不開“遙感大模型”的身影。
這樣的創(chuàng)新者,不應(yīng)該被“埋沒”。
2024年5月初,昇騰AI創(chuàng)新大賽2024正式啟動(dòng),元翌智能的“元翌遙感影像解譯大模型解決方案”,憑借在大模型領(lǐng)域的自主創(chuàng)新和落地應(yīng)用的生產(chǎn)力躍升,一路過關(guān)斬將,先是拿到了陜西賽區(qū)的金獎(jiǎng),最終站在了2024昇騰AI創(chuàng)新大賽全國總決賽的領(lǐng)獎(jiǎng)臺——斬獲企業(yè)賽道原生創(chuàng)新組金獎(jiǎng)。
04 寫在最后
屬于元翌智能的故事遠(yuǎn)沒有結(jié)束。
接下來的日子里,元翌智能將繼續(xù)迭代更新L0級基礎(chǔ)模型,優(yōu)化基礎(chǔ)解譯算法的準(zhǔn)確性;升級L1級行業(yè)大模型,優(yōu)化解譯算法的行業(yè)適應(yīng)性和準(zhǔn)確性;完善L2級場景大模型,增強(qiáng)復(fù)雜場景下的動(dòng)態(tài)更新能力。
也讓我們有理由相信,在元翌智能等企業(yè)的創(chuàng)新驅(qū)動(dòng)下,商業(yè)遙感的千億級市場將被進(jìn)一步挖掘,讓更多行業(yè)分享到創(chuàng)新的紅利。
轉(zhuǎn)載請?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)