中國深度學習平臺逆襲,只是因為“國潮”嗎?
一直到今天,柯潔也未必知道,他2017年看似輸給了阿爾法狗,但實際上是輸給了深度學習平臺。
相比于之前以職業棋手為目標的圍棋AI,阿爾法狗棋力突然飛升的核心原因,在于搭載了深度學習模型。谷歌在2015年推出了深度學習框架TensorFlow,引入深度學習這項原來算法復雜、算力需求極高、開發難度極大的技術,也有效降低了深度學習模型的開發成本。
甚至可以說,TensorFlow推出后,柯潔敗給AI已經只是時間問題,沒有阿爾法狗,也會有阿爾法貓或者貝塔狗。
這個故事告訴我們,雖然人工智能的新聞紛繁復雜,但是目前從實用化角度來說,深度學習底層構建是一條重要主線。2015年其出現之前,AI需要從零開始研發,因此應用停留在比較淺的階層;2015年之后,谷歌發布TensorFlow則讓AI應用落地有了全新的想象空間。
但,牌桌上的玩家層出不窮。
一、“中國玩家”的彎道超車
盡管擁有先發優勢,但TensorFlow沒有一統江湖,并不出人意料。
作為深度學習平臺的開創者,TensorFlow有一個公認評價,“什么都好,就是不好用”。反觀Meta推出的PyTorch,雖然時間更晚,但更具有通用性,結果谷歌因此被迫先后推出TensorFlow2.0和JAX進行防御。
這看似是TensorFlow的戰略失誤,而從更高的維度來講,TensorFlow不可能既滿足通用性又滿足專業性。作為一個前途廣闊的領域,雖然深度學習平臺作為人工智能的基礎設施投資巨大,但是正如CPU有英特爾和AMD,手機操作系統也是蘋果和安卓共分天下一樣,獨木不成林,似乎只有兩強爭霸并立才能形成穩定態。
但是,這樣的兩強體制也因以飛槳為代表的“中國平臺”集體登場而被打破格局。
2022年7月28日,在2022全球數字經濟大會“人工智能驅動未來產業論壇”上,中國信通院與深度學習技術及應用國家工程研究中心聯合發布了《深度學習平臺發展報告》。報告顯示,在經過多維度分析,百度飛槳在中國深度學習市場應用規模已經達到第一。截至2022年5月,飛槳已累計凝聚477萬開發者、服務18萬企事業單位、創建56萬AI模型。與此同時,華為昇思、曠視天元、之江天樞等深度學習平臺,同樣也獲得了快速發展。
無獨有偶,在信通院發布報告之前,調研機構IDC和弗若斯特沙利文同樣發布了相關報告,結果分別顯示百度飛槳的中國深度學習市場綜合份額第一、綜合競爭力第一。
2016年正式開源的飛槳,如何能在底層框架這樣馬太效應強烈的領域完成彎道超車?
這看似不可思議,但實際上卻可能有某種必然性。
首先,經過一系列卡脖子事件之后,中國無論是硬件還是軟件,都對安全性有著更高的需求。而更重要的是,中國AI的產業體量,也到了不可能不去爭奪底層控制權的時期。
根據IDC預測,在2020-2024年中國人工智能整體市場規模將保持30.4%的年復合增長率,到2024年將達到172.2億美元,在全球占比從2020年的12.5%上升到2024年的15.6%,實力位居全球第三,前兩名是美國和打包在一起的歐洲。
這樣的規模和增速,意味著中國的AI產業來到了與2011年通信產業相同的境地:當年中國終于普及3G,用戶數和市場規模達到世界第三,巨大的體量,意味著遵守別人底層規則產生的摩擦成本以及額外費用,會迅速超過自建標準和基礎設施的投入。因此中國通信產業既有實力,也不得不深度介入通信標準制定,而下一年,中國制定的4G標準成為國際通信標準之一。
很多時候,決戰紫禁之巔不是因為恩怨情仇,而是劇情已經到這里了。
二、“飛槳們”的底氣在哪里?
中國本土深度學習平臺厚積薄發的依仗,來自中國對深度學習產業的特殊需求。
雖然從總體而言,深度學習平臺的發展方向都是更體系化,更專業化,更低門檻。但是因為國內外發展速度、應用場景以及產業水平的差距,在在解決具體問題上,中國對深度學習平臺的要求,往往跟國外千差萬別。
舉例而言,作為擁有14億人口的世界工廠,中國無論是制造業還是服務業,任何一個程序,都可能應用到十幾甚至幾十萬個單位和機構,直接面向數億人,完全不同的用戶體量,一方面決定了中國場景需求跟國外需求不完全相同,超大規模深度學習模型訓練技術的需求擺上臺面,另外還會催生更多千姿百態的、低數量級用戶完全不需要的應用場景。
這樣的總體狀況,使得中國的深度學習對端到端的推理部署能力和在產業實踐當中沉淀出來的模型更為重視。
其次AI市場規模的快速擴張又導致人才相對稀缺,再加上總體產業發展水平還比較落后,因此對降低AI門檻的需求永無止境,更進一步催化了低代碼乃至無代碼模型的發展,而這一切都很難從國外的深度學習平臺得到幫助,甚至反過來是中國用戶拖著國外平臺前進,這種溫度差,就是中國深度學習平臺發展的動力。
但是,中國AI產業發展的需求,是給了所有的深度學習平臺同等的機會,為什么飛槳做到了中國第一?這在很大程度上,是一個機會青睞了有準備者的故事。
飛槳的競爭優勢,首先來自技術應用能力方面,來源于百度在AI領域數十年的技術積累。早在2013年,百度便成立全球第一個深度學習研究院;而在飛槳誕生之后,百度絕大多數人工智能項目都是基于飛槳研發和創新。
相比于其他在后來才建立的深度學習平臺,飛槳的冷啟動有了百度研發這個巨大的應用場景,不僅提升了工具和框架的易用性和成熟度,而且先期積累了更多人工智能的應用模型,特別是從2019年開始,百度AI的能力逐漸下沉,開始跟產業經濟和生產一線相結合,在飛槳平臺上也展現出越來越多的產業項目,這些與產業相結合的人工智能應用模型,使得飛槳獲得了更強的競爭力。
因為有這樣的先期發展基礎,所以飛槳有著更強的比較優勢,所以很快迎來了迅速發展的機會,平臺服務規模開始不斷擴張。
相比于其他平臺,飛槳不僅擁有便捷的開發框架,而且還有多端多平臺部署的高性能推理引擎、產業級開源模型庫,以及更適合中國AI場景的超大規模深度學習模型訓練技術。大規模分布式訓練能力在真正的工業化場景應用更加契合,因此用戶數實現快速增加。
根據《深度學習平臺發展報告(2022)》顯示,在過去一年半里,飛槳的項目貢獻人數(Contributors)增速為60%,關注度增速為37.6%。均超過了國際主流框架。而在總數上,無論是活躍度,還是關注度和貢獻人數,飛槳均超過其余國產框架總和。
總體而言,飛槳發展的最根本動力,還是來自于中國人工智能進入大規模工程落地階段,深度學習隨著AI進入千行百業,而需求的推動又引發中國AI能力的厚積薄發,和AI研發者的迅速增加,最終帶動了國產平臺的迅速發展。
從這種意義上講,飛槳們的崛起,是我國算法開發能力、產業和生態積累至今的總和。
三、“黃金十年”的舞臺
在未來,AI將迎來“黃金十年”,而深度學習平臺,有可能成為新時代的“操作系統”。
有機構預測,到2030年,AI可能使全球總產量增長約13萬億美元,并推動全球GDP每年增長約1.2%,而在這一輪人工智能帶動的增長中,深度學習仍是主導路線,并且會隨著產業發展對AI底層基礎設施提出更高要求,以科技巨頭引領的平臺化生態布局正不斷加速。正如百度CTO王海峰所言,在人工智能工業大生產階段,深度學習平臺下接芯片、上承應用,相當于“人工智能時代的操作系統”,處于人工智能技術體系的關鍵核心位置。
因此,飛槳們并非是一個“圖方便”的國內自有平臺,或者提升國內AI產業獨立性的防御體系,而是是一張通往未來的船票。它的能力還未完全發揮,未來在驅動產業賦能,推動AI發展上還有更大的空間。
首先,當前深度學習平臺主要是幫助軟件開發者,但是長遠來看,深度學習平臺是鏈接軟硬件的橋梁,平臺能夠與芯片企業共同圍繞軟硬協同進行聯合優化,從而提升對差異化的硬件芯片的適配能力,最終提升整體的AI性能,起到“操作系統”的作用,比如百度飛槳就與硬件廠商深入合作,進行廣泛模型適配并開展軟硬一體聯合優化,目前已與超過20個廠家,30種以上的芯片完成適配工作,并聯合發起硬件生態共創計劃。
其次,深度學習平臺還能夠進一步提升賦能平臺廣度,向更多行業更多領域拓展,并通過提供端到端代碼實現方案降低行業創新門檻,如飛槳提供超過500個精選算法和預訓練模型,其中就包含了經過產業實踐長期打磨的主流模型;結合產業實際場景、精心打造了精度與性能平衡PP系列特色模型,覆蓋目標檢測、OCR、語音理解等多個高頻應用場景,可以讓AI產業應用時達到事半功倍的效果;飛槳產業范例庫和產業模型選型工具則以真實產業場景和數據為藍本進行研發,涵蓋智慧城市、智能制造等多個領域,助力企業靈活運用模型和開發套件構建完整的落地方案,直達項目落地,降低AI產業落地難度。
最后深度學習平臺不僅是AI開發者的聚集地,同時也是孵化器,當前,深度學習平臺正通過組織培訓、技術指導、賽事等活動等方式,與開發者共建社區生態。同時,通過組織人工智能賽事活動,推動在前沿研究、產業應用中的AI技術難點攻關。
總而言之,雖然從客觀上來講,飛槳等國內平臺只是邁出了萬里長征第一步,距離其成為AI產業核心驅動力的“完全形態”還有很長的距離,但是深度學習平臺的增長并非是線性增長,而是技術水平、算力、用戶規模、模型數量的復合型增長,在“乘數效應”的驅動下,可以想見,在不遠的未來,深度學習平臺會在近至自動駕駛,遠至天地探測,小到蛋白質折疊預測,大到核聚變裝置控制的廣闊領域里,為我們的技術發展帶來新的曙光。
所以,中國的深度學習平臺并不只是逆襲,更是在順風飛翔。
作者:錢皓
編輯:安吉拉
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)