深度學習暗戰:為何說百度飛槳是“國貨之光”
近年來,無論是生活還是生產,AI的身影無處不在,人工智能所帶來的世界新一輪科技革命和產業變革曙光已現,正在引發全球經濟結構的重塑,并與我國發展方式的轉變形成了歷史性交匯。
與此同時,AI技術背后的爭奪戰也成為了各方關注的中心,其中深度學習框架作為AI時代的“操作系統”已經暗潮洶涌。然而透過現象看本質,這場屬于技術流的戰爭卻值得我們深入思考。
全球權威咨詢IDC在《中國深度學習平臺市場份額調研》中,對國內的深度學習平臺給出了詳細的市場解析:在AI技術使用方面,接受調研的企業和開發者中,86.2%選擇使用開源深度學習框架。
不難看出,深度學習平臺已經開始備受信賴。然而信賴背后的“依賴”也開始成為隱患。
IDC還指出,在國內深度學習框架的使用上,谷歌、Facebook、百度雖然占據了國內絕大部分市場份額,但是來自國外的深度學習平臺仍處于較大的領先優勢。
也就意味著,在現階段的深度學習框架市場,我們處于和移動互聯網時代相同尷尬的境地——過度依賴他國技術。
倘若深度學習框架被“斷奶”,會產生什么樣的影響?
可以打這樣一個比方:深度學習就像是一道菜譜,數據是肉和蔬菜,深度學習框架就是炒菜的鍋和鏟子,如果被人拿走了鍋和鏟子,再高明的廚師也無法炒出一道像樣的菜。
芯片已經讓不少中國企業和開發者有了覆舟之戒,深度學習框架卻剛剛引起關注。
為什么要關注深度學習平臺?
自然而然的,深度學習框架也就成了“兵家必爭之地”。
目前已經出現了Caffe、TensorFlow、飛槳(PaddlePaddle)、PyTorch等幾十種開源框架。尤其是谷歌2015年底在GitHub上正式開源的TensorFlow,幾乎是當下使用最廣的深度學習框架。
谷歌對于TensorFlow的推廣不無成功,選擇使用TensorFlow的企業中,不乏網易、京東、360、聯想、美團等中國的科技企業。
但業界也出現了警惕TensorFlow的聲音。
比如亞馬遜、Facebook等對TensorFlow的封閉深惡痛絕,分別推出了MxNet、PyTorch等深度學習框架,希望以兼容性和開放優勢,打破谷歌一騎絕塵的格局;
蘋果也為自家開發者引入了BNNS 和 MPSCNN兩個深度學習框架,并在GitHub上發布了一個名為Turi Create的機器學習框架,降低AI開發的門檻,也為避免在人工智能的賽道上被谷歌扼住喉嚨。
原因似乎不難理解,雖然TensorFlow是開源的,TensorFlow已經與谷歌生態深度綁定,不排除會出現類似Android的局面。同時在商業層面上,谷歌為了賣自家的TPU,會不會逐漸放棄對其他GPU的支持?如果哪家公司在智能駕駛等核心技術上有趕超谷歌的趨勢,是否存在在TensorFlow層面被谷歌打壓的可能。
借鑒谷歌在Android問題上對華為的態度,那些深度依賴TensorFlow的開發者,無疑也處于一種高度不確定之中。
來自中國的“全尺寸輪胎”
與其信任他人“不作惡”的承諾,不如技術自立。
經濟學家何帆曾給出了這樣的預言:現在的“備胎”還只是出現在男女關系中,未來將是科技界使用最多的一個名詞。
深度學習框架有些例外,中國的企業早在未雨綢繆。早在2016年的時候,百度就將飛槳開源,以免將命運假于他人之手。國家也對此非常重視,國家發改委在2017年批復,國內唯一的深度學習技術及應用國家工程實驗室由百度牽頭籌建。
目前,飛槳不僅是中國首個,也是目前唯一開源開放、功能完備的端到端深度學習平臺。
這個集核心框架、工具組件和服務平臺為一體的端到端開源深度學習平臺,囊括支持面向真實場景應用、達到工業級應用效果的模型,針對大規模數據場景的分布式訓練能力、支持多種異構硬件的高速推理引擎等,并在不久前一次性發布11項新特性及服務,包含PaddleNLP、視頻識別工具集、Paddle Serving、PaddleSlim、AutoDL Design等多種深度學習開發、訓練、預測環節的“硬通貨”,滿足不同層次開發者的研發和創新需求。
相比于其他開源的深度學習框架,飛槳最大的特點在于easy to use,對很多算法進行了完整封裝,開發者只需要略微了解下源碼原理,導入自己的數據就可以執行運行的命令。
有了飛槳這樣的“全尺寸輪胎”,中國AI不缺少飛速前行的可能。
百度也積極通過產學研聯動推動飛槳的大范圍落地,通過師資培訓班,AI賽事等舉措,幫助近百所高校成功開設人工智能課程,直接惠及近萬名學生,為未來的AI話語權爭奪戰打下了良好的基礎。而飛槳在產研聯動的過程中,不僅僅作為教學工具助推教育,也在進一步減少開發者對外國深度學習框架的依賴。
經歷幾年的積累后,飛槳的一系列落地應用正在改變著各行各業:
在農業領域, 精確的地塊識別和分割在農業有非常重要的意義,有利于根據遙感數據對作物長勢、作物分類、成熟期預測、災害監測、估產等工作進行高效輔助,目前為止的絕大部分地塊分割都是靠人力進行的。比如中科賽諾應用飛槳對農業遙感數據進行圖像分割,對耕地面積進行提取,從而進行有效的估產并輔助相關其它農事活動。
在工業領域,合金熔煉的過程中,合金元素會根據爐內溫度、熔煉時間等因素發生無法用機理進行判斷和解釋的變化,傳統合金熔煉環節大多由有經驗的師傅進行補料,需要多次實驗和調整。精諾數據基于飛槳平臺研發了IAPBOA算法,利用歷史配料數據建模,通過機器學習優化企業個性化配料方案,最終達到生產質量和生產成本的最優平衡點,從而指導熔煉生產,減少對經驗的依賴,達到提升熔煉效率、節省原材料的效果。
這樣的案例還有很多很多,也正因為如此,深度學習平臺幾乎決定了AI未來應用的走向。
某種意義上說,中美的人工智能競賽很可能會演化成一場“框架之爭”。假如中國不在深度學習平臺市場占據一席之地,完全依賴國外,系統的透明性將逐漸消失,國外企業將成為全世界數據、硬件、編譯器的標準制定者。特別是人工智能的應用涉及到安防、識別、城市交通、公共服務等國家事務,把這些應用放在國外平臺上開發,安全風險不言而喻。
除了產業鏈風險,中美在人工智能的應用需求上也存在很大的差異,像TensorFlow在語音交互、神經網絡翻譯等核心技術上,很少有中文數據集以及中文領域的技術探索。換而言之,只有深諳中國開發者需求和中國AI市場生態的深度學習框架,才是適合中國智能時代的“操作系統”。
寫在最后
在貿易沖突愈演愈烈的大背景下,全球商業環境已經存在很大的不確定性,尤其是走在世界前沿的中國科技產業,“拿來主義”的做法早已不再適用。
PC系統,我們已經有了同方科技與清華大學共同研發的開源桌面操作系統OPENTHOS;移動系統,華為傳說中的“鴻蒙”歷經十年打磨,即將顯出鋒芒;而AI系統,也就是深度學習框架,也需要獨立自主,百度飛槳可能就是這道難題目前的最優解。
欣慰的是,華為和百度企業走到了一起,飛槳和麒麟芯片,兩個“國貨之光“正在進行強強聯合。
或許在芯片和底層技術上,中國還有很長一段路要走,但在人工智能、5G、IoT等未來場景的爭奪上,中國企業還需要在基礎和關鍵技術上下苦工,避免在沙灘上起高樓,被別人牽著鼻子走。
我們需要的是屬于自己的“國貨之光”。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)