首屆昇騰AI創(chuàng)新大賽,“照見”好學不倦的“后浪”
經過半年多的激烈角逐后,首屆昇騰AI創(chuàng)新大賽正式收官。
作為面向AI開發(fā)者打造的頂級賽事,昇騰AI創(chuàng)新大賽分為兩個賽道:一個是面向行業(yè)場景進行應用創(chuàng)新的應用賽道,意在推動人工智能的產業(yè)落地;另一個是基于昇思進行算法、前沿任務創(chuàng)新的昇思賽道,瞄準了人工智能的前沿課題。
在產業(yè)智能化的浪潮下,和AI相關的賽事早已不勝枚舉,最大的意義莫過于吸引各行各業(yè)的開發(fā)者,并借助比賽來放大品牌影響力。1560個隊伍參與的首屆昇騰AI創(chuàng)新大賽,卻讓外界看到了另一種可能:AI創(chuàng)新大賽既是對前沿技術的創(chuàng)新、探索與實踐,也是一個不斷“掘金”的過程。
比如應用賽道涌現(xiàn)出了不少優(yōu)秀的創(chuàng)業(yè)團隊,在區(qū)域市場被驗證的解決方案,有望在全國范圍內推廣復制。昇思賽道則印證了另一種可能:沖在AI最前沿的不只有著作等身的學術大牛,還有很多好學不倦的“后浪”。
01 “浙大學霸”與社區(qū)資深布道師
昇騰AI創(chuàng)新大賽昇思賽道最終評選出的金獎選手中,有一個年輕的新面孔——正在浙江大學控制科學與工程學院讀研究生的項靖陽。
在許多人的認知里,“研一”階段屬于人生的“迷茫期”,白天按部就班地學習專業(yè)課程,然后在業(yè)余時間讀幾篇專業(yè)文獻,目的是熟悉自己的課題方向。至于論文、比賽什么的,還不在當前計劃的范圍內。
項靖陽可以說是妥妥的“少數(shù)派”。
早在大二的時候,項靖陽就在學院老師的指導下進了實驗室,跟著研究生師兄師姐做一些科研課題、參加一些開發(fā)者賽事。那時候“人工智能”的概念如火如荼,項靖陽和很多年輕人一樣,對新事物有著無限興趣,并在實驗室?guī)熜值膸ьI下接觸到了剛剛宣布開源的昇思MindSpore,做了自己的第一個算法模型。
大二以后的日子里,項靖陽把大部分業(yè)余時間花在了科研上。其他同學忙于人際交往、娛樂消遣、實習工作時,項靖陽的生活卻是實驗室、宿舍與食堂間的“三點一線”。按照他的話說:“科研更像是表面枯燥乏味,但內里的樂趣是無窮的。”其中的樂趣,似乎來自于項靖陽的自學能力,平時上課中有不理解的知識點,他會主動到B站和MOOC看學習視頻,比如專業(yè)課中考試難度很大的《自動控制原理》。
這種源自內心深處的探索欲,讓項靖陽有了一個新身份——昇思MindSpore社區(qū)里的資深布道師。
按照昇思MindSpore社區(qū)的官方介紹,“資深布道師”的門檻相當嚴格,至少發(fā)布過5篇昇思MindSpore相關原創(chuàng)優(yōu)質技術文章,且平均閱讀量不低于5000;至少在昇思MindSpore開源社區(qū)主導過1個特性級開發(fā);至少舉辦過1場或參加過3場線上/線下昇思MindSpore技術分享;同時需要是社區(qū)特邀的行業(yè)資深人士。
據(jù)項靖陽同學回憶:“剛接觸昇思MindSpore時還是一個AI新手,但在社區(qū)里遇到了很多師兄師姐,在他們的幫助下慢慢了解了AI框架。然后自己開始做模型和算子,在社區(qū)里回答別人的問題,有空的時候在知乎、CSDN等平臺上寫一些技術博客,一步一步成為了社區(qū)里的資深布道師?!?/p>
昇騰AI創(chuàng)新大賽的消息在昇思MindSpore社區(qū)公布后,項靖陽第一時間選擇報名參賽,讓他沒想到的是:報名的時候還是一位忙畢設的大四學生,利用暑假的空隙做了自己感興趣的三道賽題,等到昇騰AI創(chuàng)新大賽收官時,項靖陽已經是浙江大學控制科學與工程學院的研一學生,找到了“深度學習模型壓縮”的研究方向。
02 超越論文精度,靠“硬實力”出圈
別人眼中的項靖陽,或許只是個“初出茅廬”的研一學生??稍跁N思MindSpore社區(qū)里,項靖陽已然是一位精通深度學習模型“老鳥”。
似乎有必要重溫下昇思賽道的賽制:主辦方通過篩選熱門論文、前沿創(chuàng)新任務設置了30道賽題,主要來自CVPR、ICCV、ACL、ICML、NIPS等AI頂會過去幾年里的熱門模型,參數(shù)選手可以選擇一個或多個任務,基于鵬城“云腦2”環(huán)境進行挑戰(zhàn),提交算法達到指定精度或要求即可視為完成。
“藝高人膽大”的項靖陽挑戰(zhàn)了三個任務。
第一個任務是“利用昇思MindSpore實現(xiàn)Swin Transformer V2圖像分類網絡”,來自于微軟亞洲研究院在CVPR發(fā)表的論文《Scaling Up Capacity and Resolution》。原作者將Swin Transformer縮放到30億個參數(shù),使其能夠使用高達1536×1536分辨率的圖像進行訓練,提高了大視覺模型的穩(wěn)定性,降低了預訓練和微調之間的分辨率差距,并讓常規(guī)GPU訓練大型視覺模型成為可能。
第二個任務是“利用昇思MindSpore實現(xiàn)conformer圖像分類網絡”,源于國科大在ICCV上發(fā)表的優(yōu)秀論文,將Transformer和CNN進行融合并提出了全新的Conformer模型,可以在不顯著增加計算量的前提下顯著提升基網表征能力。
第三個任務是“利用昇思MindSpore實現(xiàn)Big Transfer圖像分類網絡”,Google于2020年在ECCV上發(fā)表的論文,作者重新審視了預訓練+微調的范式,先在一個大規(guī)模標記數(shù)據(jù)集上進行預訓練,然后對目標任務上的每個訓練權重進行精調任務,最終減少了目標任務所需的數(shù)據(jù)量和優(yōu)化時間。
項靖陽花了近一個月的時間對原論文進行學習,理解原作者的提出的方法,對三道賽題間的共性進行分析,總結出了一套利用昇思MindSpore進行模型遷移、論文復現(xiàn)、精度與性能調優(yōu)的工作流程。
特別是在論文復現(xiàn)的過程中,項靖陽針對Ascend 910進行了混合精度配置、算子層面的模型性能調優(yōu)等工作,針對昇思MindSpore整圖設計的理念,花了很長時間對訓練、推理的整體模板進行適配;遇到一些精度模型無法達標的情況,就參考其他論文和方法,并利用數(shù)據(jù)增強、正則化等方式進一步促進模型的訓練和收斂流程。
最終Swin Transformer V2、Conformer和Big Transfer均入圍前三名,達到了超越原論文精度的效果。
正是對科研的激情和熱愛,項靖陽同學在內的年輕人徹底 “征服”了現(xiàn)場的評委們。鵬城實驗室開源主管鄧清毫不吝嗇的評價道:“在昇思賽道與各個高校的同學的日常對接中,能感覺到這些選手是真正的熱衷于人工智能科研的莘莘學子,深切地感受到了他們的能力,也很欣慰有這么多優(yōu)秀的年輕學者開源開放的生態(tài)里努力、進步和學習?!?/p>
03 “學練訓賽”的人才培養(yǎng)新路徑
像項靖陽這樣優(yōu)秀的年輕人,在昇思MindSpore社區(qū)中還有很多,他們從“小白”到“高手”的成長曲線,無疑比賽事本身更值得探討。
正如高盛在《全球人工智能產業(yè)布局》中的預測,2030年時中國的人工智能人才缺口將超過500萬人。想要在不到10年時間里填補500萬的人才缺口,強化本科教育和產學研聯(lián)合人才培養(yǎng),業(yè)已成為社會上下的共識。
昇騰AI創(chuàng)新大賽的另一初衷恰在于此。
簡單回顧項靖陽同學的成長經歷,可以清晰地劃分為四個階段:第一個階段是學,在學校學習編程及AI相關的基礎知識;第二個階段是練,不管是跟著師兄做科研,還是在昇思MindSpore社區(qū)中做模型,都是練的過程;第三個階段是訓,譬如在昇思MindSpore社區(qū)中主導的特性級開發(fā);第四個階段是賽,典型的案例就是昇騰AI創(chuàng)新大賽,為項靖陽在內的同學提供了學為所用的舞臺。
傳統(tǒng)的產學研培養(yǎng)方案,往往集中在學和練兩個環(huán)節(jié),昇思MindSpore社區(qū)和昇騰參與的一系列賽事,打通了學、練、訓、賽四個環(huán)節(jié),跑出了AI人才培養(yǎng)新路徑。尤為值得一提的是,昇騰AI創(chuàng)新大賽昇思賽道將近幾年的優(yōu)秀論文和前沿課題作為賽題,其實隱藏著“以賽促研”的初衷。
想要“復現(xiàn)論文”,首先要做的就是對論文的“精讀”,理解原作者提出的方法,可能涉及數(shù)據(jù)預處理技術、神經網絡架構、訓練技巧和處理等內容;在實驗的過程中,通常包含有關數(shù)據(jù)集、訓練和評估的詳細信息、模型在各種參數(shù)下的表現(xiàn),甚至需要與其他論文中的最新方法進行比較,將論文中的參考文獻通讀一遍……
如果是時間比較久遠的“經典論文”,或許可以找到不少教程,復制粘貼過來就可能跑通。近幾年的新論文,意味著可以找到的參考資料并不多,想要將論文復現(xiàn),既要讀懂、吃透論文中的精髓,還要有強大的學習能力、自驅力和工程能力,這也是想要自己發(fā)表論文時的必備技能。
就像項靖陽同學的例子,參賽時選擇的三個賽題都和圖像分類相關,和他選擇的研究方向有很大關系。目前項靖陽正在準備自己的論文,昇騰AI創(chuàng)新大賽的參賽經歷,雖然只花了一個半月的時間,但與計算機視覺領域的前沿研究進行了一場“深度溝通”,進一步夯實了他的科研之路。
再來思考昇騰AI創(chuàng)新大賽的價值,所籌謀的遠不止打造一場頂級賽事,還在幫助開發(fā)者推開一扇新的大門:通過學、練、訓、賽一體化的賽制,吸引越來越多像靖陽這樣的“后浪”接觸AI、認識AI、擁抱AI,不斷為中國的AI人才培養(yǎng)孕育“火種”。
04 寫在最后
產業(yè)智能化浪潮的演進,需要源源不斷的人才輸入。
在這樣的共識下,正有越來越的科技企業(yè)參與到AI人才培養(yǎng)中,產學研的人才機制越發(fā)完善與成熟。同時需要思考的是,人才的能力和視野,直接決定著智能化轉型的深度和高度,左右著中國在全球智能化競賽中的競爭力,為莘莘學子們提供一條走在最前沿的成長路徑,不可謂不重要。
昇騰AI創(chuàng)新大賽獨立設置昇思賽道,儼然洞察到了時代的新趨勢,而“后浪”們的崛起已然印證了昇騰的前瞻性。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規(guī)范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯(lián)系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)