昇騰原生創新,擁抱數智化時代的“確定性”
作者 | 曾響鈴
文 | 響鈴說
熱潮涌動了一年多,大模型賽道發展走深向實。
現在,越來越多的業界人士,開始回過頭來審視大模型快速發展的過程,思考在已有產業進展的基礎上,中國大模型發展的未來究竟要如何才能進一步突破。
一方面,AIGC帶動算力需求總量不斷增長,要有效應對資源支撐的不確定性,在算力供給的穩定性上進一步提升;
另一方面,在算力外,大模型創新也面臨從“量的擴張”轉向“質的提高”的關鍵轉變,正如業內存在的一種觀點所說,要把更多資源放在去探索大模型與各行各業的結合上,而如何結合、實現“質的提高”,目前也需要進一步探索出一套體系化的實踐方法論,降低實際落地中的各種不確定性。
不確定性疊加不確定性,是當前本土大模型創新所面臨的現實,亟待破局。
大模型創新“靠天吃飯”,如何在充滿不確定性的時代穩定持續發展
不確定性本質是什么?答案是,失去對“資源”與“能力”的主動性,無法掌控自己的命運。
“資源”上,只有強大的算力,才能滿足更大參數量模型的訓練需求,不斷提升模型的自主學習和泛化能力。但正如前文所言,目前我們的算力有較為廣泛的來源,但供給仍然不算穩定,需要在已有產業鏈生態建設的成績上,進一步提升穩定性、確定性。
而這只是業界普遍看到的層面,實際上,“能力”方面喪失主動性隱藏得更深。
在靜態視角下,當AI創新技術體系從硬件到軟件都由他人設計,作為單純的“使用者”而非“體系建造者”,就很難再在體系的理解與運用等方面趕超別人。別人設計的規則、體系,是否能夠滿足開發者、企業特定的開發需要,也存在極大的疑問。
在動態視角下,大模型發展日新月異,各技術環節都需要進行適配,但別人設計的規則體系何時進化、按什么方式去進化都沒有可控的持續性。
最終,大模型創新“靠天吃飯”,充滿不確定性。
其最終后果,要回到產業競爭的視角來看。
國外AI計算的優勢不僅僅在于底層硬件,按其業界領軍人士的最新說法,更在于其十年間構建的軟硬件一體化生態系統,該系統的顯著特點,是能夠快速構建起機器學習的“飛輪效應”,即在數據、硬件、算法、訓練、推理全過程不斷精進,快速從最終應用中反饋結果,持續反哺、強化數據和模型參數,從而形成閉環,不斷自我強化。
最近,馬斯克團隊在短短19天內建成的十萬個GPU的孟菲斯超級集群,就是為了快速提升AI推理與訓練的能力,實際上也是在加速這個“飛輪效應”。
原本,本土大模型創新,在龐大的市場和數據支撐方面已經有獨特的優勢,但從機器學習的“飛輪效應”看,只有被動、零散、不成體系的“借用”,我們還缺乏的,就是這樣一套加速“飛輪效應”的軟硬件生態系統,因此難以取得競爭話語權。
另外,香港中文大學教授、前海國際事務研究院院長鄭永年曾表示,中國大模型創新與OpenAI的發展方向不同,不應該是差距,而是差異化。這個差異化,就是指我們要建設好自己的體系、路徑,快速做好大模型應用落地,而不是糾結于PK算法能力。
由此,做好自己的軟硬件生態體系,堅持和壯大原生創新,變得尤為重要。
積極的消息是,國內一些計算產業生態的發展,正在朝這方面努力——不只是對標,在生態開放上還要更進一步,例如2018年面世的昇騰在一開始就致力于AI算力底座建設,今年3月份以來,圍繞算子、模型和應用的開發,昇騰AI基礎軟硬件得到了全面升級,昇騰原生創新開始新一輪加速。
在華為全聯接大會期間,昇騰產業峰會成功舉行,除了發布眾多與行業領軍企業共同推出的行業解決方案,來自伙伴的原生證言、演講嘉賓的昇騰原生開發實踐分享,都向業界展示了過去一段時間昇騰AI原生創新的技術與產業成果。
這套原生開發體系,以更加開放的姿態,正在全方位解決本土大模型創新面臨的“不確定性”難題,而其過程,從技術角度看可能十分復雜,有很多邏輯與體系需要拆解、展現,但從開發者、伙伴如何一步步解決痛點問題、做好大模型創新的角度看,卻十分清晰明了。
昇騰原生,技術+商業雙生態擁抱大模型時代確定性
大模型創新是十分艱深、高門檻的領域,其過程會經歷無數的難題。對一個開發者或者創新企業來說,做大模型創新,就如同一個打怪升級的故事,要“關關難過關關過”,任何一個環節出了問題,都到不了目的地。
而當下本土大模型創新在每一關都面臨各自的痛點與挑戰,原生創新是出現了,但是行不行,是不是能夠建設獲取產業競爭話語權的軟硬件生態,要看是否切實解決了開發者的問題——這些關卡,實際就是對昇騰原生各個維度的考驗。
第一關,技術資源準備
開發者面臨的問題,不僅僅是在開發環節。找算力,找各種OS、固件、整機、硬件平臺……大模型創新的第一步,是準備各種技術資源。
如果說算力資源供給的不穩定性(尤其是高性能算力資源受限)是產業環境的“先天不足”,那么目前軟硬件體系存在的兼容性問題則是“后天畸形”,共同讓開發者在一開始的資源準階段就遭遇了一個“下馬威”。
具體來看,目前多元異構算力發展,不同OS、固件、整機、硬件平臺兼容性問題突出,其中一些算力服務商資源采購受各廠商硬件生態影響,存在應用與硬件緊耦合、難遷移問題,比如一些硬件廠商為了維護自身利益,會構建相對封閉的生態系統,限制其他廠商或第三方開發者的接入。
這種封閉性導致應用開發者只能針對特定廠商的硬件進行優化和定制,加劇了應用與硬件之間的“緊耦合關系”,ISV只能按照制定好的規則進行游戲,這不僅限制了開發靈活性和高效性,也限制了AI應用最終的場景落地效果。
于是,檢驗我們的原生創新的第一個標準也來了,它是否能解決這個痛點?
異構計算架構CANN、全場景AI框架昇思MindSpore、分布式加速套件MindSpeed、推理引擎MindIE、全流程開發工具鏈MindStudio、CCAE集群自智引擎……昇騰AI不斷推進分層開放、生態兼容,在工具層面進行兼容性開發支撐,真正打破游戲規則,讓高效靈活開發成為可能。
“原生創新”是站在開發者視角,解決開發者的關切。昇騰首先讓開發者規避了采購過程存在各種不確定因素(買不到、買不足、不匹配等),還以算力供應鏈完備的特殊優勢,以開放的生態實現了軟硬件協同的解耦,從而保證了應用開發過程的靈活性與高效性。
這份答卷,昇騰應該說做到了達標。
第二關,技術深度獲取
即便是,企業已經做好了技術資源的準備,但對于大模型創新還是不夠的。
有業內人士曾經把國內一款知名大模型產品與GPT-4做過對比,發現在技術層面存在大量相似之處,例如都使用了多階段訓練策略——大模型“沒有純粹的技術壁壘”已獲得更多共識,尤其是MoE模型出現后,競爭的重心轉移到了工程實現上,比如,大規模分布式訓練。對開發者而言,這也意味著,獲取足夠深度的“算子、訓練、推理”等一系列技術資源,才是決定最終商業競爭成敗的關鍵。
由此,考驗原生創新的第二個標準也就出來了,是否能夠“降低技術資源的獲取壁壘”?
可以看得見的是,最近一段時間,昇騰在對各層級能力進行高速迭代、深化。
例如,CANN今年5月進一步開放,HC 2024期間還新增NB 2.0等十幾類通算融合算子,基本完成了開發者需求的覆蓋;MindSpore2.4已進化為原生親和超節點架構,能進一步提升模型訓練效率。
在訓練環節方面,今年昇騰推出MindSpeed分布式加速套件,面向大模型訓練加速業務流,提供100+預置模型、60+加速算法及算子、10余種微調算法,降低從預訓練到增量訓練的分布式開發成本,訓練性能提升30%以上。
此外,在越來越重要的推理環節,今年3月發布的昇騰推理引擎MindIE支持自適應PD分離部署,大幅提升了推理效率和體驗,按照規劃,其未來還將面向萬億MoE推理、百萬超長序列等場景演進。
原生創新,不僅僅要走出“跟隨者”身份,還在主動突破各種技術難關,打開產業發展天花板。
在這份答卷上,昇騰可以說過關了,但未來要獲得更高的分數,還要持續深入。
第三關,企業成長、商業成功
搞定技術從來不意味著成功,從現實看,無數的企業還在為生存發展、市場落地奔波,能不能有持續的資金支撐,能力能不能跟上,應用成果能不能轉化……這是開發者面臨的最后一道關卡,大模型創新不是純技術理想,有無數的經營發展難題在等待。
對原生創新而言,第三個檢驗標準也十分清晰——能不能在技術支撐之外,建設一套廣泛而立體的商業生態體系,幫助開發者、伙伴成功?
在這方面,昇騰多年來通過一系列動作不斷幫助產業伙伴成長。
要人才發展?與高校、科研機構展開合作,產教融合、產研融合培養大量卓越原生人才。
要技能提升?不斷豐富社區生態,建設技術布道師輔導、輻射更廣泛人群,還提供多層次培訓,從普適培養到定向賦能,讓開發者更全面地掌握原生技能。而華為方面還要每年投入10億元培育生態支持鯤鵬和昇騰原生開發,覆蓋80%以上算力場景。
要商業成功?一方面商業模式不斷創新,積極引入產業生態資源對接,一方面提供算力、NRE、MDF及社區貢獻等權益激勵,促進商業共贏。
人才有保障,業務技能不再是障礙,產業轉化全程有支撐,開發者邁過最后一道關卡不再困難,而昇騰也交出自己一份優秀的答卷,而顯然,商業生態的復雜性意味著這份考驗將一直持續下去。
原生創新,走入千行百業
計算生態存在著典型的“閾值”現象,只有度過產業應用的參與度閾值,進入不需要巨額投入就能夠自我強化的階段,才能最終走向成功。
對受益于昇騰原生創新的開發者而言,顯然也必須期待其邁過這樣的“閾值”。
好消息是,越來越多的實踐與數據表明,原生創新這條路子,正在跑通。
目前為止,昇騰AI已累計培養3萬多名原生開發貢獻者,有50多家生態伙伴發布了基于昇騰的原生開發成果。
而且,實踐案例還分布在廣泛的賽道中。
在基礎大模型創新這里,科大訊飛基于昇騰AI平臺構建的飛星一號平臺,高效支撐訊飛星火大模型訓練,訓練推理性能已超越了市場上大多數競爭對手。
在企業數智化整合服務商這里,釘釘與昇騰合作推出的AI一體機,幫助研發生產、產品銷售等業務場景實現智能化,目前已孵化智能問答、智能差旅等多種AI應用。
在一線生產操作場景,精英數智基于昇騰原生打造礦山大模型應用——“煤礦大腦”安全管控平臺方案,正在全國2000多個煤礦守護30余萬礦工安全。
層層遞進,層層強化,在爬坡的過程中,原生創新的產業落地也變得色彩豐富,可行性正在一步步坐實,走入千行百業的征程,已經開了一個好頭。
*本文圖片均來源于網絡
*此內容為【響鈴說】原創,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
#響鈴說 Focusing on企業數字化與產業智能化升級,這是關注一切與創業、產業和商業相關的降本增效新技術、新模式、新生態 NO.426深度解讀
【完】
曾響鈴
1鈦媒體、人人都是產品經理等多家創投、科技網站年度十大作者;
2 虎嘯獎評委;長沙市委統戰部旗下網絡名人聯盟成員;
3 作家:【移動互聯網+ 新常態下的商業機會】等暢銷書作者;
4 《中國經營報》《商界》《商界評論》《銷售與市場》等近十家報刊、雜志特約評論員;
5 鈦媒體、36kr、虎嗅、界面、澎湃新聞等近80家專欄作者;
6 “腦藝人”(腦力手藝人)概念提出者,現演變為“自媒體”,成為一個行業;
7 騰訊全媒派榮譽導師、功夫財經學者矩陣成員、多家科技智能公司傳播顧問。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)