文心大模型揚起新“帆”,產業應用大潮已至
剛剛結束的2022百度世界大會上,百度CTO王海峰在演講中展示了這樣一個場景:隨著畫卷的緩緩展開,一幅“補全”后的《富春山居圖》出現在身后的屏幕上,并借鑒古人喜歡題字的“傳統”,在畫卷上題了一首小詩。
正如很多人所熟知的,因為歷史上的種種原因,元代名家黃公望的《富春山居圖》被一分為二,“前段”被后人命名為《剩山圖》,“后段”被稱為《無用師卷》。前后兩段畫卷曾在臺北故宮合璧展出,可缺失的部分成了近四百年的遺憾。
許多人不知道的是,“補全”黃公望傳世名作的,不是鉆研古畫幾十年的匠人,而是有中國傳統文人風骨的文心大模型。
01 近四百年遺憾,一秒鐘被滿足
2022百度世界大會期間,百度推出的H5《AI畫筆連接愛》在不少人的朋友圈里刷了屏,只需要在中間空白處簡單勾勒幾筆,AI就能自動“補全”《富春山居圖》殘缺部分的內容,前后用時不到一秒鐘。
對于這樣的玩法,一些人可能并不陌生:諸如AI復原老照片、讓古畫中的人物“活”起來、AI化身“繪畫大師”等等,過去幾年中已經屢見不鮮,甚至在有些情況下已經難以分辨一幅作品到底是人類所作還是AI生成。
但文心大模型“補全”的《富春山居圖》和以往有很大的不同,確切地說存在三個方面的嚴格挑戰:
一是高清晰度。很多AI修復的畫作往往清晰度不高,雖然可以模仿出原作的風格,細節上卻經不起推敲。文心大模型則是對《富春山居圖》進行了高清尺寸的補全,勾勒的每一筆線條,每一棵樹木都清晰可見。
二是高還原度。名列“元四家”之首的黃公望,開創了“淺絳山水”的畫法,但傳世的作品并不太多。在只有一幅《富春山居圖》殘卷的條件下,仍要高度還原一代書畫大師的作品,對模型的遷移學習能力要求極高。
三是全民參與。不同用戶勾勒的線條各不相同,有些可能就是在屏幕上隨意畫了個不規則的圓圈,文心大模型照舊可以實時生成畫作并高度還原,同時滿足無數用戶多樣化的創作期望和天馬行空的創意想法。
就最終的結果來看,文心大模型的創作得到了黃公望紀念館負責人毛傳鑌的高度評價:“與現存真跡風格一致,使兩岸畫卷走出博物館實現了合璧,光線風格統一,山水脈絡和諧,不僅符合原畫審美特點,視覺上還同樣具有觀賞價值”。
需要思考的是,百度CTO王海峰為何要在一年一度的百度世界大會上展示“補全”后的《富春山居圖》?答案絕不是純粹為了“秀技”,即便文心大模型具備這樣的技術實力。
早在2019年的網絡春晚上,百度AI就展示過“看臉”對春聯的絕活兒,用戶可以通過填字乃至刷臉的方式,自動生成專屬的春聯;到了2020年初,百度研究院上線了智能視頻合成平臺VidPress,一鍵輸入圖文內容即可智能生成短視頻;2022年5月文心·旸谷社區正式上線,官方定位是文心大模型創意社區……
把這些線索稍作串聯的話,文心大模型瞄準的可能是AIGC,即運用人工智能技術自主生產內容。百度創始人、董事長兼首席執行官李彥宏也在百度世界的演講中提到,AIGC是繼UGC、PGC之后一種新的內容生產方式,它不僅能提升內容生產的效率,也會創造出有獨特價值和獨立視角的創意內容。
02 既能補全名畫,也能探測深空
在2022百度世界大會的直播中,不少網友紛紛以彈幕的方式留言,直呼寫詩作畫的文心大模型“太凡爾賽了”。然而文心大模型不只有文藝范兒的基因,同時也是一位有鉆研精神的“理工男”。
時間回到2021年12月,百度正式成為“中國探月航天工程人工智能全球戰略合作伙伴”。根據當時公開的信息,雙方將在包括月球探測、行星探測等在內的深空探測領域,開展航天技術與人工智能技術的相關合作。外界的好奇心也由此萌生:人工智能和深空探測到底有哪些合作的空間?
2022百度世界大會上,答案被正式揭曉:百度與航天合作研發了世界上第一個航天領域的大模型——航天-百度·文心大模型,航天-百度·文心大模型可以將航天領域的數據和知識融合學習,對航天數據進行智能的采集、分析和理解,助力深空智能感知、規劃和控制等技術突破。
想要理解文心大模型在航天領域的應用潛力,似乎有必要梳理下人工智能在航天探索過程中的重要性:
首先是數據層面。對尺度比地球大無數倍的廣闊空間中進行探索,不但擁有一般大數據的數據量大、類型多、要求高的特點,還需要對數據進行實時處理。如果沒有及時而精確的數據分析,哪怕是一個小數點的錯誤,都可能影響全局的成敗。
其次是應用層面。以往航天數據的處理主要是人工分析,由于航天器數據下傳的周期和距離成正比,依靠地面進行數據判斷的方式,已經無法滿足航天器在軌快速狀態監測和故障診斷的需要,必須要提高航天器在軌自監測、自診斷等能力。
再次是價值層面。航天大數據的應用不應止于數據分析,對歷次飛行數據進行記錄、存儲和學習,可以深度模擬航天器的運行狀態,對修正控制、改進設計等提供依據,持續反哺航天器的設計、制造、保障等服務,提升航天工程的整體效率。
而文心大模型的切入邏輯在于,航天飛行任務規劃是一個典型的知識處理過程,千億級參數的大模型不僅可以即時優化飛行軌道與姿態控制,最大限度規避飛行中的風險,還可以幫助飛行器自主規劃探測路線、自主選擇探測目標。抑或是整合現有的海量資料及資源,加速太空智能感知、太空智能規劃、太空智能交互等工作的進程。
按照中國探月工程副總指揮、國家航天局探月與航天工程中心主任劉繼忠的介紹,國家已經制定出了深空探測未來十年的規劃,涉及到探月工程和行星探測工程,將在十年內實現火星采樣、小行星采樣、木星系的環繞探測等重要任務。深入航天行業核心環節的文心大模型,也將沿著國家深空探測的步伐走向星辰大海。
03 深耕產業剛需,釋放技術紅利
無論是內容創作上的獨樹一幟,還是在航天領域的另開生面,文心大模型都表現出了產業落地的雄心。在一些大模型還在盲目追逐模型參數、篤信“大力出奇跡”的環境下,走出了產業化的新路徑。
其中的底層邏輯離不開“大模型”本身的特質。傳統的模型訓練需要大量的數據標注才能訓練出足夠精確的模型,但預訓練大模型采用的是自監督學習的方式,可以對海量無標注數據中的規律和知識進行提煉、學習。當面向任務和場景應用時,只需少量的任務標注數據,通過微調就可以得到在應用場景中非常好用的模型。
同時也離不開百度AI的獨立思考。預訓練大模型打破了數據標注的瓶頸,對產業落地越來越友好,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜據此做出了一個不同于行業內其他廠商的判斷:“今年是大模型的落地關鍵年。大模型歷經了前幾年的探索期、突破期,已經在一定程度上到達推廣期”。
折射到具體的落地環節,文心大模型瞄準了產業剛需。
比如《富春山居圖》殘卷的補全,對應的是內容生產的缺口,文心大模型的跨模態綜合技術能力,為降低內容制作成本、提升內容多樣性打通了新的途徑;再比如WAVE SUMMIT 2022上首發的行業大模型,在通用大模型的基礎上挖掘行業數據,通過“行業知識增強”進一步提升大模型對行業應用的適配性。
厘清了大模型落地的思路,還需要解決另一個問題,即配套的工具和平臺,繼而全方位降低大模型的應用門檻。對應的有文心大模型開發套件、API,以及內置了文心大模型能力的EasyDL和BML開發平臺。
可以找到的落地案例有很多。
2022年高考期間,文心大模型加持的AI數字人度曉曉挑戰高考作文,圍繞“本手、妙手、俗手”寫出了題為《苦練本手,方能妙手隨成》的作文。根據歷年情況,度曉曉的作文得分超過75%的高考考生。
國家電網和百度聯合研發的國網-百度·文心大模型,在海量數據中挖掘電力行業數據,引入電力業務積累的樣本數據和特有知識,并且在訓練中結合雙方在預訓練算法和電力領域業務與算法的經驗,在國網場景的應用效果顯著提升。
按照相似的思路,百度與浦發銀行也聯合研制了金融行業大模型。浦發·百度-文心大模型結合浦發場景積累的行業數據與知識,雙方技術和業務專家一起設計了針對性的財報領域判別、金融客服問答匹配等預訓練任務,讓文心大模型學習到金融行業的知識,并在浦發典型任務應用上提升效能。
正是一個接一個的產業應用案例,讓外界對大模型的認知正在重構:不再是高不可攀的殿堂級技術,而是普羅大眾隨手可用的創作工具;大模型正在走進產業深處,解決行業的核心問題;大模型的使命是降低技術門檻,讓AI走向通用型技術……
文心大模型的產業應用圖景也越來越清晰,正邁過前沿技術與應用場景間的鴻溝,讓技術在落地應用中產生真實價值,向千行百業釋放技術紅利。
04 寫在最后
可以看到,百度對于文心大模型的建設思路和飛槳一樣,都是為了加速人工智能的落地,踐行產業智能化的使命。
截至目前,文心大模型已經發布了20多個大模型,涵蓋基礎大模型、任務大模型和行業大模型,構建了一套完整的大模型生態體系,并通過飛槳、百度智能云等逐步走進工業、能源、金融、通信、媒體、教育等場景。
補全名畫、探測深空等新技能,既是百度AI產業智能化進程的里程碑,也進一步詮釋了產業化破局的初心和恒心。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)