實話講,AI繪畫的新功能讓我有點焦慮
(本文圖片大多由stable-diffusion生成)
去年10月,我寫了一篇《AI繪畫真的在影響內容創意行業|十一漫談》。當時,AI繪畫雖然驚艷,但是在實用時仍面臨問題,比如畫手非常奇怪、缺乏真實性、可控性不足、上手門檻高。
然而在最近幾個月,AI繪畫進步實在太快了。秒出線稿、上色補完、風格學習、手部骨骼、真人換裝......真不知道幾個月后能走到哪一步。雖然感覺離失業不遠了,但這就像是一個新玩具,玩起來樂此不疲,在這里想分享一些我認為有前景的AI繪畫功能和實用方向。如果有興趣,歡迎后臺私信交流。
Part1「算力有盡,模型無窮」
自從stable-diffusion算法開源之后,浩浩蕩蕩的群眾就加入了“煉丹”大軍,想要的模型還沒有,就自己造。一時間云端算力漲價了,不少學生黨表示想哭。
只能說氪金就是猛,隨著大量網友參與“煉丹”,基礎大模型展開了不少分支,基于亞洲人臉為代表的大模型Chilloutmix更是引發了關于真實人物繪圖道德倫理的熱議。
網友們做的多種模型封面我也嘗試了多各種模型,以網友@xiaolxl 在civitai上分享的國風3模型為例,通過這一模型,可以繪制出更有中國華麗古風風格的圖片、古風游戲角色,并具有2.5D的質感。
模型參考圖跑了一堆之后精挑細選一張放過來。
相較于我在上一期產出的圖片,可以明顯看出質量的上升,甚至說在畫質修復提升后,商用都不夸張。當然除了我熟練度的微小提升之外,主要是大模型打的底非常好。而很多模型的塑造,在目前看只是時間和素材量的問題。聽說不少游戲公司已經開始試用這個方法出圖了,省下很多成本。
如果說大模型是創作的基礎,定義了產出圖片范圍以及風格,那lora則是在大模型下的濾鏡。相較動輒10個G的大模型,幾百M的LORA則更為靈巧。
LORA,即Low-Rank Adaptation of Large Language Models,直譯為大語言模型的低階適應。重點是對大模型,進行一些微調,更側重生成更具有專屬風格、細節的圖片。其依托大模型存在,訓練所需的圖片/算力量均相對較小。今年2月,一組來自@勘云工造的照片,在網上掀起了不少波瀾,作者更是得到了各路頂級畫師、模型師、制作人、coser的關注,無他,太真實了。肉眼難以辨識的相似,甚至被某些網站直接拿去做了廣告圖片。
隨之而來的是賽博coser正式走上舞臺,在小紅書等社交平臺上,以ai圖為賣點的自媒體賬號也肆意生長,成為了一個新的內容方向。其實我也考慮過要不要做一個,但是想到變現比較困難就暫時放棄了。此外,通過定制化的小模型或者補丁,生成特定風格的圖片,則更加實用。
比如下方例圖,是用CharTurnerBeta - Lora ,來生成的三視圖。
以及AI模特換裝,甚至有的只用給人偶拍照,就能替換生成,相信電商平臺提供類似服務也是遲早的,淘寶模特的需求,危啊。
(B站上的一個教程,方法還有很多)
Part2「創造新方式,和AI交流」
人與機器的溝通,一定要通過文字嗎?是否可以有一種其他語言?
在目前的習慣中,我們通常通過輸入文本prompt來控制AI的輸出,然而這一行為并不完美。雖然文本符合人類交流習慣,但是同一文本在不同語境有多種應對,也因此衍生出了更廣闊的釋義空間,比如魚香肉絲到底對應一道菜,還是有絲狀鱗片的魚。(這不是玩笑,而是溝通方式導致的現狀,文生圖背后需要大量的標注先行,耗時耗力。當然,這只是個時間問題)一位網友在和我閑聊時,提出了一個說法,畫圖時要有“窮舉”的精神,然而這可太不智能了。
因此,研究人員也試圖找到一些其他方式,來與AI溝通。2月初,斯坦福大學Lvmin Zhang and Maneesh 的論文《Adding Conditional Control to Text-to-ImageDiffusion Models》提出了一些方法和可能性。并且已經得到了開源和實際應用。
方式一:openpose 動作姿態定制
首先可以選擇一張圖片,提取人物的關鍵肢體形態。
在這一步驟中,我們可以調整它的關聯骨架形態。隨后,添加關鍵詞,生成了一張新圖片。從面部朝向,腿部肢體動作上看,可控性非常強。
方式二:canny 邊緣檢測提取輪廓
通過邊緣檢測,根據已有圖片提取線稿,如有需要還可配合AI繪圖功能重新上色生成圖片。這在游戲原畫、室內裝潢設計等等各個領域都將大放異彩。
除此之外,還有segmentation、deph等方式,可以提取材質、距離景深等要素,以便于生成新的圖片,在這里就不一一列舉了。
總的來說,ai繪畫有太多可能性了。每天都有新變化,新應用,這篇文章可能發布沒多久就會過時。但可以預見的是,在幾年內,大量的辦公室輕工作將被替代,生活將被重構,所有人都在浪潮之中。這場人文社科領域的工業革命,還遠未來到高潮。
以上,是本期的主要內容,后續還會不定期更新行業進展,以及一期AI繪畫在廣告行業的實用指南,敬請期待。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
全部評論(1條)