AI視頻從0到1,我們也是用上新生產工具了
“我們會認為每一次的探索都是有意義的,即使團隊對于產出結果沒有十分滿意,但是大部分人都還沒有開始。這是我們從0到1的嘗試。”
作為新一代文生視頻人工智能產品,快手可靈帶著“用AI講好一段故事”的初衷在奧運之前出現在我們面前。盡管AI技術在內容創作上展現出了巨大的潛力,但我們也意識到,由于AI的種種弊端,尤其在內容生成上具有隨機性,我們對AI可能產出的內容并不能有十足的把控。在這樣的挑戰下,我們接手項目后一直在思考,如何在AI的不確定性中找到確定性,講好一個故事?到底該講誰的故事?怎么講這個故事?在奧運這個節點上有什么故事是值得打動人心的?AI的介入,讓許多原本難以具象化的想象變得觸手可及,但在這一過程中,我們不禁要問:在AI的幫助下,誰的想法能夠被有效傳達,而誰的想法又可能在這一過程中被邊緣化?
邊緣化,這個詞讓我們聯想到了一群特殊的人。
“我多希望,全世界看到我的足球世界有多絢爛”
盡管數量龐大,在大眾的印象中,盲人往往被刻畫成一個個行動受限,需要大量幫助的弱勢群體。但奧運會場上,有這樣一群人,他們在黑暗中,在寂靜的注視以及一聲聲“叮叮叮……喂喂喂……”中馳騁賽場,他們是盲人足球運動員。中國盲人足球隊屢創佳績,曾在2008年北京、2012年倫敦和2016年里約的殘奧會上分別奪得銀牌、第五名和第四名,并七度榮獲亞運會冠軍。但在快手和可靈AI將其帶入大眾視野之前,這支隊伍在網上鮮為人知,盲人足球也未受到廣泛關注。他們腦海中的球場是什么樣的?我們不想居高臨下的重復所謂“弱者”的文本,我們希望通過可靈AI的技術,向社會傳達出我們認為,不僅盲足精神值得傳播,也讓受眾明白:不被大眾“看見”的盲人群體,也值得被更多人看見。
不確定與隨機性,AI視頻原來是這樣出生的
故事向的運動類AI短片,需要的是豐富的AI視頻以及實拍電影創作經驗。在這個時候,視頻導演呂迪、美術指導陳哲和YETI走進了我們的視野。簡單明快的溝通過后,三個主力,六臺電腦,項目就這樣展開了。
在腳本溝通確定之后,呂導迅速動手,剪輯出了一個示意性的demo來展示視頻的初步風格。demo風格得到客戶肯定后,導演左右開弓,埋頭刻畫分鏡的同時,立即開始對可靈進行圖片的投喂訓練,以準備后續的視頻內容生成。在分鏡定稿的過程中,呂導已經利用可靈建立了一套完整的人物和場景模型庫,為視頻的最終制作打下了堅實的基礎。
接下來就我們進入了最繁瑣的視頻素材生成階段。
首先是場景靜幀制作。與傳統實拍不同的,想要AI工具產出一段既定內容的動態視頻,需要先搭建片段首位靜幀,再通過圖片投喂及指令動作訓練ai產出設想好的內容。這一步是整個AI視頻制作中最為繁瑣的一環。從大體到場景構建,到人物面孔,再到細節處理——比如想在某處加一個球框,或者想要路面減去一個垃圾桶,都要幾十次指令下達后生成的幾百張圖片庫中才能千挑萬選出來的一張靜幀圖片。
問題接二連三,該怎么解決?
圖片產出后,新的問題一個接一個來了:如何保證首位幀中間的畫面穩定?到底該怎么連貫的完成前后鏡頭的動作銜接?以及最重要的:視頻主角的面孔如何保持最大可能的一致?而凌駕在這三個問題之上,有一個幾乎沒有可能解決的問題:時間不夠。
第一個問題是最好解決的,主要靠重復。通過不斷的下達指令、回收素材、修改指令、明確細節,在“只要場景及運動視角比較固定”的情況下都能達到理想效果。
但剩下兩個問題怎么解決呢?
技術上的具體操作我們無法透露太多,但在和導演的交流中我們接受到了這樣的信息:
按照傳統實拍的思路,要捕捉一場緊張刺激的足球比賽,創造出極具沖擊力的視覺效果,通常需要運用大膽的鏡頭運動和無縫的鏡頭切換,這樣才能將情緒和節奏推向高潮。然而,當我們嘗試用AI技術來復現這一過程時,面臨的挑戰在于保持鏡頭之間的流暢銜接,由于時間的緊迫性和現有AI技術的局限性,在這次視頻制作上我們并沒有死摳動作細節,短時間無法做到的改動,我們就簡化動作路徑或使用后期剪輯手法(升格、碎片化剪輯等),由繁化簡交代故事情節,呈現好整體故事內容。
幸好,前期搭建的人物形象足夠立體,這讓人臉對齊的工作相對輕松一些。當然,人物庫的復用完成度,比如人物復刻到某一場景里,可能識別了60%、80%,整體有波動,但經過指令調整后多次輸出,基本能達到人臉95%的統一。
實拍也能轉AI?
在這部影片的制作過程中,我們廣泛采用了多種技術手段,其中轉繪技術的應用也是AI視頻制作中不可或缺的一環。我們的目標是通過實拍的鏡頭來展示AI技術的多樣性、豐富性和穩定性。為此,我們專門設計了一些實拍畫面,這些畫面在前期拍攝時就已精心策劃,以便在后期通過AI進行風格化的轉繪處理。
在實拍過程中,我們主要關注兩個核心元素:鏡頭的運動和人物的動作捕捉。這些元素是AI轉繪能夠準確理解和再現的關鍵,它們對于保持畫面的連貫性和動態效果至關重要。盡管如此,轉繪過程中仍可能丟失一些細節,例如電線桿或籃球框等較小的物體可能無法被AI系統完全捕捉。但即便如此,AI轉繪技術在捕捉和再現主要視覺元素方面仍然表現出色。
實拍轉繪的環節相對輕松,它允許我們以一種創新的方式展現AI技術的能力。通過這種方式,呈現了AI技術在視覺藝術中的豐富性和穩定性,也能夠向觀眾展示AI如何與人類的創意和實拍技術無縫結合。
會想的人先享受世界
隨著最后一幀畫面的轉繪完成,我們也終于將這些導演和美術指導緊盯著電腦屏幕經過無數個日夜的努力精選的素材編織成了一個連貫的盲人足球故事。雖然在這個過程中,我們對最終交付的內容仍有些許遺憾,有些細節可能未能達到我們最初的預期。但正是這些不完美,成為了我們成長和進步的寶貴財富。我們堅信,每一次的探索和嘗試都是通往成功的必經之路。即使成果并不總是如我們所愿,但重要的是,我們勇敢地邁出了第一步。
“我們會認為每一次的探索都是有意義的,即使團隊對于產出結果沒有十分滿意,但是大部分人都還沒有開始。這是我們從0到1的嘗試。”這句話不僅是對我們項目的真實寫照,也是對我們團隊精神的最好詮釋。我們從無到有,從概念到現實,一步一個腳印地將夢想變為可能。這個項目對我們來說,不僅僅是一個作品的完成,更是一次團隊協作和技術探索的勝利。
我們的故事,是關于盲人足球運動員的故事,是關于那些在黑暗中依然勇敢追逐光明的故事。他們的精神,他們的堅持,他們的激情,通過我們的鏡頭,通過快手可靈的技術,被賦予了新的生命。我們不僅僅是在講述一個故事,我們是在傳遞一種力量,一種讓世界變得更加包容、更加多元的力量。
我們的探索,也不僅是技術的探索,更是人文的探索。我們希望通過這個項目,能夠激發更多人對于AI技術潛力的認識,同時也能夠鼓勵更多人去關注和理解那些在日常生活中可能被忽視的群體。我們的項目,不僅是技術的展示,更是人文關懷的體現。
我們相信,會想的人先享受世界。我們的項目,不僅是對AI技術的一次探索,更是對人類精神的一次致敬。我們期待在未來,能夠繼續這樣的探索,讓科技的光芒照亮每一個角落,讓每一個故事都有機會被看見。
創作企業名單
全案代理:HOK
制作公司:基本操作
——
創作人員名單
業務合伙人:王郁竹
資深客戶經理:王壯,劉威威
資深美指:段恒愷
文案:苑蓉
——
視頻制作人員名單
監制:大鵬Jonny、大壯
導演:呂迪
美術指導:陳哲 (ZZAi.)
——
編輯人員名單
撰文:Uni
主編:王壯壯
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)