AIGC狂飆|文生文、文生圖之后,下一個內(nèi)容革命是什么?
“AIGC賦予了我們一次想象力躍升的機會,人類需要對現(xiàn)在世界的一次離經(jīng)叛道,正如如果當初為數(shù)不多的那幾個人沒有聽從內(nèi)心的反叛直覺,美國或許根本不存在,個人電腦可能還未普及,我們大概還堅信太陽是繞著地球轉(zhuǎn)的。”
—— 亞當·格蘭特 沃頓商學院最年輕的終身教授
一直以來,在內(nèi)容創(chuàng)作的世界里,都存在著大量的重復動作,它們繁冗、耗時,卻在本質(zhì)上與創(chuàng)作無關(guān)。
比如文稿校對,內(nèi)容編輯需要一遍遍地查看是否有語病、錯別字,再通過一級審稿、二級審稿、終極審稿,盡管這樣,依然很難避免出錯。
比如撰寫文章,內(nèi)容框架沒有思路,下筆如有神,有的只能是六神無主。
再比如圖片設(shè)計,不同平臺、不同位置有不同的尺寸,但是需要設(shè)計師重新排版、設(shè)計,花上十倍的時間對整幅畫面的每一個元素調(diào)整大小。
AI的出現(xiàn),一定程度上解救了人類。
歷史上每一次科技的發(fā)展,都必然給人的工作帶來改變。
我們看到,僅僅在幾年之前,人工智能還是被戲稱為“人工智障”的存在。但是人們還是忽略了這項技術(shù)突飛猛進的進化能力。
進入2023年,推陳出新的AI校對工具、ChatGPT、以及諸如愛設(shè)計的智能文案、智能延展等工具的出現(xiàn),有效解放了文案創(chuàng)作者和設(shè)計師的雙手。
AIGC的下一個挑戰(zhàn)是什么?
目前來看,因為文字與圖片都是高度結(jié)構(gòu)化的信息,能夠被AI輕易替代,但是,有一個領(lǐng)域成為AI難以攻克的“拆遷釘子戶”——視頻制作。
視頻拍攝的原始素材動輒長達幾十、甚至幾百小時,后期剪輯師不僅要用肉眼逐一觀看,還要一而再再而三地對其進行重復識別、篩選、剪輯切割,剪輯師要用耳朵一遍遍聽原片內(nèi)容,手動添加字幕。
還有,大量的視頻被拍攝之后,往往成為“一次性用品”被刪除浪費掉,前期投入的拍攝剪輯成本成為企業(yè)的“資金重擔”,視頻AI二創(chuàng)成為剛需。
AIGC,解放“被壓迫”的視頻創(chuàng)作者
什么時候才能,AI輔助剪輯師生成視頻創(chuàng)意?什么時候才能, AI自動剪輯,生產(chǎn)可直接發(fā)布的高品質(zhì)內(nèi)容?
相信長期浸淫在抖音、快手上的用戶,對于四郎、熊二、猴哥等AI配音的聲音不會陌生。AI生成配音可以說是當下各種短視頻內(nèi)容最依賴的工具,但隨著AIGC工具的不斷發(fā)展,顯然AI能夠為短視頻帶來的不僅僅、也不應(yīng)該只有配音一項。
從利用ChatGPT的能力寫腳本到使用AI視頻工具一鍵生成,市場早就有了大探索。
2019年,DeepMind提出了DVD-GAN模型(Dual Video DiscriminatorGAN),加入了空間判別器D-S和時間判別器D-T。GAN在視頻生成中的重大突破是一組由50萬段10秒高分辨率YouTube視頻剪輯匯編成的數(shù)據(jù)集訓練,能夠生成具備時間一致性的分辨率(256 x 256像素)視頻。
2022年,META曾公布過旗下一款視頻AI工具“Make-A-Video”。可以從給定的文字提示生成短視頻,還可以從給定的視頻或圖像制作視頻,該工具是通過AI生成連續(xù)的圖片,系統(tǒng)會生成16張在時間上有連續(xù)性的64X64像素的RGB圖片,然后這些圖片將會通過插值模型增加視頻的幀數(shù),讓前后幀之間的動作更加平滑,之后通過兩個超分辨率模型,將圖像的像素提升到256×256像素后,再提升到768×768像素,生成高分辨率和幀率的視頻。
2023年1月,Netflix宣布,其與小冰公司日本分部(rinna)、WIT STUDIO共同創(chuàng)作的首支AIGC動畫短片《犬與少年》已于當日正式公開,這是Netflix動畫創(chuàng)作者計劃的第一支作品,采用rinna制作的AI輔助背景,由牧原亮太郎負責導演,用手繪Layout上色稿,并將其提交至AI,生成細節(jié)并優(yōu)化背景,再對AI生成的背景圖進行人力修正,通過人工智能技術(shù)繪制完整動畫場景。
從劇情上這部作品并無太多創(chuàng)新,整部作品的實驗性其實在于最后的演職人員表,從中才能發(fā)現(xiàn),這部動畫原來有不少部分并非真人創(chuàng)作,而是由AIGC代勞,AIGC,為動畫制作揭開新的未來。
我們觀察到:視頻生成應(yīng)用場景主要集中在視頻屬性編輯、視頻自動剪輯、視頻部分編輯,前者已有大量應(yīng)用落地,后兩者還處于技術(shù)嘗試階段。視頻編輯比圖像更具挑戰(zhàn)性,需要合成新動作,不僅是修改外觀,還要保持時間一致性。
愛設(shè)計AI團隊認為,視頻全智能生產(chǎn)將會經(jīng)歷四個階段:
第一階段:面向特定的場景,限定素材集的范圍,套用成熟的編排模式,AI可以負責素材的初步處理,按照預設(shè)模版進行編排。
第二階段:AI除了負責素材的預處理,還能完成本視頻創(chuàng)意環(huán)節(jié)的編排工作,從而實現(xiàn)智能批量混剪。
第三階段:面向特定場景和特定要求的成品,由AI根據(jù)已有成片反向解構(gòu)分鏡頭,負責素材的搜索、篩選、處理、編排,并最終制作合成。
第四階段:面向特定場景,AI負責理解場景的要求,包括素材的搜索、篩選(以及部分素材生成)、處理、編排,并最終制作合成。
視頻生產(chǎn)的三大應(yīng)用場景
目前來看,視頻生成的應(yīng)用場景有三大場景:
1、視頻屬性編輯,視頻畫質(zhì)修復、刪除畫面中特定主體、自動跟蹤主題剪輯、生成視頻特效、自動添加特定內(nèi)容、視頻自動美顏等。
2、視頻自動剪輯,基于視頻中的畫面、聲音等多模態(tài)信息的特征融合進行學習,按照氛圍、情緒等高級語義限定,對滿足條件的片段進行檢測并合成。
3、視頻部分生成,基于目標圖像或視頻對源視頻進行編輯及調(diào)試,強調(diào)將視頻切割成幀,再對每一幀的圖像進行處理,通常包含數(shù)據(jù)提取、數(shù)據(jù)訓練及轉(zhuǎn)換三個步驟。
對于內(nèi)容創(chuàng)作者而言,AIGC能夠?qū)⑺麄兘夥懦鰜恚?strong>讓創(chuàng)作者的精力更好地用于探索創(chuàng)意極限,而重復、冗雜的工作交給AIGC;對于企業(yè)來說,內(nèi)容創(chuàng)作者的產(chǎn)能將不再受到制約,優(yōu)質(zhì)內(nèi)容能夠爆炸式產(chǎn)出,能夠迅速彌補企業(yè)高漲的營銷物料需求。
AIGC+視頻,商業(yè)化之路布滿荊棘還是順風順水?
關(guān)于AIGC的市場空間,尤其是商業(yè)化市場空間,愛設(shè)計判斷:AIGC+視頻的需求除了降本增效,更重要的是個性化內(nèi)容的生成。
品牌客戶對AI的要求,市場對AI生產(chǎn)視頻的要求,絕不僅僅是能夠以優(yōu)于人類的制造能力和知識水平承擔信息挖掘、素材調(diào)用、復刻編輯等基礎(chǔ)性機械勞動,更高階的訴求是希望能從技術(shù)層面實現(xiàn)以低邊際成本、高效率的方式滿足海量個性化需求。
愛設(shè)計一直在探索如何通過AI生成式內(nèi)容與營銷產(chǎn)業(yè)互動、融合,為品牌伙伴在內(nèi)容創(chuàng)造的領(lǐng)域提供價值增長新動能。
經(jīng)過長期對接探索,我們發(fā)現(xiàn),從具體需求來看,汽車、飲料、家電等客戶規(guī)模大,擁有多門店/經(jīng)銷商的大型零售企業(yè),痛點集中在:自媒體賬號矩陣多,對短視頻制作需求量大,期望通過工具降本增效,同時希望可以借助AI力量在視頻營銷素材方面有大的提升,借此打通全員營銷。
作為品牌方,在日常運營中,賬號需要每天發(fā)布大量內(nèi)容,但賬號大部分為運營維護,非專業(yè)視頻制作人員,視頻內(nèi)容相似性也高,重復式機械剪輯效率慢,同時每次創(chuàng)作的腳本利用率極低。
對于經(jīng)銷商銷售,一條短視頻需要展示產(chǎn)品、音樂、營銷、聯(lián)系信息等內(nèi)容,對很多員工來講,面臨剪輯時間少,剪輯技能短缺的大難題,經(jīng)銷商發(fā)視頻多為兼顧的工作,根本不會剪輯。
比如某汽車客戶,因內(nèi)容分發(fā)量大,且抖音等自媒體平臺的審核機制限制,需要制作出不同的大量內(nèi)容,首先解決快速制作的問題。其次建立良性的分發(fā)及營銷機制,推動全員營銷。最后通過數(shù)據(jù)分析提升營銷效果,總部希望在制作完短視頻內(nèi)容后,各門店全員分發(fā)短視頻平臺,以此獲得更多品牌曝光。
AI不會取代任何東西,AI只會讓我們變得更有機會去創(chuàng)造。
愛設(shè)計短視頻智能批量生產(chǎn)工具,將作為輔助視頻軟件的提效產(chǎn)品,賦能內(nèi)容創(chuàng)意,貼合客戶從制作場景到分發(fā)業(yè)務(wù),以此打通客戶制作短視頻的路徑閉環(huán),賦能創(chuàng)意,效果數(shù)據(jù)展示。
從蒸汽機到人工智能,一切生產(chǎn)力工具都是為了將人類從繁冗的勞動中解放出來,以前是解放人類的雙手,未來是解放人類的大腦。
愛設(shè)計短視頻智能批量生產(chǎn)工具的優(yōu)勢在于:
1、 創(chuàng)意賦能:未來各門店的所有視頻腳本都可以共享在一個地方,企業(yè)全員可以看到、使用、查看數(shù)據(jù)等。
2、制作能力:短視頻智能批量生產(chǎn)工具作為輔助視頻軟件的提效工具,可以有效貼合用戶業(yè)務(wù),垂直某一功能場景,提升批量制作能力。
技術(shù)最終的價值其實并不是取代人,而是真的去幫助人更好創(chuàng)造價值。在未來12個月內(nèi),我們相信視頻生成領(lǐng)域或許在全球各地還會掀起一次浪潮,就如Midjourney創(chuàng)始人David Holz所說:圖片只是第一步,AI將徹底改變學習、創(chuàng)意和組織。
愛設(shè)計將保持一顆創(chuàng)造和探索之心,在短視頻智能批量生產(chǎn)工具、在 AIGC+營銷領(lǐng)域持續(xù)探索!
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)