带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度

Sora元年,我們更該關(guān)注視頻行業(yè)什么不會變

原創(chuàng) 收藏 評論
舉報 2024-03-20

原載《市界》

作者|董溫淑

編輯|董雨晴


3月14日,OpenAI首席技術(shù)官米拉·穆拉蒂對外公開表示,公司旗下的文生視頻模型Sora計劃在“今年晚些時候”正式面向公眾發(fā)布。

就在短短一個月前,這款文生視頻工具初次亮相,憑借拔群的效果引發(fā)了市場的大面積驚嘆。有關(guān)“視頻行業(yè)要被顛覆了”的積極或消極預(yù)判,在互聯(lián)網(wǎng)上喧囂一時,相關(guān)市場賽道也擁抱了新的資本熱點。

舊的話題還未有定論,日歷上就已設(shè)下了新的倒計時。

身處“大模型紀(jì)元”,某種程度上,我們已經(jīng)習(xí)慣于陷入一輪輪的技術(shù)“狂歡”。

然而,即便贏得了普遍的關(guān)注,技術(shù)將為市場帶來什么樣的改變?這仍是個模糊不清的問題。

為了看清潛藏于水面下的市場脈絡(luò),我們與音視頻生產(chǎn)協(xié)作平臺“分秒幀”的創(chuàng)始人兼CEO、前資深媒體人程剛進(jìn)行了獨家對談。

從2000年開始,程剛本人曾先后供職于中國青年報、騰訊、搜狐、WiFi萬能鑰匙等媒體、社交媒體和移動新媒體平臺。

2019年,看準(zhǔn)音視頻云端生產(chǎn)協(xié)作的藍(lán)海市場,程剛與合伙人一起創(chuàng)辦了分秒幀,至今已深耕音視頻行業(yè)5年時間。


01.“Sora的發(fā)布,讓很多舊工具失去了價值”


市界:據(jù)說你很關(guān)注Sora,春節(jié)后不斷在參與討論。為什么是在這個時間點?為什么是Sora?

程剛:是的,Sora發(fā)布時(2月16日,大年初七)春節(jié)假期還沒過完,我們馬上在公司內(nèi)部開會討論,同事也和業(yè)界很多創(chuàng)業(yè)者朋友、做算法的朋友、做AIGC的朋友密集討論了一圈。

在過去的一年多時間里,無論是ChatGPT的發(fā)布和迭代,還是Runway、Pika等文生視頻工具的出現(xiàn),我們的態(tài)度一直都停留在“關(guān)注、觀望、研究”的層面。對于在產(chǎn)品中引入AI的能力,我們還是比較克制的,沒有馬上做動作。

但Sora的發(fā)布帶給我們的震動還是比較大的。技術(shù)的超越已經(jīng)有很多分析,我們看的更多的是行業(yè)應(yīng)用層面,相比Runway Gen-2、Pika、Stable Video duffion,Sora明顯可用性更強。

之前的Runway Gen-2、Pika、Stable Video duffion等工具生成的素材,后續(xù)還需要花大量的時間加工才能成片,生成的視頻時長也很短。我們認(rèn)為,這些工具更多提供的是錦上添花的價值,而不是雪中送炭的價值。

很多人是抱著嘗鮮的態(tài)度去試用這些工具,所以你就會發(fā)現(xiàn)Pika這些工具的留存率比較差。這反映出它們創(chuàng)造的價值不夠。其實GPT本身也面臨月活走低的問題。

市界:除了剛剛提到的時長問題,你指出Pika、Runway這類工具的可用性較差,“可用性”究竟指的是什么?

程剛:最近有很多Sora與其他工具生成的視頻對比。從最終的效果來看,你會發(fā)現(xiàn)Runway、Pika等工具生成的部分所謂視頻,其實更像GIF圖。
比如生成的視頻里有的人物不動背景動,有的是背景不動人物動。這顯然不是對真實物理世界的模擬。

從這些角度來看,可以說Sora相對Runway Gen-2、Pika這些工具,是有代差優(yōu)勢的。

在過去的一年時間里,有些AIGC公司還屬于眾所關(guān)注的“明星公司”,但當(dāng)Sora出現(xiàn)之后,某種意義上是直接把這些工具cover掉了。

市界:所以說在AIGC賽道內(nèi)創(chuàng)業(yè)是一場十分殘酷的游戲,你認(rèn)可這個觀點嗎?

程剛:舉個例子,硅谷的一家叫做Jasper AI的公司,很早就接入了ChatGPT的一些能力,能幫助用戶來生成營銷文案。它一度也受到市場的強烈追捧,2022年上半年就已經(jīng)有4000萬美元的營收,2022年10月獲得由Insight Partners領(lǐng)投的1.25億美元A輪融資、估值也漲到15億美元等等。

但是等到GPT-4正式發(fā)布,Jasper AI的價值就大打折扣,開始裁員、下調(diào)營收預(yù)期。

市界:所以這幾天一直有人說Sora發(fā)布,突然就懂抖音的張楠為什么要聚焦剪映了。

程剛:對,剪映如果在AIGC方面,不能推出自己的大模型并且建立起相應(yīng)的能力,未來某天它可能就會被Sora給干掉了。

剪映面對Sora帶來的威脅,和Sora發(fā)布當(dāng)天Adobe的股價下跌百分之七點多,其實是同一個邏輯。

所謂顛覆,往往不是擁有類似解決方案的競爭對手帶來的,而是一個新物種以高維打低維帶來的。也就是通常我們所說的,干掉相機的不是相機,而是手機。


02.“估計開放使用半年,Sora的一些技術(shù)問題就能得到改進(jìn)”

市界:回到Sora,如果說Sora把Runway等工具遠(yuǎn)遠(yuǎn)甩在了后頭,那么Sora現(xiàn)在又處在一個什么樣的位置?它距離所謂的“顛覆行業(yè)”或者真正商用,還有多遠(yuǎn)距離?

程剛:我覺得分幾個層面來說。

具體場景下,從放出的 Demo來看,相對于Runway Gen-2、Pika這些過往的工具,Sora生成的視頻已經(jīng)大幅提高了可用性。但你是用Sora來生成可修改可使用的成片,還是生成可修改可使用的素材呢?這兩種場景是不一樣的。

基于目前大家的討論和預(yù)判,Sora至少在生成素材方面能夠提供非常大的幫助。從這些demo來看,有些視效用傳統(tǒng)的計算機來建模、貼圖、渲染,工作量會非常大,實現(xiàn)的成本會非常高。但是對Sora來講,就變成了輸入一串prompt的問題。

當(dāng)然,要具體看它能夠解決什么問題、提高了多少效率、節(jié)省了多少成本。尤其重要的是,它的使用成本怎么樣。這要等它真正開放后,再具體分析和做進(jìn)一步判斷。

總體而言,我比較傾向于認(rèn)為Sora在視頻生成方面的突破,堪比工業(yè)革命和信息革命的這樣的革命性的變化:第一是新的生產(chǎn)工具,第二是新的生產(chǎn)方式,第三是帶來的生產(chǎn)關(guān)系的變革。

市界:你怎么評價AI工具發(fā)展的速度? 2023年下半年,有人還預(yù)計文生視頻要能確保對象的一致性、連續(xù)性,可能需要一兩年的時間。但是Sora的出現(xiàn),顯然打破了這個預(yù)期。

程剛:Sora的突破速度這么快,出乎了我和身邊絕大多數(shù)朋友的預(yù)料。我也很關(guān)心Sora接下來優(yōu)化迭代的速度會有多快。

我們目前看到的它存在幻覺問題、精準(zhǔn)度問題、對物理世界的理解和模擬不準(zhǔn)確所帶來的邏輯問題、版權(quán)溯源和版權(quán)保護(hù)問題,以及有人濫用工具去生成虛假內(nèi)容的問題等等。這些問題當(dāng)然會影響Sora在商業(yè)場景中的使用。

但我們分開來看,對于技術(shù)層面的幻覺問題、精準(zhǔn)度問題、對物理世界的理解和模擬不準(zhǔn)確所帶來的邏輯問題,我相信OpenAI會持續(xù)地投入,去優(yōu)化,我們也相信Sora會保持比較快的優(yōu)化迭代速度。

解決這類問題的迭代速度也和Sora什么時候能放出來供用戶使用有關(guān)。因為用戶使用的過程中會給OpenAI大量的反饋,OpenAI可以基于這些反饋不斷優(yōu)化和迭代。

Sora迭代的速度,基本可以參照ChatGPT的迭代速度。Sora對現(xiàn)實模擬不準(zhǔn)確的問題,比如手有六指,應(yīng)該半年左右就能得到比較大的優(yōu)化。

至于說版權(quán)溯源和版權(quán)保護(hù)問題,包括濫用Sora去生成虛假內(nèi)容等等,因為這些是人類在AI技術(shù)沖擊下面臨的治理和監(jiān)管問題,更多需要在法律和道德自律的層面去討論和解決。

它不會像技術(shù)問題那么容易解決,當(dāng)然它也不會妨礙AI技術(shù)的發(fā)展和Sora等等工具的快速應(yīng)用。這是我們的研判。

市界:感覺你個人對于Sora和它所代表的AIGC浪潮的態(tài)度是很積極的。在你和行業(yè)的溝通中,大家的態(tài)度都是這么積極嗎?有沒有人會有焦慮?

程剛:積極和焦慮本身不矛盾,我身邊的多數(shù)朋友,都看好Sora的革命性突破和將帶來的巨大價值,普遍感到很興奮,但是不妨礙他們焦慮。面對Sora和ChatGPT的沖擊,很多人和組織都是人心惶惶的一個狀態(tài),擔(dān)心會被AIGC替代,擔(dān)心會在競爭中處于不利地位。但更重要的是,當(dāng)一個大的革命性時代到來,我們怎么去抓住已經(jīng)成為共識的趨勢性的機會?

這個時候反而各位需要冷靜下來,回到一些底層的問題上去做深度的思考和討論。

從ChatGPT發(fā)布一年多以來,我們認(rèn)為,最重要的是一定要去把握住在沖擊和變革下,什么會發(fā)生變化,什么不會發(fā)生變化。

我發(fā)現(xiàn)市面上絕大多數(shù)的討論,都都圍繞著ChatGPT、Sora會改變什么?只有極少的人在思考在這種沖擊下什么不會發(fā)生變化。


03.“小分工會被AI壓縮替代,但行業(yè)的大分工不會變”

市界:在音視頻行業(yè),變和不變是什么?

程剛:音視頻創(chuàng)作的過程,最初是頭腦中的一個創(chuàng)意和靈感,通過多人協(xié)作生成音視頻內(nèi)容的過程,本質(zhì)上是創(chuàng)作者的創(chuàng)意和審美的一種呈現(xiàn)。從經(jīng)濟(jì)學(xué)的角度講,存有專業(yè)分工,在效率上一定是大大優(yōu)于個人一條龍創(chuàng)意、策劃和制作實現(xiàn)的。

從分工的維度來看,一些小的分工會被大幅壓縮或替代。比如說拍攝、剪輯、特效、調(diào)色,像這類更細(xì)分的工作,有可能會大范圍、大規(guī)模地被AIGC工具替代或者壓縮掉。因為基于prompt生成文案、圖片、素材或者視頻成片的新機制,在相當(dāng)程度上抹平了一些傳統(tǒng)角色分工在專業(yè)能力上的差距。

但是行業(yè)的大分工不會變,也就是需求方和需求實現(xiàn)方,或者叫甲乙雙方的大分工不會變。需求方懂產(chǎn)品懂用戶,也可以去學(xué)習(xí)如何使用Sora這樣的工具,但是創(chuàng)意和審美能力不是一天兩天能夠?qū)W會的,有些需要依賴天賦。Sora雖然可以降低視頻制作的門檻,簡化創(chuàng)意落地過程,卻無法抹平人們在創(chuàng)意和審美能力上的差距。

另外,我們還需要回到具體的工作流(workflow)去觀察。前兩天Sora的開發(fā)團(tuán)隊在接受媒體采訪中也表示,他們正在聽取藝術(shù)家的意見,看Sora怎么在工作流發(fā)光發(fā)熱,從而指引研究路線。

而從工作流的角度判斷,小的流程會被大幅壓縮,但是大流程不會變。大流程是什么?第一,需求方要提出需求;第二,需求方提出需求后,跟實踐方溝通需求;第三,需求實現(xiàn);第四是審看、溝通、修改;第五,需求方確認(rèn)。

不論AI技術(shù)如何發(fā)展,技術(shù)怎么演進(jìn),只要甲乙兩方存在,在這兩端之間就會有反復(fù)溝通的需求。甚至而言,溝通需求還會成千上萬地增加。

舉個例子,比如說國內(nèi)2023年生產(chǎn)的視頻數(shù)量可能是500億條。但在創(chuàng)作者熟練使用各類AI工具之后,可能市場中的視頻數(shù)量會達(dá)到5000億條、1萬億。相應(yīng)地,需要去審看、修改、確認(rèn)的工作量也會增加。

所以說類似分秒幀、飛書、Figma(海外設(shè)計工具,強調(diào)即時協(xié)作)這樣的協(xié)作工具,始終都會有生存的空間。

按照這個邏輯,分秒幀是要去解決AI和人之間的交叉口的問題。

市界:你剛剛提到視頻量會越來越大,審看需求相應(yīng)會變多。如果這個市場是一個藍(lán)海市場,會不會有越來越多的競爭者,包括抖音剪映這樣的大廠加入進(jìn)來?怎么面對競爭?

程剛:我們總體來講并不是很擔(dān)心,把自己的事情做好就ok了。

以剪映為例,它的緣起和發(fā)展中相當(dāng)長的時間,主要是ToC的。但近一年多,我們的確觀察到越來越多B端的企業(yè)客戶開始使用剪映專業(yè)版。這些B端客戶有經(jīng)營抖音賬號矩陣的需求,做短視頻用剪映的確比較方便。

分秒幀目前服務(wù)的客戶4000家左右,以B端客戶為主。在過去一年,有不少客戶提出來說,希望分秒幀能夠跟剪映打通,形成從剪輯制作到審看修改的閉環(huán)工作流程。這樣他們能夠在剪映上把片子做完后,用分秒幀來快速共享預(yù)覽、提出修改意見、完成確認(rèn)交付。

雖然剪映現(xiàn)在也提供協(xié)同協(xié)作的能力,但試用一下就知道,他們在這方面的投入還是遠(yuǎn)遠(yuǎn)不夠的。據(jù)我所知,眼下和未來一段時間,剪映的重心會在AIGC和出海上。

總之,我不是很擔(dān)心大廠的競爭,而且相反說不定將來我們跟剪映還有一些合作的機會。

市界:一個比較務(wù)虛的問題,如果你當(dāng)初沒有創(chuàng)業(yè),但在2024年的當(dāng)下,你會愿意做一家分秒幀這樣的公司嗎?

程剛:當(dāng)然愿意。原因正如我剛才說的,做分秒幀的大邏輯仍然存在。

不管是2019年的時間節(jié)點看,還是此時此刻看,我認(rèn)為行業(yè)有幾點沒有發(fā)生變化:需求場景沒有變、用戶的最大痛點沒有變。所以,即便已經(jīng)有了AIGC、有了Sora,我仍然看好云端音視頻生產(chǎn)協(xié)同的市場機會。



關(guān)于分秒幀


分秒幀——云時代音視頻生產(chǎn)協(xié)作平臺。

可幫助音視頻創(chuàng)作者在云端構(gòu)建工作流,從意見收集到成片交付,以及素材和版本管理、項目流程管控,分秒幀都可一站式搞定。無論身在何處,分秒幀都能讓整個團(tuán)隊無縫協(xié)作,擁有更短的審改周期,更高的出片效率,更簡單的交付方式,指數(shù)級提高內(nèi)容生產(chǎn)效率,實現(xiàn)視頻創(chuàng)作“多快好省”。

創(chuàng)立于2019年,目前已經(jīng)為來自廣告?zhèn)髅健CN&自媒體、游戲動畫、教育培訓(xùn)、電商等不同行業(yè)的百萬音視頻從業(yè)者及專業(yè)機構(gòu)提供生產(chǎn)協(xié)作服務(wù)。




本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨立觀點,不代表數(shù)英立場。
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨立觀點,不代表數(shù)英立場。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本內(nèi)容為作者獨立觀點,不代表數(shù)英立場。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
本文系數(shù)英原創(chuàng),未經(jīng)允許不得轉(zhuǎn)載。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。

    評論

    文明發(fā)言,無意義評論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評論

    評論

    文明發(fā)言,無意義評論將很快被刪除,異常行為可能被禁言
    800

    推薦評論

    暫無評論哦,快來評論一下吧!

    全部評論(0條)

    主站蜘蛛池模板: 广水市| 本溪| 张掖市| 张北县| 江永县| 建昌县| 化德县| 阿图什市| 庆城县| 安丘市| 井冈山市| 灵璧县| 兴宁市| 泰和县| 刚察县| 寿阳县| 新田县| 石台县| 眉山市| 庐江县| 临漳县| 灵丘县| 清丰县| 石台县| 嵊泗县| 呼和浩特市| 克拉玛依市| 厦门市| 息烽县| 丹阳市| 临澧县| 黑水县| 溧阳市| 金平| 马山县| 镇坪县| 顺义区| 云梦县| 横峰县| 定远县| 长海县|