带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度

Sora元年,我們更該關注視頻行業什么不會變

原創 收藏 評論
舉報 2024-03-20

原載《市界》

作者|董溫淑

編輯|董雨晴


3月14日,OpenAI首席技術官米拉·穆拉蒂對外公開表示,公司旗下的文生視頻模型Sora計劃在“今年晚些時候”正式面向公眾發布。

就在短短一個月前,這款文生視頻工具初次亮相,憑借拔群的效果引發了市場的大面積驚嘆。有關“視頻行業要被顛覆了”的積極或消極預判,在互聯網上喧囂一時,相關市場賽道也擁抱了新的資本熱點。

舊的話題還未有定論,日歷上就已設下了新的倒計時。

身處“大模型紀元”,某種程度上,我們已經習慣于陷入一輪輪的技術“狂歡”。

然而,即便贏得了普遍的關注,技術將為市場帶來什么樣的改變?這仍是個模糊不清的問題。

為了看清潛藏于水面下的市場脈絡,我們與音視頻生產協作平臺“分秒幀”的創始人兼CEO、前資深媒體人程剛進行了獨家對談。

從2000年開始,程剛本人曾先后供職于中國青年報、騰訊、搜狐、WiFi萬能鑰匙等媒體、社交媒體和移動新媒體平臺。

2019年,看準音視頻云端生產協作的藍海市場,程剛與合伙人一起創辦了分秒幀,至今已深耕音視頻行業5年時間。


01.“Sora的發布,讓很多舊工具失去了價值”


市界:據說你很關注Sora,春節后不斷在參與討論。為什么是在這個時間點?為什么是Sora?

程剛:是的,Sora發布時(2月16日,大年初七)春節假期還沒過完,我們馬上在公司內部開會討論,同事也和業界很多創業者朋友、做算法的朋友、做AIGC的朋友密集討論了一圈。

在過去的一年多時間里,無論是ChatGPT的發布和迭代,還是Runway、Pika等文生視頻工具的出現,我們的態度一直都停留在“關注、觀望、研究”的層面。對于在產品中引入AI的能力,我們還是比較克制的,沒有馬上做動作。

但Sora的發布帶給我們的震動還是比較大的。技術的超越已經有很多分析,我們看的更多的是行業應用層面,相比Runway Gen-2、Pika、Stable Video duffion,Sora明顯可用性更強。

之前的Runway Gen-2、Pika、Stable Video duffion等工具生成的素材,后續還需要花大量的時間加工才能成片,生成的視頻時長也很短。我們認為,這些工具更多提供的是錦上添花的價值,而不是雪中送炭的價值。

很多人是抱著嘗鮮的態度去試用這些工具,所以你就會發現Pika這些工具的留存率比較差。這反映出它們創造的價值不夠。其實GPT本身也面臨月活走低的問題。

市界:除了剛剛提到的時長問題,你指出Pika、Runway這類工具的可用性較差,“可用性”究竟指的是什么?

程剛:最近有很多Sora與其他工具生成的視頻對比。從最終的效果來看,你會發現Runway、Pika等工具生成的部分所謂視頻,其實更像GIF圖。
比如生成的視頻里有的人物不動背景動,有的是背景不動人物動。這顯然不是對真實物理世界的模擬。

從這些角度來看,可以說Sora相對Runway Gen-2、Pika這些工具,是有代差優勢的。

在過去的一年時間里,有些AIGC公司還屬于眾所關注的“明星公司”,但當Sora出現之后,某種意義上是直接把這些工具cover掉了。

市界:所以說在AIGC賽道內創業是一場十分殘酷的游戲,你認可這個觀點嗎?

程剛:舉個例子,硅谷的一家叫做Jasper AI的公司,很早就接入了ChatGPT的一些能力,能幫助用戶來生成營銷文案。它一度也受到市場的強烈追捧,2022年上半年就已經有4000萬美元的營收,2022年10月獲得由Insight Partners領投的1.25億美元A輪融資、估值也漲到15億美元等等。

但是等到GPT-4正式發布,Jasper AI的價值就大打折扣,開始裁員、下調營收預期。

市界:所以這幾天一直有人說Sora發布,突然就懂抖音的張楠為什么要聚焦剪映了。

程剛:對,剪映如果在AIGC方面,不能推出自己的大模型并且建立起相應的能力,未來某天它可能就會被Sora給干掉了。

剪映面對Sora帶來的威脅,和Sora發布當天Adobe的股價下跌百分之七點多,其實是同一個邏輯。

所謂顛覆,往往不是擁有類似解決方案的競爭對手帶來的,而是一個新物種以高維打低維帶來的。也就是通常我們所說的,干掉相機的不是相機,而是手機。


02.“估計開放使用半年,Sora的一些技術問題就能得到改進”

市界:回到Sora,如果說Sora把Runway等工具遠遠甩在了后頭,那么Sora現在又處在一個什么樣的位置?它距離所謂的“顛覆行業”或者真正商用,還有多遠距離?

程剛:我覺得分幾個層面來說。

具體場景下,從放出的 Demo來看,相對于Runway Gen-2、Pika這些過往的工具,Sora生成的視頻已經大幅提高了可用性。但你是用Sora來生成可修改可使用的成片,還是生成可修改可使用的素材呢?這兩種場景是不一樣的。

基于目前大家的討論和預判,Sora至少在生成素材方面能夠提供非常大的幫助。從這些demo來看,有些視效用傳統的計算機來建模、貼圖、渲染,工作量會非常大,實現的成本會非常高。但是對Sora來講,就變成了輸入一串prompt的問題。

當然,要具體看它能夠解決什么問題、提高了多少效率、節省了多少成本。尤其重要的是,它的使用成本怎么樣。這要等它真正開放后,再具體分析和做進一步判斷。

總體而言,我比較傾向于認為Sora在視頻生成方面的突破,堪比工業革命和信息革命的這樣的革命性的變化:第一是新的生產工具,第二是新的生產方式,第三是帶來的生產關系的變革。

市界:你怎么評價AI工具發展的速度? 2023年下半年,有人還預計文生視頻要能確保對象的一致性、連續性,可能需要一兩年的時間。但是Sora的出現,顯然打破了這個預期。

程剛:Sora的突破速度這么快,出乎了我和身邊絕大多數朋友的預料。我也很關心Sora接下來優化迭代的速度會有多快。

我們目前看到的它存在幻覺問題、精準度問題、對物理世界的理解和模擬不準確所帶來的邏輯問題、版權溯源和版權保護問題,以及有人濫用工具去生成虛假內容的問題等等。這些問題當然會影響Sora在商業場景中的使用。

但我們分開來看,對于技術層面的幻覺問題、精準度問題、對物理世界的理解和模擬不準確所帶來的邏輯問題,我相信OpenAI會持續地投入,去優化,我們也相信Sora會保持比較快的優化迭代速度。

解決這類問題的迭代速度也和Sora什么時候能放出來供用戶使用有關。因為用戶使用的過程中會給OpenAI大量的反饋,OpenAI可以基于這些反饋不斷優化和迭代。

Sora迭代的速度,基本可以參照ChatGPT的迭代速度。Sora對現實模擬不準確的問題,比如手有六指,應該半年左右就能得到比較大的優化。

至于說版權溯源和版權保護問題,包括濫用Sora去生成虛假內容等等,因為這些是人類在AI技術沖擊下面臨的治理和監管問題,更多需要在法律和道德自律的層面去討論和解決。

它不會像技術問題那么容易解決,當然它也不會妨礙AI技術的發展和Sora等等工具的快速應用。這是我們的研判。

市界:感覺你個人對于Sora和它所代表的AIGC浪潮的態度是很積極的。在你和行業的溝通中,大家的態度都是這么積極嗎?有沒有人會有焦慮?

程剛:積極和焦慮本身不矛盾,我身邊的多數朋友,都看好Sora的革命性突破和將帶來的巨大價值,普遍感到很興奮,但是不妨礙他們焦慮。面對Sora和ChatGPT的沖擊,很多人和組織都是人心惶惶的一個狀態,擔心會被AIGC替代,擔心會在競爭中處于不利地位。但更重要的是,當一個大的革命性時代到來,我們怎么去抓住已經成為共識的趨勢性的機會?

這個時候反而各位需要冷靜下來,回到一些底層的問題上去做深度的思考和討論。

從ChatGPT發布一年多以來,我們認為,最重要的是一定要去把握住在沖擊和變革下,什么會發生變化,什么不會發生變化。

我發現市面上絕大多數的討論,都都圍繞著ChatGPT、Sora會改變什么?只有極少的人在思考在這種沖擊下什么不會發生變化。


03.“小分工會被AI壓縮替代,但行業的大分工不會變”

市界:在音視頻行業,變和不變是什么?

程剛:音視頻創作的過程,最初是頭腦中的一個創意和靈感,通過多人協作生成音視頻內容的過程,本質上是創作者的創意和審美的一種呈現。從經濟學的角度講,存有專業分工,在效率上一定是大大優于個人一條龍創意、策劃和制作實現的。

從分工的維度來看,一些小的分工會被大幅壓縮或替代。比如說拍攝、剪輯、特效、調色,像這類更細分的工作,有可能會大范圍、大規模地被AIGC工具替代或者壓縮掉。因為基于prompt生成文案、圖片、素材或者視頻成片的新機制,在相當程度上抹平了一些傳統角色分工在專業能力上的差距。

但是行業的大分工不會變,也就是需求方和需求實現方,或者叫甲乙雙方的大分工不會變。需求方懂產品懂用戶,也可以去學習如何使用Sora這樣的工具,但是創意和審美能力不是一天兩天能夠學會的,有些需要依賴天賦。Sora雖然可以降低視頻制作的門檻,簡化創意落地過程,卻無法抹平人們在創意和審美能力上的差距。

另外,我們還需要回到具體的工作流(workflow)去觀察。前兩天Sora的開發團隊在接受媒體采訪中也表示,他們正在聽取藝術家的意見,看Sora怎么在工作流發光發熱,從而指引研究路線。

而從工作流的角度判斷,小的流程會被大幅壓縮,但是大流程不會變。大流程是什么?第一,需求方要提出需求;第二,需求方提出需求后,跟實踐方溝通需求;第三,需求實現;第四是審看、溝通、修改;第五,需求方確認。

不論AI技術如何發展,技術怎么演進,只要甲乙兩方存在,在這兩端之間就會有反復溝通的需求。甚至而言,溝通需求還會成千上萬地增加。

舉個例子,比如說國內2023年生產的視頻數量可能是500億條。但在創作者熟練使用各類AI工具之后,可能市場中的視頻數量會達到5000億條、1萬億。相應地,需要去審看、修改、確認的工作量也會增加。

所以說類似分秒幀、飛書、Figma(海外設計工具,強調即時協作)這樣的協作工具,始終都會有生存的空間。

按照這個邏輯,分秒幀是要去解決AI和人之間的交叉口的問題。

市界:你剛剛提到視頻量會越來越大,審看需求相應會變多。如果這個市場是一個藍海市場,會不會有越來越多的競爭者,包括抖音剪映這樣的大廠加入進來?怎么面對競爭?

程剛:我們總體來講并不是很擔心,把自己的事情做好就ok了。

以剪映為例,它的緣起和發展中相當長的時間,主要是ToC的。但近一年多,我們的確觀察到越來越多B端的企業客戶開始使用剪映專業版。這些B端客戶有經營抖音賬號矩陣的需求,做短視頻用剪映的確比較方便。

分秒幀目前服務的客戶4000家左右,以B端客戶為主。在過去一年,有不少客戶提出來說,希望分秒幀能夠跟剪映打通,形成從剪輯制作到審看修改的閉環工作流程。這樣他們能夠在剪映上把片子做完后,用分秒幀來快速共享預覽、提出修改意見、完成確認交付。

雖然剪映現在也提供協同協作的能力,但試用一下就知道,他們在這方面的投入還是遠遠不夠的。據我所知,眼下和未來一段時間,剪映的重心會在AIGC和出海上。

總之,我不是很擔心大廠的競爭,而且相反說不定將來我們跟剪映還有一些合作的機會。

市界:一個比較務虛的問題,如果你當初沒有創業,但在2024年的當下,你會愿意做一家分秒幀這樣的公司嗎?

程剛:當然愿意。原因正如我剛才說的,做分秒幀的大邏輯仍然存在。

不管是2019年的時間節點看,還是此時此刻看,我認為行業有幾點沒有發生變化:需求場景沒有變、用戶的最大痛點沒有變。所以,即便已經有了AIGC、有了Sora,我仍然看好云端音視頻生產協同的市場機會。



關于分秒幀


分秒幀——云時代音視頻生產協作平臺。

可幫助音視頻創作者在云端構建工作流,從意見收集到成片交付,以及素材和版本管理、項目流程管控,分秒幀都可一站式搞定。無論身在何處,分秒幀都能讓整個團隊無縫協作,擁有更短的審改周期,更高的出片效率,更簡單的交付方式,指數級提高內容生產效率,實現視頻創作“多快好省”。

創立于2019年,目前已經為來自廣告傳媒、MCN&自媒體、游戲動畫、教育培訓、電商等不同行業的百萬音視頻從業者及專業機構提供生產協作服務。




本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本內容為作者獨立觀點,不代表數英立場。
本文禁止轉載,侵權必究。
本文系數英原創,未經允許不得轉載。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評論

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    800

    推薦評論

    暫無評論哦,快來評論一下吧!

    全部評論(0條)

    主站蜘蛛池模板: 新龙县| 塔城市| 杂多县| 龙江县| 苗栗县| 徐闻县| 铜川市| 疏勒县| 十堰市| 三门峡市| 瑞昌市| 宜春市| 汉沽区| 裕民县| 洮南市| 资兴市| 德令哈市| 工布江达县| 滁州市| 武平县| 神农架林区| 澳门| 扶沟县| 喀什市| 富顺县| 永善县| 宜君县| 汪清县| 长岭县| 青川县| 关岭| 峨边| 读书| 罗甸县| 贵溪市| 蒙城县| 泸水县| 巴楚县| 德保县| 樟树市| 托克逊县|