逐浪100人丨對話魔琺科技CEO柴金祥:AI時代,虛擬人的邊界在哪?
Photo by 《機械姬》劇照
?自象限原創
訪談丨程心
生成式AI的爆發,帶領全民到達AIGC的新時代。
在這個新時代,虛擬人作為一種新興的內容載體,不僅在娛樂、教育、零售等領域中扮演著越來越重要的角色,也成為了品牌與消費者之間互動的新媒介。
在去年虛擬人技術發展的一年中,3D虛擬人與2D虛擬人成為了行業一道極為明顯的分水嶺。2D虛擬人通常限于平面的視覺表現,適用于傳統的社交媒體和網頁內容。相比之下,3D虛擬人則提供了一個三維的、可以與之互動的世界,它們不僅能夠提供更加真實的視覺體驗,更是未來“入口級的應用”。
從技術的發展來看,虛擬人正從單一的形象展示向更加綜合和多元的“虛擬人+”階段過渡。這一階段的虛擬人不再僅僅是一個靜態的形象,而是成為了一個具備多種功能和服務能力的智能實體。它們可以是虛擬客服、虛擬教師、虛擬主播,甚至是虛擬健康顧問。同時,虛擬人的應用場景正在迅速擴展,從而推動了相關行業的創新和變革。
在2024年開年,「自象限」關注到虛擬人已經在和其他技術進行結合。以3D虛擬人頭部廠商魔琺科技為例,在其近期迭代的產品“有言”中,3D虛擬人進入了3D視頻空間,用戶可以直接利用該平臺制作3D視頻,包括腳本、虛擬人形象、AI語音合成、燈光布景等多維度的綜合體現。
這也引出了另一個發人深省的問題,在技術發展的早期階段,企業面臨著技術驅動與產品驅動的戰略選擇。技術驅動的路徑強調技術創新和突破,可能會帶來顛覆性的變革,但也存在市場接受度和商業化應用的不確定性。產品驅動則更注重市場需求和用戶體驗,通過滿足用戶的實際需求來推動技術的商業化。這兩種策略的選擇將直接影響企業的發展軌跡和市場競爭力。
在這個行業發展的關鍵時期,魔琺科技作為擁有3D虛擬人及全棧AIGC技術的廠商,選擇了一條產品驅動的發展路徑。在《逐浪100人》的第二期,「自象限」對話魔琺科技創始人柴金祥,探討AIGC時代,虛擬人的邊界以及技術和產品的平衡。▲魔琺科技創始人兼CEO柴金祥 受訪者提供
有言,有話說
自象限:先聊聊這次有言的升級吧,我們能夠感受到這是一款不一樣的產品,和以往的產品相比,這一次升級特殊在哪?
柴金祥:與傳統的2D視頻生成工具不同,有言具有全棧的AIGC技術,能夠一鍵生成高質量的3D視頻內容。這意味著用戶無需繁瑣的拍攝和后期制作流程,就能夠創造出具有深度和真實感的視頻體驗。我們的3D虛擬人角色庫豐富多樣,用戶可以根據需要選擇不同的角色和場景,實現個性化的視頻創作。
在操作方面,這次升級加強了內容的可控性和編輯能力。過去,視頻創作者往往受限于視頻素材的可用性和編輯難度。而現在,有言提供了從角色動作、表情到場景、燈光、聲音等全方位的編輯功能,使得創作者可以精準控制每一個細節,確保視頻內容完全符合他們的創意和需求。
并且我們針對了多場景的應用進行了優化。有言支持團隊協作、多語言輸出,可以生成多語言視頻助力產品出海,這對于全球化的市場環境尤為重要。無論是知識分享、教育培訓還是品牌宣傳,有言都能提供強大的支持。
此外,我們還關注到了3D內容與未來技術如VR/AR的結合。有言生成的3D視頻內容可以直接適配未來的虛擬3D世界,這意味著我們的產品不僅僅是為了當前的市場,更是為了即將到來的元宇宙時代做準備。
自象限:技術上的難度體現在哪?相較于以往的虛擬人或者3D視頻產品有哪些創新?
柴金祥:在這個用戶使用簡單的產品中,是很多種復合型技術形成的一個綜合型的創新解決方案,舉幾個例子
三維內容的AIGC化:傳統的3D內容制作依賴于專業團隊和復雜的軟件工具,有言實現了從3D虛擬人形象建模、綁定、動作、表情的AIGC化,比如說人肌肉手工制作的過程是非常困難的,但是我們做到了AIGC化,一個人的能力,他的表情、眼神、手勢、動作,聲音是 AIGC。另外燈光、鏡頭也需要通過最佳實踐,比如發布會的鏡頭切換需要用專業攝影師專業的方式,其實也是三維鏡頭,燈光模擬了專業燈光師進行調控,這些都是AIGC。
目前來說,我們把最難的部分AIGC化,少部分采用模板庫的方式,比如說視頻包裝的片頭片尾、BGM、字幕展示、貼紙文字等,隨著數據增多會逐步實現從UGC到AIGC的轉化。
它的難點其實還是在于高質量3D數據的缺乏,3D內容的生成需要大量的高質量數據作為訓練基礎。魔琺科技通過多年的積累,建立了龐大的3D數據庫,這些數據不僅包括角色模型,還包括動作、表情、場景等,還要滿足用戶的實時渲染與編輯需求,這要求后端系統具備高效的渲染能力和靈活的編輯接口,技術上的挑戰在于如何保證渲染速度和視頻質量的同時,提供流暢的用戶體驗。
自象限:我們認為虛擬人正在走向虛擬人+,您怎么看,未來魔琺會探索更多+之外的邊界么?
柴金祥:其實我們真正在做的是3D 超寫實虛擬 AIGC + X, 這一趨勢意味著虛擬人技術將不再局限于單一的應用場景,而是會與更多行業、領域和技術相結合,形成更加豐富和多元的產品和服務。虛擬人+的概念代表了一種開放性和擴展性,它不僅能夠增強現有的業務流程,還能夠創造全新的用戶體驗和商業模式。
有言生成的3D視頻,如果你今天放在Vision Pro 里面, AR/VR 中看到的就是3D的景象,虛擬人可能就在站在你面前,這就是3D視頻+VR/AR的一個應用。今天本質上是因為我們只能在 PC 端或移動端看到3D視頻,因此視覺上3D場景與2D場景的感受沒有那么強烈。
對于未來,魔琺科技將持續探索虛擬人技術的各種可能性,并推動其在更多“+”之外的邊界的應用。半年以后我們可能也會把內部3D 超寫實虛擬人AIGC全棧能力做成開放平臺,就像 ChatGPT的API接口調用一樣,無論是C端、 B端都可以調用API,使用背后的技術能力。
什么是魔琺???????????
自象限:您不斷提到產品戰略,所以魔琺是一家產品公司么?
柴金祥:是的,魔琺科技是一家以3D虛擬人和AIGC為核心的AI科技公司。我們的戰略重點在于利用人工智能AIGC技術,創造出能夠為用戶帶來實際價值的產品。所以你會發現我們從來不發Demo,我們推向市場時就是以產品的形態落地,技術有沒有用,最終要落在產品中,看是否能給用戶帶來價值。
我認為不僅要關注技術的先進性,還注重產品的實用性、易用性和市場適應性。我覺得將復雜的技術轉化為簡單、直觀且高效的用戶體驗,這個才是最重要的。無論是3D虛擬人、AIGC技術還是VR/AR集成,我們的最終目標都是打造出能夠被廣泛接受和使用的產品。
其實我們產品戰略是“1 + 3”,“1”是我們底層有技術的基礎設施,以3D 超寫實虛擬人AIGC操作系統為核心,讓所有人都能夠即插即用。“3”是指有言、有靈、有光三個消費級產品平臺,后面會有我們的直播產品和有靈一對一的交互虛擬人產品,越來越精細化。
自象限:為什么是產品驅動而不是技術驅動?背后的邏輯是是什么?
柴金祥:技術驅動的公司可能會面臨技術過時或市場需求變化的風險,而產品驅動的公司本質上是以用戶需求為核心,將用戶的需求轉換實際的價值,技術在進步,但用戶的需求和行業kown-how有跡可循。比如3D視頻制作過程中的團隊協作能力幾乎是一個剛需能力,無論技術怎么變,這個場景是不會變的。
相比于Sora這樣的2D視頻生成的產品,首先他要用戶具備一定的技術背景,或者需要通過反復嘗試和調整輸入參數來生成滿意的視頻內容,其次它不可編輯,視頻中一旦發生錯誤是不可更改的,在內容生成自由度方面有一定的限制,而且Sora目前還是還是以生成“作品”為主,沒有辦法在商業的場景中使用,也就無法變成生產力。
從技術的角度來看,我之前提到了3D視頻AIGC的一個技術難點在于高質量數據的不足,那么我們以產品的形式向行業提供生產力工具,我們的客戶也通過有言自主生成了很多高質量的3D視頻數據來反哺我們的模型,去解決數據源頭不足的問題,生產力工具像是一個“鉤子”,以此形成飛輪效應。
過去十年,無論是B端還是C端,ChatGPT、Canva、還是Figma,你會發現一旦到了產品和市場需求匹配,增長就特別快,就是這個道理。
自象限:如今AIGC產品的核心能力還是體現在降本增效的方面,有哪些具體的數據可以分享?
柴金祥:首先肯定是虛擬人制作的成本會逐漸變低。我們最早的時候企業設計專屬的虛擬人形象實際成交單價都是大幾十萬,我們自己的成本肯定也要幾十萬,但是就像上面講的,我們的客戶越來越多,數據越來越豐富,技術的進步使得內容生產變得越來越簡單,從PGC到UGC再到AIGC,門檻越來越低,但質量會越來越好。
下一個版本現在我們把定制化的形象轉化成了虛擬人生成的產品,企業可以自己“捏臉”,這個成本就是很低的了。到今年下半年,當一個普通人就能通過AIGC定制一個3D虛擬人的時候,AIGC的核心是使得內容創作的邊際成本接近于零。
其次是3D視頻的制作的成本在降低,親身經歷過動畫行業的就知道,像有言生成的高質量動畫一秒鐘的成本在500塊錢左右,如今我們已經把它AIGC化了,企業用戶通過按月付費的方式就可以讓所有的員工使用。
舉一個頭部客戶的案例,這個集團客戶要了100個賬號,實現每天生產30多個視頻,每一個賬號背后有4個人輪換在用,兩個月不到的時間里,做了近600條視頻總計近3000分鐘,這個成本和效率在以前是絕對想象不到的。
自象限:關于魔琺商業化的部分,您剛提到從項目定制化轉向標準化,這中間有什么契機,是如何考慮的?
柴金祥:其實從公司一成立我們就想做產品化,只是我們那時候能力沒有到,做 business 到 eventually,這不是一種契機反而是一種堅持,我們的美術水平在逐漸提升、技術在提升、算法在優化,當技術達到一定成熟期以及公司規模到一定體量的時候,才能實現標準化的產品落地。
反過來講,當ChatGPT剛開始做的時候,1.0、2.0時期沒有人相信它,只有到了3.5的時候它的能力達到了,大家才會覺得“噢,這個很了不起”,就像換做十幾年前的電動車,所有都覺得馬斯克就是個瘋子。凡事只能先做到證明可行性,才有可能落到用戶層面。
其次隨著時間的推移,我們發現市場上對于高效、低成本、易于使用的視頻制作解決方案的需求日益增長。客戶不僅需要高質量的定制服務,還需要能夠快速響應市場變化、靈活調整內容生產的標準化產品,我認為這是一種“雙向奔赴”,最重要的難點是能不能實現。
早期我們自己的成本無論是研發成本還是人才成本都很高,我們自己也在攻克這些問題,但是現在有言最大的成本其實就是算力成本,所以我們需要更多的用戶來對算力成本進行攤薄,用戶增長,我的PMF自然就能達到。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)