被封號的字節(jié)跳動大模型，是否會重走游戲業(yè)務(wù)的老路？

原創(chuàng) 贊收藏評論

舉報 2024-01-02

掃描,分享朋友圈

字節(jié)跳動的大模型，被戴上了“抄襲”的帽子。

12月16日曾有市場消息稱，因“使用OpenAI技術(shù)打造自己的大語言模型”，字節(jié)跳動違反OpenAI服務(wù)條款，遭到“封殺”。事件發(fā)酵后，OpenAI發(fā)言人尼克·菲尼克斯在當(dāng)天作出回應(yīng)，確認字節(jié)跳動違反服務(wù)條款屬實，其賬號已被暫停。

隨后在17日，字節(jié)跳動對外聲稱未來幾天將再次全面檢查，并正在與OpenAI聯(lián)系溝通，“以澄清外部報道可能引發(fā)的誤解”。

這不由得令人聯(lián)想起前不久的11月，李開復(fù)旗下零一萬物大模型，被質(zhì)疑“完全使用”Meta研發(fā)的LIama開源模型架構(gòu)。兩個在業(yè)界都具有不俗影響力的大模型產(chǎn)品，接連被爆出與“抄襲”相關(guān)的指控，不免令人對國產(chǎn)大模型產(chǎn)品的研發(fā)環(huán)境，報以不小的擔(dān)憂。

參考國產(chǎn)大模型由上半年井噴式增長，到如今，核心技術(shù)層面頻繁遭到質(zhì)疑的現(xiàn)狀，我們得出以下推測：

1.字節(jié)跳動遭封號后，仍處于研發(fā)階段的大模型業(yè)務(wù)或?qū)⒃馐苤貏?chuàng)，大概率將影響未來的產(chǎn)品運營，未嘗沒有可能會像游戲業(yè)務(wù)一樣，最終遭到字節(jié)跳動的剝離。

2.國產(chǎn)大模型在快速發(fā)展的背后，或許存在著對核心技術(shù)的不重視，以及對上線速度的過分追求。尤其是對開源項目的依賴，也在不斷增加抄襲暴雷的風(fēng)險。

一、字節(jié)跳動大模型口碑崩壞，或?qū)⒅氐赣螒驑I(yè)務(wù)覆轍？

我們必須正視，封號風(fēng)波發(fā)生后，字節(jié)跳動大模型業(yè)務(wù)已經(jīng)隱現(xiàn)口碑崩壞的危險。

危險來自一個詞——眾口鑠金。

在大模型研發(fā)階段，違反服務(wù)條款“借用”O(jiān)penAI技術(shù)，這一事件曝光后，相信包括許多AI從業(yè)人員在內(nèi)，第一反應(yīng)都會是猜測字節(jié)跳動走了“抄襲”的捷徑。

盡管被封號的背后，仍可能存在著“誤會”，事情真相也尚需查證和補充。但字節(jié)跳動在17日宣布將全面自檢后，連續(xù)多天沒有后續(xù)消息跟進，無疑給了負面信息加速發(fā)酵的機會。

輿情洶涌，字節(jié)跳動的澄清每晚一天，“抄襲”標(biāo)簽就會與字節(jié)跳動大模型關(guān)聯(lián)得越發(fā)牢固。

考慮到字節(jié)跳動在前不久，剛剛因為經(jīng)營戰(zhàn)略的考量，大幅收縮朝夕光年的游戲業(yè)務(wù)并進行大規(guī)模裁員。如果大模型業(yè)務(wù)無法在短時間內(nèi)，澄清遭OpenAI“封殺”與“研發(fā)抄襲”之間的聯(lián)系，未必不會和游戲業(yè)務(wù)一樣，落下個虎頭蛇尾的境地。

或許會有人質(zhì)疑，在人工智能產(chǎn)業(yè)發(fā)展大趨勢下，字節(jié)跳動近一年來縮減了多條業(yè)務(wù)線，幾乎集中了全部資源投入AI相關(guān)業(yè)務(wù)，怎么可能遭受一點挫折就前功盡棄？

但不妨想一想，在幾年前，游戲產(chǎn)業(yè)同樣被字節(jié)跳動寄予厚望。甚至在當(dāng)時，游戲業(yè)務(wù)板塊的分量，似乎并不比如今的人工智能弱上太多。

回顧2021年，字節(jié)跳動曾宣布進行組織架構(gòu)調(diào)整，成立了抖音、大力教育、飛書、火山引擎、游戲、TikTok六大業(yè)務(wù)板塊。同年，字節(jié)跳動更是斥資40億美元，折合人民幣約286億元，收購了擁有東南亞現(xiàn)象級游戲產(chǎn)品的沐瞳科技。

據(jù)不完全統(tǒng)計，為了加快對游戲產(chǎn)業(yè)的布局，從2019年至2022年，字節(jié)跳動投資游戲產(chǎn)業(yè)超過22起，總投資金額超過了300億元。

然而等待字節(jié)跳動的，是連續(xù)兩年的“版號寒冬”。巨額成本投入難以換回相應(yīng)的收益回報，字節(jié)跳動選錯了入局游戲產(chǎn)業(yè)的時機，最終不得不在2023年，先是傳聞稱字節(jié)跳動將不低于50億美元的價格出售沐瞳科技，又最終對朝夕光年進行了大幅收縮。

如今字節(jié)跳動大模型產(chǎn)品尚未研發(fā)成功，可國內(nèi)外大模型賽道已然陷入高度內(nèi)卷，算力不足以及盈利難題更是逼迫ChatGPT一度暫停會員服務(wù)。很難說字節(jié)跳動是否會像布局游戲業(yè)務(wù)一樣，再次錯過了最佳時機。

即便這次趕上了，持續(xù)走高的研發(fā)成本之下，在研發(fā)階段就已經(jīng)開始口碑受損的字節(jié)跳動的大模型產(chǎn)品，又能在盈利困難的局面下堅持多久？

要知道，字節(jié)跳動所面臨的局面，要遠比李開復(fù)旗下零一萬物的“套殼抄襲”風(fēng)波，更具風(fēng)險。

零一萬物在11月中旬被國外開發(fā)者曝光，在只修改了兩個張量名稱的情況下，“完全使用”的LIama模型架構(gòu)，是開源的。即便零一萬物套殼質(zhì)疑屬實，最多也只是違背了開源標(biāo)準，以及Llama的用戶協(xié)議。

簡單來講，此舉雖然侵犯了Llama開源模型的研發(fā)者Mate的權(quán)益，但只要沒有“實錘”，零一萬物“借鑒行業(yè)公開成果”的做法，并不會影響實際運營和使用。

但是字節(jié)跳動大模型研發(fā)過程中，違規(guī)使用的OpenAI，則是閉源的。哪怕站在行業(yè)角度，借助OpenAI的技術(shù)來訓(xùn)練自家大模型，這樣的做法在如今并不罕見，但終究只是見不得光的潛規(guī)則。

字節(jié)跳動不僅是違反了規(guī)則，更是極大損害了自研技術(shù)的形象。如果不能盡快澄清事實，抹除不良影響，只怕即便后期成功推出大模型產(chǎn)品，也很難抹掉“抄襲”的標(biāo)簽，有損業(yè)績表現(xiàn)。

事實上，字節(jié)跳動目前正需要新的增長曲線，來應(yīng)對二季度財報發(fā)布后的市場變化。

根據(jù)前不久發(fā)布的二季度財報，目前字節(jié)跳動主要的增長推動力，在于面向海外市場的TikTok。第二季度中，自家跳動實現(xiàn)營收290億美元，同比增長40%，海外市場帶來的收入約占公司總收入的20%。

但目前TikTok在美國、印度、印度尼西亞等多個重要市場，都遭到了當(dāng)?shù)卣姆鈿⒒蛳拗?。其中，遭到針對性打擊的方向，主要集中于電商、支付、?shù)據(jù)服務(wù)等業(yè)務(wù)領(lǐng)域。

再加上Mate在近些年來，先后推出了借鑒TikTok主要功能和玩法邏輯的Instagram Reels、YouTube Shorts等短視頻產(chǎn)品，字節(jié)跳動TikTok業(yè)務(wù)的增長正在喪失穩(wěn)定性。

一旦TikTok增量空間開始縮減，字節(jié)跳動花費巨大的大模型業(yè)務(wù)，短期內(nèi)又無法實現(xiàn)盈利和業(yè)績推動，未必不會像游戲業(yè)務(wù)一樣，遭到“及時止損”。

二、速度至上的國產(chǎn)大模型，開源項目成抄襲“原罪”？

其實嚴格來講，字節(jié)跳動被質(zhì)疑“抄襲”，確實有些冤枉了。

根據(jù)封號事件發(fā)生后字節(jié)跳動的公開回應(yīng)，對OpenAI旗下GPT模型API服務(wù)的使用，發(fā)生于2023年年初的初期探索階段。使用該服務(wù)的模型也是測試版，沒有上線和對外使用的計劃。

而且在2023年4月份，字節(jié)跳動引入GPT API的調(diào)用規(guī)則檢查，并對字節(jié)大模型訓(xùn)練數(shù)據(jù)集進行嚴格規(guī)范后，使用OpenAI技術(shù)的做法就已經(jīng)停止。

甚至在8月28日，OpenAI更新商業(yè)條款，提及“不得用使用（大模型）輸出來開發(fā)任何與OpenAI的產(chǎn)品和服務(wù)有競爭的人工智能模型”后，字節(jié)跳動為了避免研發(fā)人員出現(xiàn)違規(guī)操作，專門在9月份進行了分批次內(nèi)部抽檢。

如果這些說法全都屬實，很難想象為什么OpenAI會在時隔多月后忽然發(fā)難。

究竟是財報發(fā)布后，競爭對手的刻意針對，還是字節(jié)跳動有所疏漏，我們不得而知。但無論如何，字節(jié)大模型的口碑面臨崩壞風(fēng)險，已成為不爭的事實。

然而在國產(chǎn)大模型市場中，這或許只是冰山一角。

早在2022年，就曾有消息曝光過，北京智源人工智能研究院涉嫌抄襲AI大模型綜述研究。雖然事后被確認抄襲的兩名作者，第一時間撤稿后，已向原作者致歉并收獲諒解，但智源研究院仍然決定重組“大模型研究中心”，涉事的相關(guān)責(zé)任人也全都主動離職。

進入2023年后，國產(chǎn)大模型井噴式增長，更是引來了更多的“抄襲”質(zhì)疑。

曾有業(yè)內(nèi)人士透露稱，現(xiàn)階段許多初創(chuàng)公司為了追趕大模型風(fēng)口，大都采用將ChatGPT集成至后臺，只是對前端界面進行UI設(shè)計，就開始大肆宣傳自己在開展AIGC創(chuàng)業(yè)，并上架各個平臺搶奪用戶關(guān)注。

然而，這類AIGC項目實則缺乏技術(shù)壁壘與商業(yè)邏輯，僅屬“追熱度的短期行為”，核心競爭力亦無從談起。

相對成熟的做法，則是通過對開源項目的二次開發(fā)，完成基礎(chǔ)模型框架的搭建，再利用ChatGPT等成熟產(chǎn)品生成AI數(shù)據(jù)，對自家大模型進行訓(xùn)練。

速度至上，儼然早已成為許多企業(yè)和機構(gòu)對待大模型研發(fā)的主導(dǎo)思想。通過天眼查能夠看到，ChatGPT問世一年不到，與大模型相關(guān)的企業(yè)信息已經(jīng)增長至248條。

然而，在這一過程中，對開源項目的過度依賴，正在為行業(yè)的基礎(chǔ)不牢帶來負面影響。

大模型研發(fā)過程中，自然語言處理、計算機視覺等較為復(fù)雜繁瑣的環(huán)節(jié)，開源項目能夠提供豐富的算法和技術(shù)資源，有助于縮短研發(fā)周期，降低研發(fā)成本。然而，過度依賴這些開源項目，就容易導(dǎo)致基礎(chǔ)不牢的問題。

一方面，過度依賴開源項目，會使企業(yè)在核心技術(shù)領(lǐng)域缺乏自主研發(fā)和創(chuàng)新能力。

開源項目雖然有著免費、高效、易于使用等諸多優(yōu)點，但它們背后的知識產(chǎn)權(quán)和商業(yè)競爭風(fēng)險不容忽視。如果一個企業(yè)完全依賴開源項目，那么在市場競爭中就很容易受到制衡，甚至可能因為開源項目的更新迭代、版權(quán)問題而陷入司法糾紛。

另一方面，過度依賴開源項目會影響行業(yè)的可持續(xù)發(fā)展。

所謂的開源項目，往往是由開發(fā)者社區(qū)自發(fā)式維護。就像曾經(jīng)安卓系統(tǒng)開發(fā)初期，雖然開發(fā)者的熱情帶來了極快的更新速度，但由于技術(shù)實力等問題的限制，開源項目的質(zhì)量參差不齊。

如果大模型行業(yè)過分依賴這些項目，可能會因為項目本身的缺陷或漏洞，導(dǎo)致系統(tǒng)不穩(wěn)定、性能下降等問題。這對于大模型發(fā)展生態(tài)而言，無疑是埋下了極大的隱患。

最后，希望字節(jié)跳動早日澄清與OpenAI的誤會，也祝愿國產(chǎn)大模型企業(yè)能夠穩(wěn)扎穩(wěn)打，更多涌現(xiàn)擁有核心研發(fā)技術(shù)力的產(chǎn)品吧。

免責(zé)聲明：本文基于公司法定披露內(nèi)容和已公開的資料信息，展開評論，但作者不保證該信息資料的完整性、及時性。

另：股市有風(fēng)險，入市需謹慎。文章不構(gòu)成投資建議，投資與否須自行甄別。

本文系作者授權(quán)數(shù)英發(fā)表，內(nèi)容為作者獨立觀點，不代表數(shù)英立場。
未經(jīng)授權(quán)嚴禁轉(zhuǎn)載，授權(quán)事宜請聯(lián)系作者本人，侵權(quán)必究。

掃描,分享朋友圈

銀箭財觀

其他

近期精選文章更多

猜您可能喜歡

行業(yè)動態(tài)

带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度

被封號的字節(jié)跳動大模型，是否會重走游戲業(yè)務(wù)的老路？

評論

評論

推薦評論

全部評論（0條）

銀箭財觀

關(guān)于

聯(lián)系

相關(guān)信息

带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度

被封號的字節(jié)跳動大模型，是否會重走游戲業(yè)務(wù)的老路？

評論

評論

推薦評論

全部評論（0條）

銀箭財觀

關(guān)于

聯(lián)系

相關(guān)信息

被封號的字節(jié)跳動大模型，是否會重走游戲業(yè)務(wù)的老路？