被封號的字節(jié)跳動大模型,是否會重走游戲業(yè)務(wù)的老路?
字節(jié)跳動的大模型,被戴上了“抄襲”的帽子。
12月16日曾有市場消息稱,因“使用OpenAI技術(shù)打造自己的大語言模型”,字節(jié)跳動違反OpenAI服務(wù)條款,遭到“封殺”。事件發(fā)酵后,OpenAI發(fā)言人尼克·菲尼克斯在當(dāng)天作出回應(yīng),確認字節(jié)跳動違反服務(wù)條款屬實,其賬號已被暫停。
隨后在17日,字節(jié)跳動對外聲稱未來幾天將再次全面檢查,并正在與OpenAI聯(lián)系溝通,“以澄清外部報道可能引發(fā)的誤解”。
這不由得令人聯(lián)想起前不久的11月,李開復(fù)旗下零一萬物大模型,被質(zhì)疑“完全使用”Meta研發(fā)的LIama開源模型架構(gòu)。兩個在業(yè)界都具有不俗影響力的大模型產(chǎn)品,接連被爆出與“抄襲”相關(guān)的指控,不免令人對國產(chǎn)大模型產(chǎn)品的研發(fā)環(huán)境,報以不小的擔(dān)憂。
參考國產(chǎn)大模型由上半年井噴式增長,到如今,核心技術(shù)層面頻繁遭到質(zhì)疑的現(xiàn)狀,我們得出以下推測:
1.字節(jié)跳動遭封號后,仍處于研發(fā)階段的大模型業(yè)務(wù)或?qū)⒃馐苤貏?chuàng),大概率將影響未來的產(chǎn)品運營,未嘗沒有可能會像游戲業(yè)務(wù)一樣,最終遭到字節(jié)跳動的剝離。
2.國產(chǎn)大模型在快速發(fā)展的背后,或許存在著對核心技術(shù)的不重視,以及對上線速度的過分追求。尤其是對開源項目的依賴,也在不斷增加抄襲暴雷的風(fēng)險。
一、字節(jié)跳動大模型口碑崩壞,或?qū)⒅氐赣螒驑I(yè)務(wù)覆轍?
我們必須正視,封號風(fēng)波發(fā)生后,字節(jié)跳動大模型業(yè)務(wù)已經(jīng)隱現(xiàn)口碑崩壞的危險。
危險來自一個詞——眾口鑠金。
在大模型研發(fā)階段,違反服務(wù)條款“借用”O(jiān)penAI技術(shù),這一事件曝光后,相信包括許多AI從業(yè)人員在內(nèi),第一反應(yīng)都會是猜測字節(jié)跳動走了“抄襲”的捷徑。
盡管被封號的背后,仍可能存在著“誤會”,事情真相也尚需查證和補充。但字節(jié)跳動在17日宣布將全面自檢后,連續(xù)多天沒有后續(xù)消息跟進,無疑給了負面信息加速發(fā)酵的機會。
輿情洶涌,字節(jié)跳動的澄清每晚一天,“抄襲”標(biāo)簽就會與字節(jié)跳動大模型關(guān)聯(lián)得越發(fā)牢固。
考慮到字節(jié)跳動在前不久,剛剛因為經(jīng)營戰(zhàn)略的考量,大幅收縮朝夕光年的游戲業(yè)務(wù)并進行大規(guī)模裁員。如果大模型業(yè)務(wù)無法在短時間內(nèi),澄清遭OpenAI“封殺”與“研發(fā)抄襲”之間的聯(lián)系,未必不會和游戲業(yè)務(wù)一樣,落下個虎頭蛇尾的境地。
或許會有人質(zhì)疑,在人工智能產(chǎn)業(yè)發(fā)展大趨勢下,字節(jié)跳動近一年來縮減了多條業(yè)務(wù)線,幾乎集中了全部資源投入AI相關(guān)業(yè)務(wù),怎么可能遭受一點挫折就前功盡棄?
但不妨想一想,在幾年前,游戲產(chǎn)業(yè)同樣被字節(jié)跳動寄予厚望。甚至在當(dāng)時,游戲業(yè)務(wù)板塊的分量,似乎并不比如今的人工智能弱上太多。
回顧2021年,字節(jié)跳動曾宣布進行組織架構(gòu)調(diào)整,成立了抖音、大力教育、飛書、火山引擎、游戲、TikTok六大業(yè)務(wù)板塊。同年,字節(jié)跳動更是斥資40億美元,折合人民幣約286億元,收購了擁有東南亞現(xiàn)象級游戲產(chǎn)品的沐瞳科技。
據(jù)不完全統(tǒng)計,為了加快對游戲產(chǎn)業(yè)的布局,從2019年至2022年,字節(jié)跳動投資游戲產(chǎn)業(yè)超過22起,總投資金額超過了300億元。
然而等待字節(jié)跳動的,是連續(xù)兩年的“版號寒冬”。巨額成本投入難以換回相應(yīng)的收益回報,字節(jié)跳動選錯了入局游戲產(chǎn)業(yè)的時機,最終不得不在2023年,先是傳聞稱字節(jié)跳動將不低于50億美元的價格出售沐瞳科技,又最終對朝夕光年進行了大幅收縮。
如今字節(jié)跳動大模型產(chǎn)品尚未研發(fā)成功,可國內(nèi)外大模型賽道已然陷入高度內(nèi)卷,算力不足以及盈利難題更是逼迫ChatGPT一度暫停會員服務(wù)。很難說字節(jié)跳動是否會像布局游戲業(yè)務(wù)一樣,再次錯過了最佳時機。
即便這次趕上了,持續(xù)走高的研發(fā)成本之下,在研發(fā)階段就已經(jīng)開始口碑受損的字節(jié)跳動的大模型產(chǎn)品,又能在盈利困難的局面下堅持多久?
要知道,字節(jié)跳動所面臨的局面,要遠比李開復(fù)旗下零一萬物的“套殼抄襲”風(fēng)波,更具風(fēng)險。
零一萬物在11月中旬被國外開發(fā)者曝光,在只修改了兩個張量名稱的情況下,“完全使用”的LIama模型架構(gòu),是開源的。即便零一萬物套殼質(zhì)疑屬實,最多也只是違背了開源標(biāo)準,以及Llama的用戶協(xié)議。
簡單來講,此舉雖然侵犯了Llama開源模型的研發(fā)者Mate的權(quán)益,但只要沒有“實錘”,零一萬物“借鑒行業(yè)公開成果”的做法,并不會影響實際運營和使用。
但是字節(jié)跳動大模型研發(fā)過程中,違規(guī)使用的OpenAI,則是閉源的。哪怕站在行業(yè)角度,借助OpenAI的技術(shù)來訓(xùn)練自家大模型,這樣的做法在如今并不罕見,但終究只是見不得光的潛規(guī)則。
字節(jié)跳動不僅是違反了規(guī)則,更是極大損害了自研技術(shù)的形象。如果不能盡快澄清事實,抹除不良影響,只怕即便后期成功推出大模型產(chǎn)品,也很難抹掉“抄襲”的標(biāo)簽,有損業(yè)績表現(xiàn)。
事實上,字節(jié)跳動目前正需要新的增長曲線,來應(yīng)對二季度財報發(fā)布后的市場變化。
根據(jù)前不久發(fā)布的二季度財報,目前字節(jié)跳動主要的增長推動力,在于面向海外市場的TikTok。第二季度中,自家跳動實現(xiàn)營收290億美元,同比增長40%,海外市場帶來的收入約占公司總收入的20%。
但目前TikTok在美國、印度、印度尼西亞等多個重要市場,都遭到了當(dāng)?shù)卣姆鈿⒒蛳拗?。其中,遭到針對性打擊的方向,主要集中于電商、支付、?shù)據(jù)服務(wù)等業(yè)務(wù)領(lǐng)域。
再加上Mate在近些年來,先后推出了借鑒TikTok主要功能和玩法邏輯的Instagram Reels、YouTube Shorts等短視頻產(chǎn)品,字節(jié)跳動TikTok業(yè)務(wù)的增長正在喪失穩(wěn)定性。
一旦TikTok增量空間開始縮減,字節(jié)跳動花費巨大的大模型業(yè)務(wù),短期內(nèi)又無法實現(xiàn)盈利和業(yè)績推動,未必不會像游戲業(yè)務(wù)一樣,遭到“及時止損”。
二、速度至上的國產(chǎn)大模型,開源項目成抄襲“原罪”?
其實嚴格來講,字節(jié)跳動被質(zhì)疑“抄襲”,確實有些冤枉了。
根據(jù)封號事件發(fā)生后字節(jié)跳動的公開回應(yīng),對OpenAI旗下GPT模型API服務(wù)的使用,發(fā)生于2023年年初的初期探索階段。使用該服務(wù)的模型也是測試版,沒有上線和對外使用的計劃。
而且在2023年4月份,字節(jié)跳動引入GPT API的調(diào)用規(guī)則檢查,并對字節(jié)大模型訓(xùn)練數(shù)據(jù)集進行嚴格規(guī)范后,使用OpenAI技術(shù)的做法就已經(jīng)停止。
甚至在8月28日,OpenAI更新商業(yè)條款,提及“不得用使用(大模型)輸出來開發(fā)任何與OpenAI的產(chǎn)品和服務(wù)有競爭的人工智能模型”后,字節(jié)跳動為了避免研發(fā)人員出現(xiàn)違規(guī)操作,專門在9月份進行了分批次內(nèi)部抽檢。
如果這些說法全都屬實,很難想象為什么OpenAI會在時隔多月后忽然發(fā)難。
究竟是財報發(fā)布后,競爭對手的刻意針對,還是字節(jié)跳動有所疏漏,我們不得而知。但無論如何,字節(jié)大模型的口碑面臨崩壞風(fēng)險,已成為不爭的事實。
然而在國產(chǎn)大模型市場中,這或許只是冰山一角。
早在2022年,就曾有消息曝光過,北京智源人工智能研究院涉嫌抄襲AI大模型綜述研究。雖然事后被確認抄襲的兩名作者,第一時間撤稿后,已向原作者致歉并收獲諒解,但智源研究院仍然決定重組“大模型研究中心”,涉事的相關(guān)責(zé)任人也全都主動離職。
進入2023年后,國產(chǎn)大模型井噴式增長,更是引來了更多的“抄襲”質(zhì)疑。
曾有業(yè)內(nèi)人士透露稱,現(xiàn)階段許多初創(chuàng)公司為了追趕大模型風(fēng)口,大都采用將ChatGPT集成至后臺,只是對前端界面進行UI設(shè)計,就開始大肆宣傳自己在開展AIGC創(chuàng)業(yè),并上架各個平臺搶奪用戶關(guān)注。
然而,這類AIGC項目實則缺乏技術(shù)壁壘與商業(yè)邏輯,僅屬“追熱度的短期行為”,核心競爭力亦無從談起。
相對成熟的做法,則是通過對開源項目的二次開發(fā),完成基礎(chǔ)模型框架的搭建,再利用ChatGPT等成熟產(chǎn)品生成AI數(shù)據(jù),對自家大模型進行訓(xùn)練。
速度至上,儼然早已成為許多企業(yè)和機構(gòu)對待大模型研發(fā)的主導(dǎo)思想。通過天眼查能夠看到,ChatGPT問世一年不到,與大模型相關(guān)的企業(yè)信息已經(jīng)增長至248條。
然而,在這一過程中,對開源項目的過度依賴,正在為行業(yè)的基礎(chǔ)不牢帶來負面影響。
大模型研發(fā)過程中,自然語言處理、計算機視覺等較為復(fù)雜繁瑣的環(huán)節(jié),開源項目能夠提供豐富的算法和技術(shù)資源,有助于縮短研發(fā)周期,降低研發(fā)成本。然而,過度依賴這些開源項目,就容易導(dǎo)致基礎(chǔ)不牢的問題。
一方面,過度依賴開源項目,會使企業(yè)在核心技術(shù)領(lǐng)域缺乏自主研發(fā)和創(chuàng)新能力。
開源項目雖然有著免費、高效、易于使用等諸多優(yōu)點,但它們背后的知識產(chǎn)權(quán)和商業(yè)競爭風(fēng)險不容忽視。如果一個企業(yè)完全依賴開源項目,那么在市場競爭中就很容易受到制衡,甚至可能因為開源項目的更新迭代、版權(quán)問題而陷入司法糾紛。
另一方面,過度依賴開源項目會影響行業(yè)的可持續(xù)發(fā)展。
所謂的開源項目,往往是由開發(fā)者社區(qū)自發(fā)式維護。就像曾經(jīng)安卓系統(tǒng)開發(fā)初期,雖然開發(fā)者的熱情帶來了極快的更新速度,但由于技術(shù)實力等問題的限制,開源項目的質(zhì)量參差不齊。
如果大模型行業(yè)過分依賴這些項目,可能會因為項目本身的缺陷或漏洞,導(dǎo)致系統(tǒng)不穩(wěn)定、性能下降等問題。這對于大模型發(fā)展生態(tài)而言,無疑是埋下了極大的隱患。
最后,希望字節(jié)跳動早日澄清與OpenAI的誤會,也祝愿國產(chǎn)大模型企業(yè)能夠穩(wěn)扎穩(wěn)打,更多涌現(xiàn)擁有核心研發(fā)技術(shù)力的產(chǎn)品吧。
免責(zé)聲明:本文基于公司法定披露內(nèi)容和已公開的資料信息,展開評論,但作者不保證該信息資料的完整性、及時性。
另:股市有風(fēng)險,入市需謹慎。文章不構(gòu)成投資建議,投資與否須自行甄別。
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)