盤點2023年AI行業:從GPT-4到AI孫燕姿席卷華語樂壇
作者:卷毛,編輯:張潔,來源:頭號AI玩家
原標題:2023年AI行業大事件盤點:從GPT-4到百模大戰,從AI孫燕姿到OpenAI“宮斗”大戲
最近GPT商店正式上線,AI玩家們又熱鬧了起來,鉆研著怎么做個GPT上架賺錢。
自從ChatGPT引爆大模型熱潮,2023年,在全球范圍內,生成式AI技術的突破和應用不斷刷新著我們的認知。從大型語言模型的迭代升級到多模態AI、Agent的興起,再到AI在各個行業的深入融合,AI領域的競爭愈發激烈。
在國內,各大科技公司紛紛推出自家的AI產品,掀起“百模大戰”,眾多AI創業者開始“卷”AI創新應用,政策層面也逐步完善對AI技術的監管和引導。
(制圖:NUPD)
“頭號AI玩家”按時間整理了2023年AI行業大事件,并從中選出十大熱門事件,在下文展開回顧。以OpenAI為代表的海外AI玩家正引領著AI技術的前沿發展,國內這些內容平臺的AI功能雖然在應用范圍和討論熱度上不及頭部產品,但考慮到平臺的用戶規模和在國內的影響力,這些依然是值得注意的嘗試。
AI行業日新月異,隨著AI技術的不斷成熟,我們將看到更多AI原生的應用玩法,AI也將更加深入地融入我們的日常生活,從工作助手到生活伙伴,從內容創作到決策支持,AI會逐步成為推動社會進步和創新的重要力量。
01
史上最強大模型GPT-4登場
2023年3月15日,OpenAI發布大型多模態模型GPT-4,可以接收圖像和文本輸入,輸出文本,雖然它在許多現實世界場景中的能力不如人類,但在各種專業和學術基準上與人類水平相當。
GPT-4博客地址:https://openai.com/research/gpt-4
GPT-4技術報告地址:https://cdn.openai.com/papers/gpt-4.pdf
相比上一代GPT-3.5,GPT-4擁有更廣的知識面和更強的解決問題能力,在創意、視覺輸入和長內容上的表現也都更好了。
GPT-4能理解梗圖
GPT-4能根據草圖快速生成網頁HTML代碼
如今GPT-4仍然是業內領先的、最受矚目的大模型,不過需要訂閱ChatGPT Plus或通過API訪問,也可以通過微軟Copilot免費體驗。
附OpenAI重要發布時間線:
2022年11月,OpenAI悄然發布GPT-3.5,ChatGPT隨之推出
2023年2月,ChatGPT Plus訂閱計劃推出,每月20美元起
2023年3月,ChatGPT API、GPT-4、ChatGPT插件先后發布
2023年5月,免費的ChatGPT iOS應用程序上線,支持語音輸入
2023年7月,ChatGPT新增“自定義指令”功能,安卓版ChatGPT上線
2023年8月,ChatGPT Enterprise推出
2023年9月,OpenAI發布DALL-E 3,并將其集成至ChatGPT
2023年11月,OpenAI在DevDay上發布GPT Builder、GPT-4 Turbo、Assistants API等更新
02
百度發布文心一言,打響“百模大戰”
隨著ChatGPT的一鳴驚人,互聯網大廠、科研機構、AI創業公司等國內玩家紛紛上場,開啟了“百模大戰”。
2023年2月7日,百度宣布在籌備大模型新項目——文心一言(英文名ERNIE Bot),到了3月16日,文心一言開放測試,展示了在文學創作、商業文案創作、數理推算、中文理解和多模態生成五個場景中的表現,打響了國內大模型競賽的第一槍。
文心一言官網
其基礎模型文心大模型在10月升級到4.0版本,同時,百度發布了全線重構的新搜索、新地圖等十余款AI原生應用。截至2023年12月底,文心一言的用戶規模已突破1億。
百度創始人、董事長兼首席執行官李彥宏被《時代》周刊評為“全球AI領袖”,他預言:“我們即將進入一個AI原生的時代。”在12月16日舉辦的極客公園創新大會2024上,他再次強調“卷AI原生應用才有價值,大模型進展對大多數人不是機會”。
03
AI孫燕姿席卷華語樂壇
2023年5月,“AI孫燕姿”驚艷出道,網友用AI音色轉換技術Sovits4.0(全稱So-vits-svc)訓練復刻了她的嗓音,翻唱起周杰倫的《發如雪》、云南山歌《朝你大垮捏一把》等歌曲,B站相關視頻播放量累計超千萬。
不過,這類合成的AI歌手存在侵犯版權的風險,比如未經授權使用他人的聲音素材訓練生成AI音頻并發布,涉嫌構成著作權侵權。
孫燕姿本人的回應將事件推向新的高潮,她說:“你跟一個每幾分鐘就推出一張新專輯的人還有什么好爭的。”
她認為,AI聳現并將威脅到成千上萬個由人類創造的工作,包括唱歌,“諷刺的是,人類無法超越它已指日可待”,“你并不特別,你已經是可預測的,而且不幸你也是可定制的”。
從積極的角度看,生成式AI的發展使AI音樂制作和翻唱的門檻進一步降低,平臺也開始與創作者擁抱AI,將AI音樂規范化,比如YouTube和Charlie Puth、Troye Sivan等歌手合作測試Dream Track功能,可以模仿歌手風格生成音樂片段。
04
妙鴨相機爆火,AI寫真產品興起
2023年7月17日,妙鴨相機小程序正式上線,迅速在朋友圈刷屏。
用戶只要上傳一定數量的照片,選擇好模版,就可以一鍵生成AI風格化寫真,包括證件照、藝術照等。雖然首次生成需要支付9.9元的數字分身制作費,但爆火初期仍有上千人深夜排隊等待生成。
妙鴨相機出自阿里大文娛團隊,阿里內部評價它為“國內AIGC領域第一個爆火的C端產品”。此后國內涌現出諸多同類AI寫真產品,B612咔嘰、美圖秀秀、輕顏相機等APP也有類似的AI寫真/頭像功能。
這類工具型產品要面臨的難題是如何在競爭中維持住熱度,持續吸引更多的用戶。妙鴨相機在之后幾個月內不斷上新寫真模板,其中一部分與品牌合作聯名,此外還推出了發型設計、AI修臉、拍合照的新功能,并和阿里系其他業務進行聯動,比如冠名綜藝《這就是街舞6》。
05
《生成式人工智能服務管理暫行辦法》公布
過去一年,“狂飆”的AIGC產業迎來了國家級規范性政策。
2023年4月11日,國家網信辦就《生成式人工智能服務管理辦法(征求意見稿)》公開征求意見,我們在第一時間進行了重點解讀。7月,《生成式人工智能服務管理暫行辦法》(以下簡稱《辦法》)公布,自8月15日起施行。
《辦法》提出國家堅持發展和安全并重、促進創新和依法治理相結合的原則,采取有效措施鼓勵生成式人工智能創新發展,對生成式人工智能服務實行包容審慎和分類分級監管。
對于生成式AI領域的監管問題,全球各國都處于探索之中。《辦法》是中國立法者的一次先行“試水”,為后續更為全面、細致的立法工作做了鋪墊。目前人工智能法已被列入我國2023年立法計劃,這意味著未來AI統一監管立法已提上日程。
06
更聰明的AI畫圖神器:DALL·E 3+ChatGPT
DALL·E 3是OpenAI在2023年9月推出的AI繪圖模型,原生構建在ChatGPT之上,用戶可以在對話中將自己的想法轉化成準確的圖像,甚至還能畫出正確的文字。
用戶問ChatGPT“我5歲的孩子說的超級向日葵刺猬,它應該長什么樣子”,ChatGPT立馬寫了四段不同風格的提示詞,并生成對應圖像
對于不擅長寫提示詞的普通玩家來說,這一改進大大降低了AI繪畫門檻。
與Midjourney相比,DALL·E 3的交互式繪圖比較直觀方便,能直接讀懂大段文字自動作圖。而且與OpenAI深度合作的微軟已將DALL·E 3集成在Bing(現為Copilot)中,可以免費使用。
07
微軟AI助手Copilot全面集成至Win11
作為OpenAI最重要的投資方,微軟率先將GPT-4引入搜索引擎,從2023年9月26日開始,微軟重磅發布全球版智能副駕Copilot,將作為Windows 11免費更新的一部分推出,并陸續擴展到必應、Edge瀏覽器以及微軟365 Copilot中。
在11月的Ignite全球技術大會上,微軟又將Bing Chat升級更名為Copilot,允許所有用戶創建類似于GPTs的AI助手。
全新的Copilot,用微軟賬戶登錄即可免費體驗:https://copilot.microsoft.com/
Copilot Studio作為一個低代碼工具,支持在同一網頁中構建、部署、分析和管理所有內容,可以讓用戶創建自定義Copilot,或集成定制版的GPT、生成式AI插件和主題等,包括GPTs的功能。
2024年,微軟還將在鍵盤上新增Copilot鍵,一鍵調用AI助手,也許未來每個人都可以擁有自己的AI電腦。
08
Sam Altman的“離職”風波
從被蘋果掃地出門到王者歸來,喬布斯花了12年時間。而AI時代的“喬布斯”只用了4天。
美國時間2023年11月17日午間,OpenAI突然宣布領導層換屆,首席執行官Sam Altman被開除了,因為他“在與董事會的溝通中始終不坦誠,阻礙了董事會履行職責的能力”。
消息一出,震驚整個AI圈。這場鬧劇之后經歷了幾次反轉,上一秒Sam Altman回到公司談判,似乎有望重返OpenAI,下一秒微軟就宣布Sam Altman及其同事將加入微軟,領導一個新的AI研究團隊。最終Sam Altman還是在眾多同事的支持和微軟的推動下回來了,董事會成員大換血,新增一名無投票權的觀察員——微軟副總裁Dee Templeton。
目前這場高層震蕩的起因依舊眾說紛紜,不過OpenAI的發展已回到正軌,正式發布GPT商店,不斷構建AI商業生態。
09
Pika 1.0發布,AI視頻元年來了
2023年11月28日,AI視頻生成產品Pika 1.0發布,官宣推文瀏覽量1天內就破了一千萬。
Pika內測版支持輸入文字或圖像來生成各種風格的視頻,此次Pika 1.0新增局部實時重繪、擴展視頻尺寸等功能,效果不輸Runway Gen2,甚至在易用性、3D動畫生成上更勝一籌。
我們也嘗試用ChatGPT、Pika等AI生成工具創作了一條圣誕動畫,對于沒有專業學習過動畫制作的愛好者來說,現在AI可以幫助實現7、8成的故事腳本了。
Pika一夜爆火,而令人驚訝的是其團隊只有4個人,創立6個月就在Discord上吸引了50萬用戶,公司估值超2億美元。
目前AI視頻生成領域的動作進展較快,不乏新玩家入局,除了Pika,還有Meta發布了Emu Video,Stability AI發布了首個AI視頻開源模型SVD,Midjourney也即將發布視頻生成模型。
10
《紐約時報》起訴微軟和OpenAI侵權
這或許是OpenAI史上最難的AI版權訴訟。
2023年12月底,《紐約時報》因版權侵權起訴微軟和OpenAI,220000頁附件,羅列了多達100個鐵證,證明ChatGPT輸出的內容與他們的新聞內容幾乎一模一樣。
左邊為GPT4的輸出,右邊為《紐約時報》的新聞
為此,《紐約時報》要求OpenAI和微軟銷毀侵權材料的模型和訓練數據,并對非法復制和使用《紐約時報》獨有價值的作品造成的“數十億美元的法定和實際損失”負責。
OpenAI發布公告回應稱,公司使用公開的互聯網材料訓練人工智能模型是合理的,OpenAI已提供了退出的選擇。并指出,《紐約時報》沒有講述完整的事實,暗示AI“抄襲”原文的情況是故意操縱提示詞,讓模型“反芻”(Regurgitation)的結果。
AI模型和訓練數據的版權之爭頗受關注,此次訴訟或將成為影響AIGC領域走向的重大事件。
結語
通過以上精選的重要事件,我們回顧了2023年AI行業的蓬勃發展,我們有理由相信,2024年將有更多激動人心的技術創新和應用落地。
“至少在未來的五年或十年內,這項技術將處于一個非常陡峭的成長曲線上。現有這些模型都將變成最愚蠢的模型。”正如Sam Altman最近在訪談中所說的,多模態、可定制性和個性化很重要,AI還可以做更多復雜的事情,真正提升生產力。
AI將繼續在內容創作、醫療健康、教育等多個領域發揮其潛力,同時,隨著AI技術的不斷進步,我們也將面臨新的挑戰,包括倫理、隱私和安全等問題,我們需要盡快適應并確保讓技術的力量服務于全人類。
作者公眾號: 頭號AI玩家(ID:AIGCplayer)
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
全部評論(1條)