盤點2023年AI行業：從GPT-4到AI孫燕姿席卷華語樂壇

轉載贊7 收藏21 評論1

舉報 2024-02-21

掃描,分享朋友圈

作者：卷毛，編輯：張潔，來源：頭號AI玩家
原標題：2023年AI行業大事件盤點：從GPT-4到百模大戰，從AI孫燕姿到OpenAI“宮斗”大戲

最近GPT商店正式上線，AI玩家們又熱鬧了起來，鉆研著怎么做個GPT上架賺錢。

自從ChatGPT引爆大模型熱潮，2023年，在全球范圍內，生成式AI技術的突破和應用不斷刷新著我們的認知。從大型語言模型的迭代升級到多模態AI、Agent的興起，再到AI在各個行業的深入融合，AI領域的競爭愈發激烈。

在國內，各大科技公司紛紛推出自家的AI產品，掀起“百模大戰”，眾多AI創業者開始“卷”AI創新應用，政策層面也逐步完善對AI技術的監管和引導。

（制圖：NUPD）

“頭號AI玩家”按時間整理了2023年AI行業大事件，并從中選出十大熱門事件，在下文展開回顧。以OpenAI為代表的海外AI玩家正引領著AI技術的前沿發展，國內這些內容平臺的AI功能雖然在應用范圍和討論熱度上不及頭部產品，但考慮到平臺的用戶規模和在國內的影響力，這些依然是值得注意的嘗試。

AI行業日新月異，隨著AI技術的不斷成熟，我們將看到更多AI原生的應用玩法，AI也將更加深入地融入我們的日常生活，從工作助手到生活伙伴，從內容創作到決策支持，AI會逐步成為推動社會進步和創新的重要力量。

01
史上最強大模型GPT-4登場

2023年3月15日，OpenAI發布大型多模態模型GPT-4，可以接收圖像和文本輸入，輸出文本，雖然它在許多現實世界場景中的能力不如人類，但在各種專業和學術基準上與人類水平相當。

GPT-4博客地址：https://openai.com/research/gpt-4
GPT-4技術報告地址：https://cdn.openai.com/papers/gpt-4.pdf

相比上一代GPT-3.5，GPT-4擁有更廣的知識面和更強的解決問題能力，在創意、視覺輸入和長內容上的表現也都更好了。

GPT-4能理解梗圖

GPT-4能根據草圖快速生成網頁HTML代碼

如今GPT-4仍然是業內領先的、最受矚目的大模型，不過需要訂閱ChatGPT Plus或通過API訪問，也可以通過微軟Copilot免費體驗。

附OpenAI重要發布時間線：

2022年11月，OpenAI悄然發布GPT-3.5，ChatGPT隨之推出
2023年2月，ChatGPT Plus訂閱計劃推出，每月20美元起
2023年3月，ChatGPT API、GPT-4、ChatGPT插件先后發布
2023年5月，免費的ChatGPT iOS應用程序上線，支持語音輸入
2023年7月，ChatGPT新增“自定義指令”功能，安卓版ChatGPT上線
2023年8月，ChatGPT Enterprise推出
2023年9月，OpenAI發布DALL-E 3，并將其集成至ChatGPT
2023年11月，OpenAI在DevDay上發布GPT Builder、GPT-4 Turbo、Assistants API等更新

02
百度發布文心一言，打響“百模大戰”

隨著ChatGPT的一鳴驚人，互聯網大廠、科研機構、AI創業公司等國內玩家紛紛上場，開啟了“百模大戰”。

2023年2月7日，百度宣布在籌備大模型新項目——文心一言（英文名ERNIE Bot），到了3月16日，文心一言開放測試，展示了在文學創作、商業文案創作、數理推算、中文理解和多模態生成五個場景中的表現，打響了國內大模型競賽的第一槍。

文心一言官網

其基礎模型文心大模型在10月升級到4.0版本，同時，百度發布了全線重構的新搜索、新地圖等十余款AI原生應用。截至2023年12月底，文心一言的用戶規模已突破1億。

百度創始人、董事長兼首席執行官李彥宏被《時代》周刊評為“全球AI領袖”，他預言：“我們即將進入一個AI原生的時代。”在12月16日舉辦的極客公園創新大會2024上，他再次強調“卷AI原生應用才有價值，大模型進展對大多數人不是機會”。

03
AI孫燕姿席卷華語樂壇

2023年5月，“AI孫燕姿”驚艷出道，網友用AI音色轉換技術Sovits4.0（全稱So-vits-svc）訓練復刻了她的嗓音，翻唱起周杰倫的《發如雪》、云南山歌《朝你大垮捏一把》等歌曲，B站相關視頻播放量累計超千萬。

不過，這類合成的AI歌手存在侵犯版權的風險，比如未經授權使用他人的聲音素材訓練生成AI音頻并發布，涉嫌構成著作權侵權。

孫燕姿本人的回應將事件推向新的高潮，她說：“你跟一個每幾分鐘就推出一張新專輯的人還有什么好爭的。”

她認為，AI聳現并將威脅到成千上萬個由人類創造的工作，包括唱歌，“諷刺的是，人類無法超越它已指日可待”，“你并不特別，你已經是可預測的，而且不幸你也是可定制的”。

從積極的角度看，生成式AI的發展使AI音樂制作和翻唱的門檻進一步降低，平臺也開始與創作者擁抱AI，將AI音樂規范化，比如YouTube和Charlie Puth、Troye Sivan等歌手合作測試Dream Track功能，可以模仿歌手風格生成音樂片段。

04
妙鴨相機爆火，AI寫真產品興起

2023年7月17日，妙鴨相機小程序正式上線，迅速在朋友圈刷屏。

用戶只要上傳一定數量的照片，選擇好模版，就可以一鍵生成AI風格化寫真，包括證件照、藝術照等。雖然首次生成需要支付9.9元的數字分身制作費，但爆火初期仍有上千人深夜排隊等待生成。

妙鴨相機出自阿里大文娛團隊，阿里內部評價它為“國內AIGC領域第一個爆火的C端產品”。此后國內涌現出諸多同類AI寫真產品，B612咔嘰、美圖秀秀、輕顏相機等APP也有類似的AI寫真/頭像功能。

這類工具型產品要面臨的難題是如何在競爭中維持住熱度，持續吸引更多的用戶。妙鴨相機在之后幾個月內不斷上新寫真模板，其中一部分與品牌合作聯名，此外還推出了發型設計、AI修臉、拍合照的新功能，并和阿里系其他業務進行聯動，比如冠名綜藝《這就是街舞6》。

05
《生成式人工智能服務管理暫行辦法》公布

過去一年，“狂飆”的AIGC產業迎來了國家級規范性政策。

2023年4月11日，國家網信辦就《生成式人工智能服務管理辦法（征求意見稿）》公開征求意見，我們在第一時間進行了重點解讀。7月，《生成式人工智能服務管理暫行辦法》（以下簡稱《辦法》）公布，自8月15日起施行。

《辦法》提出國家堅持發展和安全并重、促進創新和依法治理相結合的原則，采取有效措施鼓勵生成式人工智能創新發展，對生成式人工智能服務實行包容審慎和分類分級監管。

對于生成式AI領域的監管問題，全球各國都處于探索之中。《辦法》是中國立法者的一次先行“試水”，為后續更為全面、細致的立法工作做了鋪墊。目前人工智能法已被列入我國2023年立法計劃，這意味著未來AI統一監管立法已提上日程。

06
更聰明的AI畫圖神器：DALL·E 3+ChatGPT

DALL·E 3是OpenAI在2023年9月推出的AI繪圖模型，原生構建在ChatGPT之上，用戶可以在對話中將自己的想法轉化成準確的圖像，甚至還能畫出正確的文字。

用戶問ChatGPT“我5歲的孩子說的超級向日葵刺猬，它應該長什么樣子”，ChatGPT立馬寫了四段不同風格的提示詞，并生成對應圖像

對于不擅長寫提示詞的普通玩家來說，這一改進大大降低了AI繪畫門檻。

與Midjourney相比，DALL·E 3的交互式繪圖比較直觀方便，能直接讀懂大段文字自動作圖。而且與OpenAI深度合作的微軟已將DALL·E 3集成在Bing（現為Copilot）中，可以免費使用。

07
微軟AI助手Copilot全面集成至Win11

作為OpenAI最重要的投資方，微軟率先將GPT-4引入搜索引擎，從2023年9月26日開始，微軟重磅發布全球版智能副駕Copilot，將作為Windows 11免費更新的一部分推出，并陸續擴展到必應、Edge瀏覽器以及微軟365 Copilot中。

在11月的Ignite全球技術大會上，微軟又將Bing Chat升級更名為Copilot，允許所有用戶創建類似于GPTs的AI助手。

全新的Copilot，用微軟賬戶登錄即可免費體驗：https://copilot.microsoft.com/

Copilot Studio作為一個低代碼工具，支持在同一網頁中構建、部署、分析和管理所有內容，可以讓用戶創建自定義Copilot，或集成定制版的GPT、生成式AI插件和主題等，包括GPTs的功能。

2024年，微軟還將在鍵盤上新增Copilot鍵，一鍵調用AI助手，也許未來每個人都可以擁有自己的AI電腦。

08
Sam Altman的“離職”風波

從被蘋果掃地出門到王者歸來，喬布斯花了12年時間。而AI時代的“喬布斯”只用了4天。

美國時間2023年11月17日午間，OpenAI突然宣布領導層換屆，首席執行官Sam Altman被開除了，因為他“在與董事會的溝通中始終不坦誠，阻礙了董事會履行職責的能力”。

消息一出，震驚整個AI圈。這場鬧劇之后經歷了幾次反轉，上一秒Sam Altman回到公司談判，似乎有望重返OpenAI，下一秒微軟就宣布Sam Altman及其同事將加入微軟，領導一個新的AI研究團隊。最終Sam Altman還是在眾多同事的支持和微軟的推動下回來了，董事會成員大換血，新增一名無投票權的觀察員——微軟副總裁Dee Templeton。

目前這場高層震蕩的起因依舊眾說紛紜，不過OpenAI的發展已回到正軌，正式發布GPT商店，不斷構建AI商業生態。

09
Pika 1.0發布，AI視頻元年來了

2023年11月28日，AI視頻生成產品Pika 1.0發布，官宣推文瀏覽量1天內就破了一千萬。

Pika內測版支持輸入文字或圖像來生成各種風格的視頻，此次Pika 1.0新增局部實時重繪、擴展視頻尺寸等功能，效果不輸Runway Gen2，甚至在易用性、3D動畫生成上更勝一籌。

我們也嘗試用ChatGPT、Pika等AI生成工具創作了一條圣誕動畫，對于沒有專業學習過動畫制作的愛好者來說，現在AI可以幫助實現7、8成的故事腳本了。
Pika一夜爆火，而令人驚訝的是其團隊只有4個人，創立6個月就在Discord上吸引了50萬用戶，公司估值超2億美元。

目前AI視頻生成領域的動作進展較快，不乏新玩家入局，除了Pika，還有Meta發布了Emu Video，Stability AI發布了首個AI視頻開源模型SVD，Midjourney也即將發布視頻生成模型。

10
《紐約時報》起訴微軟和OpenAI侵權

這或許是OpenAI史上最難的AI版權訴訟。

2023年12月底，《紐約時報》因版權侵權起訴微軟和OpenAI，220000頁附件，羅列了多達100個鐵證，證明ChatGPT輸出的內容與他們的新聞內容幾乎一模一樣。

左邊為GPT4的輸出，右邊為《紐約時報》的新聞

為此，《紐約時報》要求OpenAI和微軟銷毀侵權材料的模型和訓練數據，并對非法復制和使用《紐約時報》獨有價值的作品造成的“數十億美元的法定和實際損失”負責。

OpenAI發布公告回應稱，公司使用公開的互聯網材料訓練人工智能模型是合理的，OpenAI已提供了退出的選擇。并指出，《紐約時報》沒有講述完整的事實，暗示AI“抄襲”原文的情況是故意操縱提示詞，讓模型“反芻”（Regurgitation）的結果。

AI模型和訓練數據的版權之爭頗受關注，此次訴訟或將成為影響AIGC領域走向的重大事件。

結語

通過以上精選的重要事件，我們回顧了2023年AI行業的蓬勃發展，我們有理由相信，2024年將有更多激動人心的技術創新和應用落地。

“至少在未來的五年或十年內，這項技術將處于一個非常陡峭的成長曲線上。現有這些模型都將變成最愚蠢的模型。”正如Sam Altman最近在訪談中所說的，多模態、可定制性和個性化很重要，AI還可以做更多復雜的事情，真正提升生產力。

AI將繼續在內容創作、醫療健康、教育等多個領域發揮其潛力，同時，隨著AI技術的不斷進步，我們也將面臨新的挑戰，包括倫理、隱私和安全等問題，我們需要盡快適應并確保讓技術的力量服務于全人類。

作者公眾號：頭號AI玩家（ID：AIGCplayer）

本文系作者授權數英發表，內容為作者獨立觀點，不代表數英立場。
未經授權嚴禁轉載，授權事宜請聯系作者本人，侵權必究。

掃描,分享朋友圈

收藏 21

全部評論（1條）

更多評論

發布者

吃便當

創意/設計

近期精選文章更多

猜您可能喜歡

带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度