新火種AI|秒殺GPT-4，狙殺GPT-5，橫空出世的Claude 3振奮人心！

原創(chuàng) 贊收藏評論

舉報 2024-03-06

掃描,分享朋友圈

點擊上方藍字“新火種”關(guān)注我們

作者：小巖

編輯：彩云

2024年第一季度才剛過半，AI領(lǐng)域就大動作不斷，大家卯著勁的出新品，可謂卷出天際。

3月4日，Anthropic發(fā)布了最新的Claude 3系列模型，用Anthropic的話說，Claude 3的出現(xiàn)意味著打開了一個全新的世界，其系列模型在推理，數(shù)學，編碼，多語言理解和視覺方面，都樹立了全新的行業(yè)新基準。

也正是因為Claude 3的出現(xiàn)，全球最強AI模型一夜易主，曾經(jīng)被認為不可一世的GPT-4被拉下神壇，Claude 3很可能對GPT-4實現(xiàn)全方位的碾壓。

Anthropic發(fā)布3個模型，全方位實現(xiàn)Claude 3的超強性能。

據(jù)悉，本次Anthropic共發(fā)布了三個模型，按照性能從低到高，分別是Claude 3 Haiku，Claude 3 Sonnet，以及Claude 3 Opus，并發(fā)布了一份長達42頁的技術(shù)報告。

值得一提的是，此次3個模型的命名是很有講究的。依照功能的從低到高，它名字的翻譯分別是緋句（Haiku），代表性價比之王；十四行詩（Sonnet），代表響應較快，是性能加強版；以及巨作（Opus），堪稱性能頂配。

由此可見，Claude 3 Opus在本系列中性能最強大。該模型已在多項AI系統(tǒng)常用評估標準中領(lǐng)先業(yè)界LLM，如本科級別專業(yè)知識（MMLU），研究生級別專家推理（GPQA），基礎(chǔ)數(shù)學（GSM8K）等。特別需要說明的是，Claude 3 Opus在處理復雜任務時，其理解和表達能力幾乎接近于人類，這意味著人類在AI領(lǐng)域又邁進了一大步。

通過將Claude 3系列模型與同類產(chǎn)品進行對比，我們可以看到，Claude 3 Opus模型性能完全能夠碾壓GPT-4，以及Gemini 1.0 Ultra；Claude 3 Sonnet在部分基準上，諸如GSM8K，MATH等方面超越了GPT-4；Claude 3 Haiku也可以與Gemini 1.0 Pro相抗衡。

擁有三大核心優(yōu)勢傍身，Claude 3前途無量。

總結(jié)Claude 3所具有的優(yōu)勢，主要有以下三點：

性能無短板，擅長長文本優(yōu)化，顯著降低拒絕率。

先來說說性能方面。Claude 3的大語言模型全面趕超了GPT-4，多模態(tài)視覺任務處理性能力優(yōu)秀，在回答復雜開放性問題時的準確率也翻倍提升。特別是當用戶直接上傳數(shù)學，物理這一類考驗邏輯和準確度的理科題照片，或者細節(jié)豐富的圖表時，Claude 3所回復的解題水平和準確率相較于先前版本提高了很多，甚至在一些細節(jié)描述上比GPT- 4更勝一籌。在多模態(tài)能力方面，Claude 3模型可以從視覺上識別物體，能用復雜的方式思考，既能理解物體的外觀，也能理解它與數(shù)學等概念的聯(lián)系。

Anthropic AI研究工程師Emmanuel Ameisen就曬出了一個測試示例：向Opus輸入2小時13分鐘視頻原始文本，每隔5秒截取的屏幕截圖等圖文素材，它就能成功將其轉(zhuǎn)換成一篇圖文并茂的HTML格式博客文章。

在文本優(yōu)化方面，Claude 3也交出了一份令人滿意的答卷。要知道，先前的Claude 2.1版本常被吐槽長文本理解效果差，Claude 3便在這個方面做了重點改進，頂配Opus在200K tokens NIAH測試中準確率超過99%，展現(xiàn)了強大的召回能力（1K tokens相當于750個單詞）。

此外，Claude 3還顯著減少了拒絕回答問題的頻率。很多大語言模型會頻繁拒絕回答詢問，Claude 3則顯著改進了這一點，它能夠更明確的辨別真正的風險問題，減少無故拒絕回答安全詢問的情況。

“OpenAI叛軍”完美制衡住了GPT-4，未來的AI王者將鹿死誰手？

Anthropic用一記絕殺將GPT-4拉下了神壇，很多人覺得這是AI新秀的一次勝利。但如果你了解過Anthropic與OpenAI之間潛藏的錯綜復雜的關(guān)系的話，就會發(fā)現(xiàn)此次Claude 3的勝利，并非偶然。

Anthropic究竟是誰？有消息來源表示，Anthropic其實就是原OpenAI員工組建的公司，這些員工因為某些發(fā)展理念不合直接出走，并選擇“反叛”，最終成為了OpenAI的最強勁敵。

2021年，多名OpenAI員工不滿OpenAI在獲得微軟投資后走向封閉，憤而出走并聯(lián)合創(chuàng)立了Anthropic。他們對OpenAI在安全問題尚未解決的情況下就直接發(fā)布GPT-3的行為感到不滿，認為OpenAI已經(jīng)為追逐利益而“遺忘了初心”。

這一干出走的員工之中就包括打造出GPT-2和GPT-3的研究部門副總裁Dario Amodei。他在2016年進入OpenAI，離開前擔任研究副總裁，這絕對是OpenAI的核心位置。離開時，Dario還帶走了GPT-3首席工程師Tom Brown，以及擔任安全與策略部門副總監(jiān)的妹妹Daniela Amodei以及10多名心腹，可謂人才多多。這些人才，也最終成為了Anthropic的中流砥柱。

2023年1月，Claude開啟內(nèi)測，彼時很多網(wǎng)友在第一時間體驗了Claude，并表示它比當時的GPT-3強太多。

除了擁有諸多人才，Anthropic如今也獲得了強大的資本為其背書，截至目前，它已經(jīng)獲得了包括谷歌，亞馬遜云科技在內(nèi)的26個機構(gòu)或個人的融資，總計融資金額達到了76億美元。

毫無疑問的是，如今Anthropic的飛速發(fā)展和進步令業(yè)界十分振奮。這個僅誕生3年的大模型初創(chuàng)公司，不是手握頂級人才，更擁有了鈔能力和雄厚的計算資源。這說明OpenAI在大模型技術(shù)上的領(lǐng)先身位并非遙不可及。坐擁Top級創(chuàng)始成員和精兵強將的創(chuàng)業(yè)團隊，完全有能力做出與OpenAI風庭抗禮的產(chǎn)品，所消耗的人力，財力，算力資源卻只會更少。

Claude 3的橫空出世和巨大成功會給我們帶來一些啟發(fā)：或許，我們也是有機會和能力來做出超越GPT-4的產(chǎn)品的。

如果單論規(guī)模，Anthropic顯然不及OpenAI，但它依舊取得了巨大的成功。每每提起AI賽道，我們總會認為這個賽道就是要無止盡的燒錢，卷人才，卷技術(shù)。不過，相較于耗費了多大的成本去卷，怎么卷，朝哪個方向卷顯然是更重要的事情。畢竟，在AI領(lǐng)域，選擇永遠大于努力。

或許在不久的未來，OpenAI還會推出令人驚艷的GPT-5,但至少就目前而言，GPT不可戰(zhàn)勝的神話已經(jīng)破滅了。

本文系作者授權(quán)數(shù)英發(fā)表，內(nèi)容為作者獨立觀點，不代表數(shù)英立場。
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標注：作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。