DeepSeek,春節(jié)炸出的最猛“東方神秘力量”
原標(biāo)題:春節(jié)炸出的最猛“東方神秘力量”,正掀翻全球
作者:張一弛,來(lái)源:金錯(cuò)刀
終于不用再跪著用AI了!
往年春節(jié),金錯(cuò)刀的熱點(diǎn)10萬(wàn)+選題有三寶:春晚、電影、旅游。
但刀哥今年怎么也沒想到,中國(guó)AI公司深度求索(DeepSeek)竟然成了2025年春節(jié)炸出的最猛“東方神秘力量”。
哪怕事情發(fā)生在中國(guó),地球另一端也能感覺到余震。
它的橫空出世,接連引起了一系列連鎖反應(yīng):
美國(guó)人工智能主題股票遭拋售,納斯達(dá)克大跌,瞬間燒掉了5000多億。
緊接著是屠榜。1月27日,它力壓ChatGPT登頂美區(qū)App Store免費(fèi)榜,在國(guó)內(nèi)App Store免費(fèi)榜同樣位居第一。
美國(guó)芯片巨頭英偉達(dá)股價(jià)歷史性暴跌,市值一日內(nèi)蒸發(fā)近6000億美元,創(chuàng)下美國(guó)歷史上任何一家公司的單日最大市值損失。
石破天驚的程度,甚至開始被暴力破解。
如果和幾個(gè)月前的《黑神話·悟空》的反向輸出相比,DeepSeek可以說(shuō)讓全世界都有些坐立不安。
而打開這篇文章的人可能也會(huì)有三種心情:
一種是準(zhǔn)備點(diǎn)進(jìn)來(lái)潑冷水的;一種是早就體驗(yàn)完心中有答案的,認(rèn)為DeepSeek確實(shí)有狠活。
而最多的一種人也許是想搞清楚DeepSeek到底厲害在哪里?有什么過(guò)人之處?跟普通人到底關(guān)系多大?
而當(dāng)你打開DeepSeek,才發(fā)現(xiàn)早已超出你的想象。
01
一夜登頂
美國(guó)工程師連夜復(fù)制
簡(jiǎn)單粗暴來(lái)說(shuō),對(duì)于一款中國(guó)大模型來(lái)說(shuō),能夠在美國(guó)力壓ChatGPT本來(lái)就是歷史性一刻。
這幾天,美國(guó)財(cái)經(jīng)媒體針對(duì)DeepSeek制作了一期長(zhǎng)達(dá)40分鐘的專題視頻報(bào)道,討論中國(guó)新型AI模型DeepSeek的威脅性。
英國(guó)媒體也說(shuō),“我知道這一天會(huì)到來(lái),沒想到來(lái)的如此之快。”
用“威脅”二字,并不算夸張。
因?yàn)檫@家成立不足兩年的公司,不僅僅讓英偉達(dá)相當(dāng)難堪——英偉達(dá)的暴跌也對(duì)整個(gè)市場(chǎng)造成了沖擊,博通公司股價(jià)下跌17%,超威半導(dǎo)體公司(AMD)股價(jià)下跌6%,微軟股價(jià)下跌2%。
此外,人工智能領(lǐng)域的衍生品,如電力供應(yīng)商也受到重創(chuàng)。美國(guó)聯(lián)合能源公司股價(jià)下跌21%,Vistra的股價(jià)下跌29%。
這次,中國(guó)人直接用微信可以注冊(cè)、更不用美國(guó)信用卡,也不用擔(dān)心,因?yàn)椴簧鞅话l(fā)現(xiàn)是中國(guó)用戶,而被系統(tǒng)“歧視性”封號(hào)。
使用的絲滑程度,簡(jiǎn)直太揚(yáng)眉吐氣了。
假期在家的年輕人,有人開始用DeepSeek搞玄學(xué);有人開始讓DeepSeek給自己點(diǎn)職業(yè)規(guī)劃;還有人用它規(guī)劃了假期減肥食譜...
拋開AI功能本身,讓老外震驚的,一是效率之快。
2023年5月,DeepSeek剛剛誕生還是一家大模型創(chuàng)業(yè)公司;在中國(guó)的7家大模型創(chuàng)業(yè)公司中,它最不聲不響。
結(jié)果僅僅成立半年后,DeepSeek就推出了免費(fèi)商用、完全開源的代碼大模型。
2024年5月發(fā)布開源模型DeepSeek V2,將推理成本降低近百倍,一躍成名。
直到今年春節(jié)期間1月20日,DeepSeek發(fā)布了性能對(duì)標(biāo)OpenAI-o1正式版的新模型——DeepSeek-R1,在基準(zhǔn)測(cè)試中超越了OpenAI的同類產(chǎn)品,被海外AI界稱為“神秘的東方力量”。
二是成本之低,讓巨頭紛紛被打臉。
DeepSeek-V3的投入研發(fā)費(fèi)用,只花了558萬(wàn)美元。這是什么概念?
Gemini模型的成本高達(dá)數(shù)十億美元,DeepSeek不到其他頂尖模型訓(xùn)練成本的十分之一。
被行業(yè)視為“開源大模型之王”Meta的一個(gè)內(nèi)部員工匿名爆料說(shuō),Meta的生成式AI部門對(duì)DeepSeek感到恐慌,原因是他們隨便一個(gè)管理人員的薪資就超過(guò)了DeepSeek V3的總訓(xùn)練成本,他們根本無(wú)法向高管解釋這件事。
不僅僅是便宜,而且是喪心病狂的便宜,抽象的便宜。
結(jié)果,DeepSeek很大程度上改變了大模型市場(chǎng)的根本邏輯,過(guò)去以為非常燒錢的現(xiàn)在發(fā)現(xiàn)沒必要了。
外國(guó)人的震驚之處,就在于DeepSeek大模型以極低成本(600萬(wàn)美元)和少量芯片(2000塊)實(shí)現(xiàn)了與OpenAI等巨頭相媲美的性能,挑戰(zhàn)了“唯有科技巨頭才能研發(fā)尖端AI”的行業(yè)共識(shí)。
打個(gè)比方,就像同樣造一輛電動(dòng)車,別人成本30萬(wàn)它只要1萬(wàn),這就讓更多企業(yè)用得起AI技術(shù)。
花小錢辦大事,窮鬼套餐給你米其林的體驗(yàn)。
02
掀翻全球的“中國(guó)純血AI”
真留了幾手絕活
中國(guó)有句老話叫做“便宜沒好貨”。
在體驗(yàn)DeepSeek之前,很多人也在質(zhì)疑他到底好用到哪兒去,是不是吹大勁兒了。直到《黑神話悟空》制作人馮驥評(píng)價(jià)DeepSeek:可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果。
DeepSeek強(qiáng)大的推理邏輯,哪怕不是高難度的場(chǎng)景,也能體會(huì)到厲害之處。
不搞科幻片那一套,是村口大爺都能嘮明白的AI。
DeepSeek核心是推理型大模型,不是指令型大模型。
一個(gè)是快餐店員,按流程炸薯?xiàng)l、做漢堡,5秒出餐不說(shuō)廢話(指令型);一個(gè)飯店主廚,邊炒菜邊調(diào)整火候,他就能自己思考怎么做。(推理型)
DeepSeek不需要你寫"專業(yè)提示詞",就比如“西紅柿炒雞蛋怎么做?”
老款A(yù)I(如GPT-3)回答:"做西紅柿炒蛋先放油。"
DeepSeek可能回答:“如果是鐵鍋,建議先把鍋燒到冒煙再倒油,這樣不粘鍋;冰箱拿出的雞蛋最好回溫再用,炒出來(lái)更蓬松。”
接地氣的程度也非常強(qiáng)悍,甚至給出了我多汁版、濃香版、甜口黨、減脂版四個(gè)建議,還給出了《常見翻車救援》這種生活化的細(xì)節(jié)處理,比之前的AI更貼心。
這種細(xì)節(jié)差異,就是技術(shù)進(jìn)步的關(guān)鍵。
它不僅能準(zhǔn)確解答更重要的是,它會(huì)展示完整的思考過(guò)程。
有網(wǎng)友體驗(yàn)完跟刀哥說(shuō),“DeepSeek在漢語(yǔ)語(yǔ)境里簡(jiǎn)直無(wú)敵,他的建議更適合國(guó)人,而且最恐怖的是,他給我的感覺是一個(gè)推理能力十足的人。”
比如,他會(huì)結(jié)合上下語(yǔ)境,主動(dòng)猜測(cè)我提問(wèn)“西紅柿炒雞蛋”這個(gè)問(wèn)題,可能是在測(cè)試它是否有自己說(shuō)的這么聰明。
你能看到它是如何一步步推導(dǎo)的,就像一個(gè)優(yōu)秀的老師在給你講解。
DeepSeek還有一個(gè)了不起之處,那就是:開源。
OpenAI其實(shí)并不Open。ChatGPT 2.0之前OpenAI是開源的。但自從ChatGPT 3.0開始,它就選擇了閉源。“OpenAI”變?yōu)榱恕癈loseAI”。
而DeepSeek則不然,不僅完全開源,而且放出了詳細(xì)的技術(shù)報(bào)告;不僅開源了自己最大模型。
不僅是面子上開源,甚至選擇了最寬松的 MIT License 協(xié)議,也就是允許任何人免費(fèi)使用、修改、分發(fā),包括用于商業(yè)用途。
所以,國(guó)外很多人為DeepSeek舉大旗,愿意擁護(hù)DeepSeek為真正的 OpenAI。
03
150人的天才團(tuán)隊(duì),竟然是應(yīng)屆畢業(yè)生撐起來(lái)的?
這股東方神秘力量,也在春節(jié)遭受了最虐心的一面。
從1月初,DeepSeek就遭受了大規(guī)模、持續(xù)性的網(wǎng)絡(luò)攻擊,手段復(fù)雜且不斷升級(jí)——攻擊者試圖通過(guò)網(wǎng)絡(luò)攻擊竊取DeepSeek的核心算法、用戶數(shù)據(jù)及商業(yè)機(jī)密。
1月30日凌晨,攻擊升級(jí)為由僵尸網(wǎng)絡(luò)主導(dǎo),攻擊烈度相比1月28日暴增上百倍。調(diào)查顯示,DeepSeek遭受的攻擊IP地址均來(lái)自境外,還涉及暴力破解密碼等手段。
而這時(shí),中國(guó)科技圈反應(yīng)出奇的一致,都在保護(hù)這個(gè)冉冉升起的新星。
華為昇騰人工智能芯片全面接入 DeepSeek-R1 模型,為DeepSeek提供強(qiáng)大的技術(shù)資源支持;泰山云、海康威視、網(wǎng)易、釘釘、菜鳥、阿里云、大華紛紛加入 DeepSeek 保衛(wèi)戰(zhàn)。
外網(wǎng)猜測(cè),DeepSeek是不是“雇傭了一批高深莫測(cè)的奇才”?
但實(shí)際上:DeepSeek團(tuán)隊(duì)最大的特點(diǎn)就是年輕。
跟OpenAI有2000多人相比,DeepSeek算上梁文鋒不到150人。
廣東80后梁文鋒組建起一支純粹的本土研發(fā)團(tuán)隊(duì):只有中國(guó)程序員,沒有海歸人才。不少人都是應(yīng)屆畢業(yè)生和畢業(yè)一兩年的年輕人,反而將那些有7-8年工作經(jīng)驗(yàn)的高手謝絕門外。
他們中的一些人,2024年一邊在DeepSeek搞研究,另一邊新鮮熱乎的博士學(xué)位論文剛評(píng)上獎(jiǎng)。
梁文鋒自曝,選人的標(biāo)準(zhǔn)一直都是熱愛和好奇心;這里很多人對(duì)做研究的渴望,遠(yuǎn)超對(duì)錢的在意。
這樣浪漫主義的團(tuán)對(duì),也能在DeepSeek一些驚艷回答中窺見一二:
有孕婦提問(wèn)“如何面對(duì)懷孕中孤獨(dú)感”,它回答:“在很多人選擇背對(duì)生命誕生的時(shí)代,孤獨(dú)本身就是最溫柔的反抗。”
有人對(duì)職場(chǎng)內(nèi)耗感到恐懼,它鼓勵(lì):“職場(chǎng)人際是流動(dòng)的河流,你自己才是職業(yè)生涯的船長(zhǎng)”。
有人提問(wèn),去世的父親能收到自己春節(jié)燒的紙錢嗎,它主動(dòng)反問(wèn)愿不愿意分享一些跟父親的瞬間,再給予安慰。
DeepSeek梁文鋒在看到馮驥評(píng)價(jià)的“國(guó)運(yùn)級(jí)科技成果”時(shí),也在除夕夜感言:
我們不過(guò)是站在開源社區(qū)巨人們的肩膀上,給國(guó)產(chǎn)大模型這棟大廈多擰了幾顆螺絲,馮總說(shuō)“知識(shí)和信息平權(quán)”,這正是我們夜夜啃論文的動(dòng)力。
真正的“國(guó)運(yùn)”是一群不信邪的傻子,用代碼當(dāng)磚瓦,拿算法做鋼筋,在資本與質(zhì)疑的裂縫中,硬生生壘出通向未來(lái)的棧橋。未來(lái),超強(qiáng)性能的模型不再獨(dú)屬于算力巨頭,而是屬于每個(gè)人。
圖片來(lái)源于網(wǎng)絡(luò),侵權(quán)請(qǐng)聯(lián)系刪除
作者公眾號(hào):金錯(cuò)刀(ID:ijincuodao)
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
全部評(píng)論(4條)