DeepSeek，春節炸出的最猛“東方神秘力量”

轉載贊25 收藏1 評論4

舉報 2025-02-06

掃描,分享朋友圈

原標題：春節炸出的最猛“東方神秘力量”，正掀翻全球
作者：張一弛，來源：金錯刀

終于不用再跪著用AI了！

往年春節，金錯刀的熱點10萬+選題有三寶：春晚、電影、旅游。

但刀哥今年怎么也沒想到，中國AI公司深度求索（DeepSeek）竟然成了2025年春節炸出的最猛“東方神秘力量”。

哪怕事情發生在中國，地球另一端也能感覺到余震。

它的橫空出世，接連引起了一系列連鎖反應：

美國人工智能主題股票遭拋售，納斯達克大跌，瞬間燒掉了5000多億。

緊接著是屠榜。1月27日，它力壓ChatGPT登頂美區App Store免費榜，在國內App Store免費榜同樣位居第一。

美國芯片巨頭英偉達股價歷史性暴跌，市值一日內蒸發近6000億美元，創下美國歷史上任何一家公司的單日最大市值損失。

石破天驚的程度，甚至開始被暴力破解。

如果和幾個月前的《黑神話·悟空》的反向輸出相比，DeepSeek可以說讓全世界都有些坐立不安。

而打開這篇文章的人可能也會有三種心情：

一種是準備點進來潑冷水的；一種是早就體驗完心中有答案的，認為DeepSeek確實有狠活。

而最多的一種人也許是想搞清楚DeepSeek到底厲害在哪里？有什么過人之處？跟普通人到底關系多大？

而當你打開DeepSeek，才發現早已超出你的想象。

01
一夜登頂
美國工程師連夜復制

簡單粗暴來說，對于一款中國大模型來說，能夠在美國力壓ChatGPT本來就是歷史性一刻。

這幾天，美國財經媒體針對DeepSeek制作了一期長達40分鐘的專題視頻報道，討論中國新型AI模型DeepSeek的威脅性。

英國媒體也說，“我知道這一天會到來，沒想到來的如此之快。”

用“威脅”二字，并不算夸張。

因為這家成立不足兩年的公司，不僅僅讓英偉達相當難堪——英偉達的暴跌也對整個市場造成了沖擊，博通公司股價下跌17%，超威半導體公司（AMD）股價下跌6%，微軟股價下跌2%。

此外，人工智能領域的衍生品，如電力供應商也受到重創。美國聯合能源公司股價下跌21%，Vistra的股價下跌29%。

這次，中國人直接用微信可以注冊、更不用美國信用卡，也不用擔心，因為不慎被發現是中國用戶，而被系統“歧視性”封號。

使用的絲滑程度，簡直太揚眉吐氣了。

假期在家的年輕人，有人開始用DeepSeek搞玄學；有人開始讓DeepSeek給自己點職業規劃；還有人用它規劃了假期減肥食譜...

拋開AI功能本身，讓老外震驚的，一是效率之快。

2023年5月，DeepSeek剛剛誕生還是一家大模型創業公司；在中國的7家大模型創業公司中，它最不聲不響。

結果僅僅成立半年后，DeepSeek就推出了免費商用、完全開源的代碼大模型。

2024年5月發布開源模型DeepSeek V2，將推理成本降低近百倍，一躍成名。

直到今年春節期間1月20日，DeepSeek發布了性能對標OpenAI-o1正式版的新模型——DeepSeek-R1，在基準測試中超越了OpenAI的同類產品，被海外AI界稱為“神秘的東方力量”。

二是成本之低，讓巨頭紛紛被打臉。

DeepSeek-V3的投入研發費用，只花了558萬美元。這是什么概念？

Gemini模型的成本高達數十億美元，DeepSeek不到其他頂尖模型訓練成本的十分之一。

被行業視為“開源大模型之王”Meta的一個內部員工匿名爆料說，Meta的生成式AI部門對DeepSeek感到恐慌，原因是他們隨便一個管理人員的薪資就超過了DeepSeek V3的總訓練成本，他們根本無法向高管解釋這件事。

不僅僅是便宜，而且是喪心病狂的便宜，抽象的便宜。

結果，DeepSeek很大程度上改變了大模型市場的根本邏輯，過去以為非常燒錢的現在發現沒必要了。

外國人的震驚之處，就在于DeepSeek大模型以極低成本（600萬美元）和少量芯片（2000塊）實現了與OpenAI等巨頭相媲美的性能，挑戰了“唯有科技巨頭才能研發尖端AI”的行業共識。

打個比方，就像同樣造一輛電動車，別人成本30萬它只要1萬，這就讓更多企業用得起AI技術。

花小錢辦大事，窮鬼套餐給你米其林的體驗。

02
掀翻全球的“中國純血AI”
真留了幾手絕活

中國有句老話叫做“便宜沒好貨”。

在體驗DeepSeek之前，很多人也在質疑他到底好用到哪兒去，是不是吹大勁兒了。直到《黑神話悟空》制作人馮驥評價DeepSeek：可能是個國運級別的科技成果。

DeepSeek強大的推理邏輯，哪怕不是高難度的場景，也能體會到厲害之處。

不搞科幻片那一套，是村口大爺都能嘮明白的AI。

DeepSeek核心是推理型大模型，不是指令型大模型。

一個是快餐店員，按流程炸薯條、做漢堡，5秒出餐不說廢話（指令型）；一個飯店主廚，邊炒菜邊調整火候，他就能自己思考怎么做。（推理型）

DeepSeek不需要你寫"專業提示詞"，就比如“西紅柿炒雞蛋怎么做？”

老款AI（如GPT-3）回答："做西紅柿炒蛋先放油。"

DeepSeek可能回答：“如果是鐵鍋，建議先把鍋燒到冒煙再倒油，這樣不粘鍋；冰箱拿出的雞蛋最好回溫再用，炒出來更蓬松。”

接地氣的程度也非常強悍，甚至給出了我多汁版、濃香版、甜口黨、減脂版四個建議，還給出了《常見翻車救援》這種生活化的細節處理，比之前的AI更貼心。

這種細節差異，就是技術進步的關鍵。

它不僅能準確解答更重要的是，它會展示完整的思考過程。

有網友體驗完跟刀哥說，“DeepSeek在漢語語境里簡直無敵，他的建議更適合國人，而且最恐怖的是，他給我的感覺是一個推理能力十足的人。”

比如，他會結合上下語境，主動猜測我提問“西紅柿炒雞蛋”這個問題，可能是在測試它是否有自己說的這么聰明。

你能看到它是如何一步步推導的，就像一個優秀的老師在給你講解。

DeepSeek還有一個了不起之處，那就是：開源。

OpenAI其實并不Open。ChatGPT 2.0之前OpenAI是開源的。但自從ChatGPT 3.0開始，它就選擇了閉源。“OpenAI”變為了“CloseAI”。

而DeepSeek則不然，不僅完全開源，而且放出了詳細的技術報告；不僅開源了自己最大模型。

不僅是面子上開源，甚至選擇了最寬松的 MIT License 協議，也就是允許任何人免費使用、修改、分發，包括用于商業用途。

所以，國外很多人為DeepSeek舉大旗，愿意擁護DeepSeek為真正的 OpenAI。

03
150人的天才團隊，竟然是應屆畢業生撐起來的？

這股東方神秘力量，也在春節遭受了最虐心的一面。

從1月初，DeepSeek就遭受了大規模、持續性的網絡攻擊，手段復雜且不斷升級——攻擊者試圖通過網絡攻擊竊取DeepSeek的核心算法、用戶數據及商業機密。

1月30日凌晨，攻擊升級為由僵尸網絡主導，攻擊烈度相比1月28日暴增上百倍。調查顯示，DeepSeek遭受的攻擊IP地址均來自境外，還涉及暴力破解密碼等手段。

而這時，中國科技圈反應出奇的一致，都在保護這個冉冉升起的新星。

華為昇騰人工智能芯片全面接入 DeepSeek-R1 模型，為DeepSeek提供強大的技術資源支持；泰山云、海康威視、網易、釘釘、菜鳥、阿里云、大華紛紛加入 DeepSeek 保衛戰。

外網猜測，DeepSeek是不是“雇傭了一批高深莫測的奇才”？

但實際上：DeepSeek團隊最大的特點就是年輕。

跟OpenAI有2000多人相比，DeepSeek算上梁文鋒不到150人。

廣東80后梁文鋒組建起一支純粹的本土研發團隊：只有中國程序員，沒有海歸人才。不少人都是應屆畢業生和畢業一兩年的年輕人，反而將那些有7-8年工作經驗的高手謝絕門外。

他們中的一些人，2024年一邊在DeepSeek搞研究，另一邊新鮮熱乎的博士學位論文剛評上獎。

梁文鋒自曝，選人的標準一直都是熱愛和好奇心；這里很多人對做研究的渴望，遠超對錢的在意。

這樣浪漫主義的團對，也能在DeepSeek一些驚艷回答中窺見一二：

有孕婦提問“如何面對懷孕中孤獨感”，它回答：“在很多人選擇背對生命誕生的時代，孤獨本身就是最溫柔的反抗。”

有人對職場內耗感到恐懼，它鼓勵：“職場人際是流動的河流，你自己才是職業生涯的船長”。

有人提問，去世的父親能收到自己春節燒的紙錢嗎，它主動反問愿不愿意分享一些跟父親的瞬間，再給予安慰。

DeepSeek梁文鋒在看到馮驥評價的“國運級科技成果”時，也在除夕夜感言：

我們不過是站在開源社區巨人們的肩膀上，給國產大模型這棟大廈多擰了幾顆螺絲，馮總說“知識和信息平權”，這正是我們夜夜啃論文的動力。

真正的“國運”是一群不信邪的傻子，用代碼當磚瓦，拿算法做鋼筋，在資本與質疑的裂縫中，硬生生壘出通向未來的棧橋。
未來，超強性能的模型不再獨屬于算力巨頭，而是屬于每個人。

圖片來源于網絡，侵權請聯系刪除

作者公眾號：金錯刀（ID:ijincuodao）

本文系作者授權數英發表，內容為作者獨立觀點，不代表數英立場。
未經授權嚴禁轉載，授權事宜請聯系作者本人，侵權必究。