超越OpenAI？國產推理模型的2025半年“狂飆時刻”

原創贊收藏評論

舉報 2025-05-22

掃描,分享朋友圈

文 | 智能相對論

作者 | 陳泊丞

今年年初，DeepSeek-R1以低成本、高性能以及開源特性在全球AI圈內爆火走紅，風頭一度壓過OpenAI，同時也開啟了國產推理模型持續“狂飆”時刻。

回顧過去的2025上半年，「智能相對論」統計發現，在DeepSeek之外，阿里、科大訊飛、小米、月之暗面、商湯科技等廠商都陸續宣告自家大模型對OpenAI系列模型產品的追趕或是超越。

智能相對論制圖

國產模型的加速“狂飆”有目共睹。OpenAI在今年4月一改口風，發布了o3/o4 mini模型，或許也有來自后來者追趕的壓力。但是，對于國產模型而言，比起性能上的追趕和超越，自我的發展節奏也在上半年逐漸形成，初見端倪。

國產模型的“彎道超車”

DeepSeek的走紅并非是其性能完全超越OpenAI，而是來自于低成本優勢和開源生態帶來的顛覆性體驗，使其迅速“破圈”，成為全球熱門AI模型。在過去的半年內，延續DeepSeek的破圈邏輯，國產模型似乎也瞄準了類似的路徑。

一、低成本突圍，用更少的算力追趕OpenAI的性能。

前不久，阿里千問3登頂全球最強開源模型，也在一定程度上完成了國產模型的破圈。成就這次現象的關鍵除了模型快速上線通義App之外，還有就是自身的高性能與低成本特性，其性能在超越OpenAI-o1與DeepSeek-R1的同時，部署成本大幅降低，僅需4張H20即可部署千問3滿血版，顯存占用僅為性能相近模型的三分之一。

盡管在性能上，國產模型很難跟OpenAI拉開太大的差距，但是在部署成本上的持續優化，從另一個角度真正意義上完成了對OpenAI的追趕。幾乎是同一時間，星火X1也完成升級，整體效果對標OpenAI-o1與DeepSeek-R1。而在算力成本上，星火X1不僅是業界唯一基于全國產算力訓練的深度推理模型，還成功實現了只需4張華為910B芯片即可完成部署，把國產模型的低成本特性再度“打爆”。

中美博弈態勢加劇，美國對華的算力管控越來越嚴格，從某種程度來說，這是一種無奈之舉，但同時也是一個強勢突圍的方向，依托低成本部署優勢，國產模型在AI普惠與行業應用中具備更強的適配性。若能繼續沿著這一方向突圍，國產模型的行業滲透率將在今年下半年繼續保持強勢增長。

二、開源生態破局，重新制定行業規則，打破技術霸權秩序。

DeepSeek-R1采用MIT協議，千問3采用Apache2.0協議，均是極寬松的開源協議，在OpenAI的閉源霸權之下，國產模型更熱衷于用開源策略來吸引全球開發者的目光，打造一個更廣泛的模型生態，從而制衡OpenAI的先發優勢與性能主義。這一策略正在被更多的國產模型所復刻，小米也開源了MiMo。

如今，中國的模型廠商在開源路徑上不斷走出自己的特色，不僅開放了不同參數規格的模型產品，還包括各種量化版本、完整的訓練數據集以及微調所需的數據模板等，滿足了不同場景下的實際需求，甚至是給到詳細的API設計和文檔，方便開發者快速集成和使用。

在開源上，國產模型表現出積極的態度。比起性能上的追趕，國產模型也正在試圖在開源與性能之間中找到一個平衡點，基于完善的服務和生態來實現模型的超越。值得一提的，DeepSeek-R1、千問3在HuggingFace等開源社區上均取得了開發者們不錯的反饋，整個千問系列的全球衍生模型更是超過10萬個，超越美國Llama位列第一，說明國產模型的開源策略正在被更多的全球開發者所認可。

三、特定能力強化，專為行業應用而打造，實用主義的國產屬性爆表。

現階段，國產模型對OpenAI的超越更多體現在特定的能力或任務處理上。日日新V6的多模態處理能力對標OpenAI-o1，同時迭代成為國內首個支持10分鐘中長視頻深度解析的大模型。

為什么要這么強化特定能力？商湯科技認為，比起文本性的內容消費，視頻、圖文結合是更大的內容消費市場。由此，日日新V6把語音、視頻、文字形成一個統一跟時間軸對齊的上下文表達，從而實現人機交互更自然、高效。這種做法更多是從實際的行業應用出發，日日新V6的能力強化正是為了具身智能的突破做準備。

這樣的做法類似于中國的古代智慧“田忌賽馬”，OpenAI-o1在結構化推理方面優勢顯著，而國產模型則在中文語境、多模態能力、成本效率上進行非對稱競爭，不去和OpenAI強勢的一面做對抗。同時，這也符合當前本土產業在AI應用過程中對模型能力的需求，順勢讓國產模型更快地進入企業級市場，加速商業化。

模型“狂飆”：OpenAI向左，國產向右

在今年上半年，OpenAI已經推出更強、更智能的o3和o4-mini模型。盡管在成本效率上無法達到國產模型的夸張水平，但OpenAI在上代相同的延遲和成本上實現了更強的性能體驗。

OpenAI對模型性能的追求依舊是業內標桿，作為最新的旗艦模型，o3和o4-mini（無工具版本）在AIME 2024數學競賽題目中的準確率分別達91.6%和93.4%，遠遠甩開o1的74.3%的成績。而在Codeforces編程競賽評分中，支持終端工具的o3和o4-mini也分別取得2706和2719的ELO分數，領先程度有目共睹，展現了其在數學和代碼能力上的巨大突破。

除此之外，OpenAI的新模型在知識問答、多模態推理等方面也都表現出更強大的能力，再次奠定了其在AI行業的領軍地位。相對而言，國產模型的路徑更多傾向于行業應用，綜合特定能力、成本效率、應用流程等條件下追求更適配的AI解決方案。

日前，階躍星辰發布并開源3D模型Step1X-3D，同一時間還公布了完整的數據清洗策略，數據預處理策略，以及800K高質量的3D資產，3D VAE、3D geometry Diffusion以及 texture Diffusion的全鏈路訓練代碼開源。基于這些強而有力的措施，國產模型在造福開發者的同時，也在用近乎掀桌子的方式引領一個全新的3D社群生態。

垂直領域的能力強化、開源策略吸引開發者以及各種成本效率優勢......綜合以上種種優勢，國產模型在上半年正在形成類似的打法來尋求市場突圍。當然，盡管如此，國產模型也沒有放棄主流的前進方向，比如多模態能力依舊是OpenAI和國產模型的主要迭代方向，基礎模型的能力研發與突破同樣也在國產廠商的考量之內。

寫在最后

即將過去的2025上半年，是國產模型的高光時刻，也是一眾國產模型在面對OpenAI的強勢攻勢與全球市場激烈博弈下持續尋求突圍的關鍵階段。在這場AI比拼中，盡管國產模型依舊熱衷于對標OpenAI，但是走的路卻是逐步形成了自己的特色。

從某種程度來說，國產模型不再是完全的追隨者，也在進化為獨立的引領者。在諸多國產模型的發展上，這一趨勢或許在下半年會越來越明顯。

*本文圖片均來源于網絡

此內容為【智能相對論】原創，

僅代表個人觀點，未經授權，任何人不得以任何方式使用，包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡，且未核實版權歸屬，不作為商業用途，如有侵犯，請作者與我們聯系。

?AI產業新媒體;

?澎湃新聞科技榜單月度top5;

?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

?著有《人工智能十萬個為什么》