带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度

超越OpenAI?國產推理模型的2025半年“狂飆時刻”

原創 收藏 評論
舉報 2025-05-22

1.png

文 | 智能相對論

作者 | 陳泊丞

今年年初,DeepSeek-R1以低成本、高性能以及開源特性在全球AI圈內爆火走紅,風頭一度壓過OpenAI,同時也開啟了國產推理模型持續“狂飆”時刻。

回顧過去的2025上半年,「智能相對論」統計發現,在DeepSeek之外,阿里、科大訊飛、小米、月之暗面、商湯科技等廠商都陸續宣告自家大模型對OpenAI系列模型產品的追趕或是超越。

2.png

智能相對論制圖

國產模型的加速“狂飆”有目共睹。OpenAI在今年4月一改口風,發布了o3/o4 mini模型,或許也有來自后來者追趕的壓力。但是,對于國產模型而言,比起性能上的追趕和超越,自我的發展節奏也在上半年逐漸形成,初見端倪。

國產模型的“彎道超車”

DeepSeek的走紅并非是其性能完全超越OpenAI,而是來自于低成本優勢和開源生態帶來的顛覆性體驗,使其迅速“破圈”,成為全球熱門AI模型。在過去的半年內,延續DeepSeek的破圈邏輯,國產模型似乎也瞄準了類似的路徑。

一、低成本突圍,用更少的算力追趕OpenAI的性能。

前不久,阿里千問3登頂全球最強開源模型,也在一定程度上完成了國產模型的破圈。成就這次現象的關鍵除了模型快速上線通義App之外,還有就是自身的高性能與低成本特性,其性能在超越OpenAI-o1與DeepSeek-R1的同時,部署成本大幅降低,僅需4張H20即可部署千問3滿血版,顯存占用僅為性能相近模型的三分之一。

3.png

盡管在性能上,國產模型很難跟OpenAI拉開太大的差距,但是在部署成本上的持續優化,從另一個角度真正意義上完成了對OpenAI的追趕。幾乎是同一時間,星火X1也完成升級,整體效果對標OpenAI-o1與DeepSeek-R1。而在算力成本上,星火X1不僅是業界唯一基于全國產算力訓練的深度推理模型,還成功實現了只需4張華為910B芯片即可完成部署,把國產模型的低成本特性再度“打爆”。

4.png

中美博弈態勢加劇,美國對華的算力管控越來越嚴格,從某種程度來說,這是一種無奈之舉,但同時也是一個強勢突圍的方向,依托低成本部署優勢,國產模型在AI普惠與行業應用中具備更強的適配性。若能繼續沿著這一方向突圍,國產模型的行業滲透率將在今年下半年繼續保持強勢增長。

二、開源生態破局,重新制定行業規則,打破技術霸權秩序。

DeepSeek-R1采用MIT協議,千問3采用Apache2.0協議,均是極寬松的開源協議,在OpenAI的閉源霸權之下,國產模型更熱衷于用開源策略來吸引全球開發者的目光,打造一個更廣泛的模型生態,從而制衡OpenAI的先發優勢與性能主義。這一策略正在被更多的國產模型所復刻,小米也開源了MiMo。

如今,中國的模型廠商在開源路徑上不斷走出自己的特色,不僅開放了不同參數規格的模型產品,還包括各種量化版本、完整的訓練數據集以及微調所需的數據模板等,滿足了不同場景下的實際需求,甚至是給到詳細的API設計和文檔,方便開發者快速集成和使用。

在開源上,國產模型表現出積極的態度。比起性能上的追趕,國產模型也正在試圖在開源與性能之間中找到一個平衡點,基于完善的服務和生態來實現模型的超越。值得一提的,DeepSeek-R1、千問3在HuggingFace等開源社區上均取得了開發者們不錯的反饋,整個千問系列的全球衍生模型更是超過10萬個,超越美國Llama位列第一,說明國產模型的開源策略正在被更多的全球開發者所認可。

三、特定能力強化,專為行業應用而打造,實用主義的國產屬性爆表。

現階段,國產模型對OpenAI的超越更多體現在特定的能力或任務處理上。日日新V6的多模態處理能力對標OpenAI-o1,同時迭代成為國內首個支持10分鐘中長視頻深度解析的大模型。

為什么要這么強化特定能力?商湯科技認為,比起文本性的內容消費,視頻、圖文結合是更大的內容消費市場。由此,日日新V6把語音、視頻、文字形成一個統一跟時間軸對齊的上下文表達,從而實現人機交互更自然、高效。這種做法更多是從實際的行業應用出發,日日新V6的能力強化正是為了具身智能的突破做準備。

這樣的做法類似于中國的古代智慧“田忌賽馬”,OpenAI-o1在結構化推理方面優勢顯著,而國產模型則在中文語境、多模態能力、成本效率上進行非對稱競爭,不去和OpenAI強勢的一面做對抗。同時,這也符合當前本土產業在AI應用過程中對模型能力的需求,順勢讓國產模型更快地進入企業級市場,加速商業化。

模型“狂飆”:OpenAI向左,國產向右

在今年上半年,OpenAI已經推出更強、更智能的o3和o4-mini模型。盡管在成本效率上無法達到國產模型的夸張水平,但OpenAI在上代相同的延遲和成本上實現了更強的性能體驗。

OpenAI對模型性能的追求依舊是業內標桿,作為最新的旗艦模型,o3和o4-mini(無工具版本)在AIME 2024數學競賽題目中的準確率分別達91.6%和93.4%,遠遠甩開o1的74.3%的成績。而在Codeforces編程競賽評分中,支持終端工具的o3和o4-mini也分別取得2706和2719的ELO分數,領先程度有目共睹,展現了其在數學和代碼能力上的巨大突破。

5.png

除此之外,OpenAI的新模型在知識問答、多模態推理等方面也都表現出更強大的能力,再次奠定了其在AI行業的領軍地位。相對而言,國產模型的路徑更多傾向于行業應用,綜合特定能力、成本效率、應用流程等條件下追求更適配的AI解決方案。

日前,階躍星辰發布并開源3D模型Step1X-3D,同一時間還公布了完整的數據清洗策略,數據預處理策略,以及800K高質量的3D資產,3D VAE、3D geometry Diffusion以及 texture Diffusion的全鏈路訓練代碼開源。基于這些強而有力的措施,國產模型在造福開發者的同時,也在用近乎掀桌子的方式引領一個全新的3D社群生態。

垂直領域的能力強化、開源策略吸引開發者以及各種成本效率優勢......綜合以上種種優勢,國產模型在上半年正在形成類似的打法來尋求市場突圍。當然,盡管如此,國產模型也沒有放棄主流的前進方向,比如多模態能力依舊是OpenAI和國產模型的主要迭代方向,基礎模型的能力研發與突破同樣也在國產廠商的考量之內。

寫在最后

即將過去的2025上半年,是國產模型的高光時刻,也是一眾國產模型在面對OpenAI的強勢攻勢與全球市場激烈博弈下持續尋求突圍的關鍵階段。在這場AI比拼中,盡管國產模型依舊熱衷于對標OpenAI,但是走的路卻是逐步形成了自己的特色。

從某種程度來說,國產模型不再是完全的追隨者,也在進化為獨立的引領者。在諸多國產模型的發展上,這一趨勢或許在下半年會越來越明顯。

*本文圖片均來源于網絡

此內容為【智能相對論】原創,

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。

?AI產業新媒體;

?澎湃新聞科技榜單月度top5;

?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

?著有《人工智能 十萬個為什么》

?【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。


本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本內容為作者獨立觀點,不代表數英立場。
本文禁止轉載,侵權必究。
本文系數英原創,未經允許不得轉載。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評論

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    800

    推薦評論

    暫無評論哦,快來評論一下吧!

    全部評論(0條)

    主站蜘蛛池模板: 邹平县| 柳江县| 福贡县| 邮箱| 乐至县| 关岭| 高安市| 娄底市| 那曲县| 大理市| 木里| 轮台县| 甘南县| 普安县| 邯郸县| 布尔津县| 漳浦县| 皮山县| 沽源县| 河西区| 鹤岗市| 金湖县| 扬州市| 亚东县| 烟台市| 巴彦淖尔市| 旅游| 双牌县| 唐海县| 肇东市| 阳东县| 独山县| 丰台区| 三河市| 莆田市| 德安县| 修水县| 大同市| 民勤县| 凤冈县| 和平县|