數(shù)智化轉(zhuǎn)型不是“買(mǎi)硬件”,DeepSeek一體機(jī)別亂上
過(guò)去一個(gè)月里,DeepSeek一體機(jī)儼然成了最熱的一門(mén)生意。
原先做服務(wù)器的廠商、賣(mài)算力的企業(yè)、做IT系統(tǒng)集成的軟件商,陸續(xù)推出了各種各樣的“DeepSeek一體機(jī)”。就連深圳華強(qiáng)北的商家們,也想要通過(guò)“攢一體機(jī)”的方式分一杯流量。
讓人眼花繚亂的背后,必須要回答的問(wèn)題是:一體機(jī)的部署方案,是否是適合所用企業(yè)的最優(yōu)解?
畢竟大多數(shù)云廠商都上線了DeepSeek系列模型的推理服務(wù),華為云更是推出了從商業(yè)級(jí)的Tokens計(jì)費(fèi)模式到CloudPond邊緣訓(xùn)推一體機(jī),再到華為云Stack上DeepSeek大模型訓(xùn)推部署解決方案,覆蓋了DeepSeek V3/R1大模型在企業(yè)業(yè)務(wù)部署應(yīng)用的全場(chǎng)景。
本文將對(duì)兩種典型的部署方案進(jìn)行對(duì)比,幫助大家去魅魚(yú)龍混雜的“DeepSeek一體機(jī)”,為真正關(guān)注業(yè)務(wù)數(shù)智化轉(zhuǎn)型的企業(yè),找到最合適的部署方案。
01 一體機(jī)方案也有“煩惱”
DeepSeek一體機(jī)的走紅,其實(shí)并不意外。
正如外界所熟知的,DeepSeek通過(guò)工程化創(chuàng)新顯著降低了對(duì)算力的要求,再加上是以開(kāi)源方式出現(xiàn)的,直接促成了一體機(jī)的爆發(fā):將服務(wù)器、GPU、操作系統(tǒng)、AI推理框架、大模型等“打包”封裝在一起,省去了繁瑣的硬件調(diào)試與軟件環(huán)境搭建,就能實(shí)現(xiàn)性能對(duì)標(biāo)OpenAI-o1正式版的DeepSeek-R1滿血版大模型的“開(kāi)箱即用”。
一些企業(yè)的營(yíng)銷(xiāo)話術(shù)也相當(dāng)有誘惑性:只需用家用電源插座,就能跑大模型;最高支持671B參數(shù)滿血版,一機(jī)足矣,省了數(shù)據(jù)中心;輕松買(mǎi)臺(tái)DeepSeek一體機(jī),分分鐘部署一個(gè)世界級(jí)大模型……
歸根結(jié)底,離不開(kāi)“嘗鮮”二字。原先需要千萬(wàn)級(jí)預(yù)算才能部署的大模型,現(xiàn)在只需要一臺(tái)一體機(jī)。在“先落地試試,總比啥都不干好”的普遍心態(tài)下,DeepSeek一體機(jī)迅速成了“新晉頂流”。
每一次新技術(shù)涌現(xiàn),都會(huì)經(jīng)歷周期性的“起哄—泡沫—落地—重生”,DeepSeek一體機(jī)也不例外,至少已經(jīng)暴露出了兩類(lèi)“煩惱”。
一是算力上的短板。
DeepSeek在一定程度上解決了大模型對(duì)高端芯片的依賴,但算力短缺問(wèn)題依然存在。比如部分一體機(jī)搭載的是蒸餾模型,在能力上存在不足;一些支持DeepSeek R1滿血版的一體機(jī),實(shí)際使用中出現(xiàn)了“一個(gè)字一個(gè)字往外蹦”的現(xiàn)象,因?yàn)閮?yōu)化不足,無(wú)法像云端推理那般“一段段流暢地回答”。
同時(shí)還有鮮被提及的精度問(wèn)題。為了計(jì)算更快,減少存儲(chǔ)和帶寬壓力,不少一體機(jī)采用的是低精度量化版,在數(shù)學(xué)、代碼生成、事實(shí)性知識(shí)問(wèn)答等任務(wù)上,可能帶來(lái)更大的誤差,影響回答的連貫性和準(zhǔn)確度。
更有一些一體機(jī)廠商,直接報(bào)出了采用4090D顯卡的魔改一體機(jī)組合,美其名曰“嘗鮮、試錯(cuò)”,但20萬(wàn)元(單卡4090D)~80萬(wàn)(8卡4090D)的報(bào)價(jià),真的讓內(nèi)行人笑不出來(lái)。
(某廠商給出的4090D大模型一體機(jī)的配置)
二是場(chǎng)景上的局限。
目前許多一體機(jī)是“一次性買(mǎi)斷”的,搭載的是通用模型,無(wú)法解決金融風(fēng)控策略、醫(yī)療診斷偏執(zhí)度、安全審查流程等行業(yè)專(zhuān)屬問(wèn)題。
企業(yè)買(mǎi)來(lái)一體機(jī)后,仍然需要安排專(zhuān)門(mén)的工程師進(jìn)行模型微調(diào)。但企業(yè)往往因?yàn)槿鄙購(gòu)哪P瓦x型到場(chǎng)景落地的全流程支持,實(shí)際落地應(yīng)用中常常會(huì)遇到"最后一公里"障礙。
也有一體機(jī)采用了“集成算力+大模型+場(chǎng)景方案”的模式,前提是了解行業(yè)痛點(diǎn)并進(jìn)行定制優(yōu)化,對(duì)行業(yè)Know-How要求高。現(xiàn)實(shí)卻是,一體機(jī)預(yù)置的場(chǎng)景化方案比較單一,且不確定后續(xù)是否會(huì)持續(xù)迭代。
簡(jiǎn)單來(lái)說(shuō),用DeepSeek一體機(jī)叩開(kāi)客戶的門(mén)不難,難的是部署后產(chǎn)生業(yè)務(wù)價(jià)值。企業(yè)需要的,從來(lái)都不是大模型,而是生產(chǎn)力。既然魚(yú)龍混雜的一體機(jī)市場(chǎng)存在太多的坑,云服務(wù)會(huì)是更好的選擇嗎?
02 云服務(wù)需跨越“三道關(guān)”
為什么不考慮云服務(wù)呢?原因在于三個(gè)“焦慮”。
擔(dān)心云端推理的不穩(wěn)定,就像DeepSeek官方API在2月份頻繁出現(xiàn)的宕機(jī)事故;擔(dān)心云端成本太高,訓(xùn)練、推理、模型訂閱、數(shù)據(jù)存儲(chǔ)等服務(wù)均需付費(fèi);以及數(shù)據(jù)安全的考量,擔(dān)心數(shù)據(jù)隱私的把控度不高。
這些“焦慮”并非沒(méi)有道理,甚至成了云服務(wù)需跨越“三道關(guān)”。
但對(duì)頭部的云廠商而言,上述“擔(dān)心”并不成立。以 “業(yè)務(wù)開(kāi)箱即用,價(jià)值立竿見(jiàn)影” 華為云DeepSeek解決方案為例,其主張“讓大模型從第一天就創(chuàng)造價(jià)值”,早已給出了對(duì)應(yīng)的解決方案。
在安全性和可靠方面,華為云昇騰AI云服務(wù)在貴安、烏蘭察布、蕪湖、青島等地的算力中心,支持10萬(wàn)卡以上的大規(guī)模集群,可以提供百Eflops的算力;在全面SLA保障、資源彈性伸縮、按需擴(kuò)容等措施下,能夠滿足絕大多數(shù)企業(yè)的業(yè)務(wù)連續(xù)性和突發(fā)性的算力需求。
除此之外,華為云構(gòu)建了一個(gè)中心+七層防線系統(tǒng)安全方案,包括邊界防護(hù)、入侵檢測(cè)與防御、數(shù)據(jù)加密傳輸?shù)鹊龋员U戏?wù)的穩(wěn)定可靠。譬如在春節(jié)期間,華為云幫助某國(guó)產(chǎn)TOP大模型廠商官網(wǎng)抵御了堪稱(chēng)戰(zhàn)略級(jí)的3輪黑客攻擊、5輪CC攻擊、6輪DDoS攻擊,有效地支撐了該廠商在春節(jié)期間的業(yè)務(wù)與用戶數(shù)據(jù)安全。
在數(shù)據(jù)安全方面,華為云滿足多種多種合規(guī)要求,堅(jiān)持不碰客戶數(shù)據(jù)、不拿客戶數(shù)據(jù)變現(xiàn)、確保客戶數(shù)據(jù)隱私安全。
而且華為云提供了云上到云下的全棧部署方案:分鐘級(jí)的按需計(jì)費(fèi)部署,保障數(shù)據(jù)安全的同時(shí),實(shí)現(xiàn)了按需付費(fèi)、分鐘級(jí)上線;小時(shí)級(jí)專(zhuān)屬資源部署,支持獨(dú)占資源模式部署,數(shù)據(jù)不出客戶管控域;再到天級(jí)本地業(yè)務(wù)一站式部署,提供華為云CloudPond本地業(yè)務(wù)場(chǎng)景一站式部署,昇騰計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、中間件、安全等服務(wù)整柜交付,確保數(shù)據(jù)不出客戶本地機(jī)房。
至于價(jià)格方面,并不難算一筆成本賬。
目前DeepSeek一體機(jī)的價(jià)格在幾萬(wàn)元到上百萬(wàn)元不等,如果要跑DeepSeek R1滿血版的話,單是一體機(jī)的采購(gòu)成本就要數(shù)百萬(wàn)元,考慮到硬件折舊,需配備專(zhuān)業(yè)團(tuán)隊(duì)進(jìn)行系統(tǒng)維護(hù)、故障排查和性能優(yōu)化,疊加電力、機(jī)房等開(kāi)支,三年期的綜合使用成本,恐怕不低于云服務(wù)。
以上還沒(méi)考慮風(fēng)險(xiǎn)防御帶來(lái)的隱性成本。相較于云服務(wù),一體機(jī)的風(fēng)險(xiǎn)防御能力要弱得多,一旦出現(xiàn)惡性攻擊、軟硬件故障等偶然事件,可能需要幾十個(gè)小時(shí)才能恢復(fù),造成的潛在損失可能是千萬(wàn)級(jí)的。
有的企業(yè)IT負(fù)責(zé)人可能會(huì)說(shuō):我如果購(gòu)買(mǎi)了一體機(jī),本身就是線下部署,業(yè)務(wù)數(shù)據(jù)和公網(wǎng)隔離。但其實(shí),很多企業(yè)內(nèi)網(wǎng)并不能完全隔離員工U盤(pán)和自帶設(shè)備接入所帶來(lái)的安全風(fēng)險(xiǎn)。而華為云DeepSeek解決方案,不僅提供南北向流量的WAF(Web應(yīng)用防火墻)來(lái)防御外來(lái)網(wǎng)絡(luò)威脅,還提供CFW(云防火墻)對(duì)東西向流量中的可疑行為進(jìn)行審計(jì)與處理,確保企業(yè)內(nèi)部業(yè)務(wù)系統(tǒng)的安全可靠。
也就是說(shuō),一體機(jī)相較于云服務(wù)的成本、穩(wěn)定性和數(shù)據(jù)安全優(yōu)勢(shì),其實(shí)經(jīng)不起推敲。當(dāng)越來(lái)越多企業(yè)的期望破碎,對(duì)大模型落地有了更深刻的認(rèn)知,一體機(jī)熱度的降溫,只是時(shí)間問(wèn)題罷了。
03 落地應(yīng)用需要“靜一靜”
給急于購(gòu)買(mǎi)一體機(jī)的企業(yè)一句忠勸:請(qǐng)先靜一靜。
并非是要給“DeepSeek一體機(jī)”潑冷水,而是一體機(jī)市場(chǎng)本身正在走向混亂,沒(méi)人知道水面下有多少暗礁。大模型的落地應(yīng)用,關(guān)系到數(shù)智化轉(zhuǎn)型的進(jìn)程,應(yīng)該回歸企業(yè)的核心訴求,選擇最適合的部署方案,而非抱著“跟風(fēng)”的心態(tài),僅僅為了“趕時(shí)髦”,倉(cāng)促上馬所謂的“懶人經(jīng)濟(jì)”產(chǎn)品。
這里給大家提供兩個(gè)核心考量因素:
第一個(gè)是技術(shù)自由度。
2024年是大模型推理應(yīng)用的元年,2025年很可能是智能體爆發(fā)的一年。正如前段時(shí)間走紅的Manus所示范的,在生產(chǎn)一線落地的智能體,大概率需要調(diào)用不同大模型的能力,協(xié)同完成復(fù)雜任務(wù)。
一體機(jī)的局限性在于,適配的大模型常常是固化且單一的。一旦有更新的大模型出現(xiàn),可能存在算力不足或算力浪費(fèi)的情況,而且想要兼容新的大模型,則需要專(zhuān)業(yè)的團(tuán)隊(duì)進(jìn)行重新部署和優(yōu)化。在業(yè)務(wù)競(jìng)速的時(shí)代,如果企業(yè)“大腦”被提前預(yù)設(shè)了天花板,再多業(yè)務(wù)需求也只是無(wú)源之水。
相比之下,華為云代表的云服務(wù)支持DeepSeek V3/R1、不同大小的DeepSeek R1蒸餾版模型以及Qwen、智譜GLM等其他廠商的大模型,并且支持多模型靈活切換,能夠滿足不同業(yè)務(wù)場(chǎng)景的需求。
第二個(gè)是場(chǎng)景豐富度。
大模型和場(chǎng)景的融合,不是簡(jiǎn)單部署一套DeepSeek模型就可以了,而是要明確場(chǎng)景,把數(shù)據(jù)用好。甚至可以說(shuō),選擇什么樣的部署方式,本質(zhì)上是在挑選誰(shuí)能提供豐富的業(yè)務(wù)場(chǎng)景解決方案。
不少一體機(jī)廠商,之前并沒(méi)有太多的業(yè)務(wù)經(jīng)驗(yàn),不排除通過(guò)一些開(kāi)源產(chǎn)品拼湊方案充數(shù)的嫌疑。沒(méi)有深度適配調(diào)優(yōu)、沒(méi)有后期維護(hù)迭代,這樣的一體機(jī)能解決多少問(wèn)題,自然要打一個(gè)問(wèn)號(hào)。
一體機(jī)的短板,恰恰是云廠商的強(qiáng)項(xiàng)。譬如華為云的DeepSeek解決方案已經(jīng)在政企、金融、制造、醫(yī)療等多個(gè)行業(yè)落地,打造了企業(yè)級(jí)知識(shí)庫(kù)+智能助手、聯(lián)網(wǎng)智能AI助手與數(shù)智員工、智能推薦系統(tǒng)等多個(gè)應(yīng)用,并且模型的參數(shù)、版本等結(jié)合實(shí)踐持續(xù)更新,能夠讓智能化應(yīng)用越用越“聰明”。
外部的聲音越是喧囂,越應(yīng)該穿越層層迷霧。
企業(yè)的數(shù)智化轉(zhuǎn)型,就像是一場(chǎng)馬拉松,在前方存在岔路的時(shí)候,更應(yīng)該謹(jǐn)慎且理性地做選擇,避免因?yàn)樽咤e(cuò)路而造成資源浪費(fèi)。特別是業(yè)務(wù)有一定規(guī)模,對(duì)業(yè)務(wù)連續(xù)性、可靠性、彈性有需求的客戶,一體機(jī)的故事固然誘人,但華為云這樣的云服務(wù),才是更符合落地需求的選擇。
04 寫(xiě)在最后
DeepSeek以“開(kāi)源+低成本”姿態(tài)跑入公眾視野后,整個(gè)AI行業(yè)再度沸騰了起來(lái),每個(gè)禮拜都有新的模型發(fā)布,大模型的能力不斷被刷新,而且越來(lái)越多的大模型企業(yè)走上了開(kāi)源路線。
也就意味著,一體機(jī)、云端以及其他部署方式的博弈還將續(xù)一段時(shí)間,不排除有更多的廠商加入到大模型戰(zhàn)局。對(duì)于企業(yè)的決策者來(lái)說(shuō),“風(fēng)口”越是洶涌,越應(yīng)該對(duì)硬件適配、運(yùn)營(yíng)成本、數(shù)據(jù)安全等問(wèn)題理性思考,權(quán)衡不同部署方式的優(yōu)劣,確保技術(shù)投入能夠真正帶來(lái)長(zhǎng)期價(jià)值。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_(kāi)頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
暫無(wú)評(píng)論哦,快來(lái)評(píng)論一下吧!
全部評(píng)論(0條)