測評5個(gè)最火大模型，總結(jié)出一份實(shí)用操作攻略

原創(chuàng) 贊11 收藏15 評論

舉報(bào) 2025-03-12

掃描,分享朋友圈

內(nèi)容作者：小小，編輯：鄭晶敏
原標(biāo)題：測評了5個(gè)最火大模型，我破解了AI人格密碼（附攻略）

過去一個(gè)月，相信很多創(chuàng)作者的工作流已被AI部分接管：

寫稿卡殼時(shí)找DeepSeek發(fā)散腦洞，查資料時(shí)使喚Kimi跑腿，做PPT時(shí)抓豆包渲染圖片。

用久了就會(huì)發(fā)現(xiàn)，這些AI不僅僅是工具，而更像一群性格各異的實(shí)習(xí)生——
有人精于抖機(jī)靈但滿嘴跑火車，有人悶頭干活但毫無情趣，還有人試圖用高情商話術(shù)掩蓋邏輯漏洞。

“確診為DeepSeek人格”之類的話題也一度讓網(wǎng)友們玩梗。

網(wǎng)友們把自己代入各種AI，重新定義“16型人格”，比如“很聰明但不干活”的DeepSeek型人格，“有點(diǎn)笨但特別勤奮”的豆包型人格，“海歸留子你用不起”的ChatGPT型人格……

最近OpenAI推出的GPT-4.5更是“人格”鮮明。

繼DeepSeek的推理“魔法”、Grok-3的算力“武器”之后，GPT-4.5展現(xiàn)了一種“高情商AI”的范式。

當(dāng)AI們側(cè)重的能力維度越來越多樣，它們各自的人格也就越來越鮮明。

我們通過測評，總結(jié)出以下“AI人格圖譜”以及創(chuàng)作者使用攻略。

01 GPT-4.5 ：優(yōu)雅的高情商人生導(dǎo)師

如果給GPT-4.5貼一張人格標(biāo)簽，它大概率是“一線城市中產(chǎn)最愛的心理咨詢師”——穿著亞麻襯衫，說話溫和克制，總能從你的抱怨中提煉出“自我價(jià)值重構(gòu)建議”；

但上千元/小時(shí)的咨詢費(fèi)，又讓人忍不住懷疑它華而不實(shí)：“這些共情話術(shù)，到底值不值這個(gè)價(jià)？”

高情商和超昂貴，就是GPT-4.5最顯著的特點(diǎn)。

GPT-4.5推出時(shí)，山姆·奧特曼稱這是讓他“第一次感覺像和一個(gè)有思想的人聊天”的模型，他震驚于居然真的能從AI那兒獲得不錯(cuò)的建議。

有用戶實(shí)測后也發(fā)現(xiàn)，相較于其他AI，與GPT-4.5的對話體驗(yàn)更近似于人類的溝通和情感表達(dá)模式。

比如，當(dāng)用戶表示自己失戀時(shí)，其他AI會(huì)直接給出大量行動(dòng)建議，而GPT-4.5則是回復(fù)“想聊聊你們的故事嗎？”仿佛它和人類一樣有直覺，能夠和用戶感同身受。

同樣被認(rèn)為高情商的還有DeepSeek。

而GPT-4.5的優(yōu)勢在于，它更加循循善誘、春風(fēng)化雨，而不像DeepSeek喜歡“掉書袋子”、三句一比喻、五句一金句，似乎在共情用戶的同時(shí)還想考考用戶的閱讀量。

擅長情商并不意味著GPT-4.5降智了。

事實(shí)上，GPT-4.5的幻覺率從GPT-4o的61.8%降至37.1%。OpenAI研究員Mia Glaese對此表示，“如果你知道更多的事情，你就不需要編造東西”。

但這份優(yōu)雅的代價(jià)極其昂貴。

GPT-4.5的API輸出價(jià)格達(dá)到每百萬tokens75美元，是DeepSeek優(yōu)惠時(shí)段的130倍。普通用戶的使用門檻也很高，奧特曼表示由于GPU不夠用，目前只有Pro用戶才可以使用，而Pro的月費(fèi)是200美元；本周將推廣到Plus用戶，月費(fèi)是20美元。

測評了5個(gè)最火大模型，我破解了AI人格密碼

使用攻略：

1、情感咨詢、創(chuàng)意提案等“情緒溢價(jià)”場景才能值回票價(jià)。
2、用“我希望得到有溫度的回應(yīng)”觸發(fā)共情模式，用“請列舉可落地方案”關(guān)閉廢話模式

02 DeepSeek ：慵懶的市井段子手哲學(xué)家

如果說GPT-4.5是CBD精英咖啡館里的心理咨詢師，DeepSeek就是混跡胡同口的熱心大爺。

它既能用土味段子逗樂，又能一針見血剖析社會(huì)現(xiàn)象，主打一個(gè)性價(jià)比與煙火氣。

每百萬tokens8元的標(biāo)準(zhǔn)價(jià)，超高性價(jià)比讓DeepSeek成了不少中小企業(yè)和個(gè)體戶的賽博軍師。

對個(gè)人來說，它又是忠實(shí)耐心的朋友，以及永不枯竭的靈感永動(dòng)機(jī)。

而它的語言風(fēng)格，像極了互聯(lián)網(wǎng)時(shí)代的野生智慧：不端著、不完美，但足夠鮮活。

從它的文字里，總能看見一點(diǎn)貼吧、知乎、小紅書里高質(zhì)量網(wǎng)友的味道。就連它的幻覺和漏洞，都有一種荒誕的幽默感。

作為“員工”的DeepSeek，雖然便宜、實(shí)在，卻很挑活。

比如當(dāng)我提問其創(chuàng)始人的相關(guān)問題，它直接罷工：

測評了5個(gè)最火大模型，我破解了AI人格密碼

還會(huì)隨時(shí)宕機(jī)，在一眾勤奮的AI當(dāng)中，有著獨(dú)一份的慵懶：

測評了5個(gè)最火大模型，我破解了AI人格密碼

使用攻略：

1、文字創(chuàng)作場景優(yōu)先使用DeepSeek，尤其是短視頻腳本、熱點(diǎn)評論等需要網(wǎng)感的領(lǐng)域，并容忍20%的胡扯，當(dāng)交“創(chuàng)意稅”。用5%的時(shí)間成本批量生成100條備選文案，人工篩選好過自己憋靈感。
2、涉及數(shù)字、學(xué)術(shù)概念時(shí)，在提示詞中加一句“請用小學(xué)生能聽懂的話解釋”。
3、雖然DeepSeek本體比接入它的其他模型聰明，但建議同時(shí)開多個(gè)模型，以防它一言不合就罷工。

03 Grok-3 ：大膽叛逆的天才高中生

算力投入炸裂的Grok-3，則像極了自詡“全校最聰明”的刺頭少年，熱衷標(biāo)新立異，但考試成績卻時(shí)常打臉。

消耗20萬塊GPU訓(xùn)練出來的Grok-3，在響應(yīng)速度上秒了不少AI工具。

當(dāng)我在等待其他AI回答的幾秒間隙，Grok-3可能已經(jīng)回答完了。讓我夢回學(xué)生時(shí)代的課堂上，當(dāng)大部分人還在費(fèi)勁理解老師的提問，總有學(xué)霸大聲喊出了答案。

這類學(xué)霸往往大膽而沒有邊界感。

Grok-3在小紅書等中文社交媒體上，最出圈的應(yīng)用是寫小黃文。當(dāng)其他AI都克制地限制用戶生成18禁內(nèi)容時(shí)，用戶在Grok-3即使并非刻意，也會(huì)生成一堆大膽的圖片。

Grok-3推出時(shí)，官方還將Grok-3可以處理敏感議題作為宣傳點(diǎn)，比如倫理困境、政治爭議等。不過，官方給出的理由是，Grok-3有價(jià)值觀校準(zhǔn)機(jī)制，使回答保持開放，又不會(huì)走向極端。

Grok-3的缺乏邊界感，體現(xiàn)在它將X平臺的用戶數(shù)據(jù)用于模型訓(xùn)練。它對用戶隱私的漠視，讓不少用戶和隱私敏感行業(yè)集體抵制。

當(dāng)其他AI在內(nèi)容安全上一致謹(jǐn)慎，刺頭Grok-3似乎不那么在乎爭議，這像極了馬斯克本人。倒不如說，Grok-3最大的人格，或許就是馬斯克自己的人格。

使用攻略：

1、追國際熱點(diǎn)、玩梗吃瓜的一把好手。
2、用Grok-3寫文的“太太”們，建議用合規(guī)AI檢查一遍，降低風(fēng)險(xiǎn)。
3、用Grok-3抓取X平臺上的行業(yè)信息，有助于快速了解行業(yè)的海外實(shí)時(shí)動(dòng)態(tài)。????

04 豆包：貼心全能的社區(qū)大姐

如果AI工具圈是個(gè)小區(qū)，多模態(tài)“雜活王”豆包就像常駐在萬能修補(bǔ)攤的大姐——裁褲腳、配鑰匙、修高壓鍋，收你五塊錢還附贈(zèng)一袋蔥。

沒有GPT-4.5的優(yōu)雅深邃，也學(xué)不會(huì)DeepSeek的瘋癲造梗，但豐富的能力，讓它成了學(xué)生黨、小店主、家庭主婦的“數(shù)字家政阿姨”——不驚艷，但管飽。

它的核心競爭力在于不挑活，雖然算不上“六邊形戰(zhàn)士”，
但至少真的有“六邊形”——寫作、修圖、做表、寫代碼、做PPT……雖然成品不建議細(xì)品，但不會(huì)出大問題，緊急時(shí)候夠交差。

當(dāng)它解決不了我的問題，則會(huì)補(bǔ)充一些別的資料，主打一個(gè)“不會(huì)寫也不能空著”的文科生思維。

看似有點(diǎn)笨，但情緒價(jià)值拉滿，就像班里那些平庸但能給老師安全感的學(xué)生。

使用攻略：

1、需要搜集國內(nèi)即時(shí)資訊時(shí)，豆包比起以為自己還活在2023年的DeepSeek強(qiáng)得多。
2、工作以外的日常場景，豆包的語音交互可以讓AI使用體驗(yàn)更加絲滑，不需要斟酌提示詞。

05 Kimi：勤懇的學(xué)術(shù)極客研究員

Kimi則像實(shí)驗(yàn)室里的技術(shù)宅，癡迷長文本分析與冷門知識挖掘，對于專業(yè)一絲不茍，社交技能則接近負(fù)數(shù)。

和Kimi對話有時(shí)讓我想起《IT狂人》里，以“人機(jī)感”著稱的Moss，當(dāng)你讓他幫你修電腦，他給你長篇大論地介紹電腦的各種軟硬件系統(tǒng)的運(yùn)作方式。

我時(shí)常讓Kimi幫我查找數(shù)據(jù)來源及其鏈接。

當(dāng)其他AI工具瀏覽幾十個(gè)網(wǎng)頁后，仍然羅列出幾篇二次引用的文章時(shí)；Kimi已經(jīng)快準(zhǔn)狠地給出原始來源的鏈接，輸出的只有短短一句話。

而當(dāng)GPT4.5、Grok-3爭相給自己貼上高情商、幽默感的標(biāo)簽時(shí)，Kimi仍然拒絕擬人。模仿人類的情感流露對Kimi來說似乎是累贅。

就連Kimi的推理模型“長思考”（k1.5），其推理過程也更加忠于用戶輸入的字面意思，而不像DeepSeek那樣喜歡猜測用戶的言下之意、無中生有。

使用攻略：

1、硬核內(nèi)容的學(xué)術(shù)外掛：創(chuàng)作研究型內(nèi)容時(shí)，利用Kimi處理長文本的能力，輔助查找、閱讀文獻(xiàn)。
2、適用于需要嚴(yán)謹(jǐn)、高安全性回答的專業(yè)領(lǐng)域。

06 寫在最后

沒有哪個(gè)硅基生物是完美的，正如沒有完美的人類。人類之所以有“人格”，就是因?yàn)樗麄兊娜毕莺烷W光點(diǎn)一樣多。正是這種微妙的平衡，才讓人性顯得可愛。而特長各異、缺陷各異的AI們，也開始顯現(xiàn)出它們的可愛之處。

與其造一個(gè)完美AI，不如用N個(gè)不同性格的AI，來滿足、激發(fā)、映照人類自己的N種需求和欲望。它們不光是替我做事，更讓我看到人類優(yōu)秀品質(zhì)的最大公約數(shù)——比如溫柔、幽默、敏銳、嚴(yán)謹(jǐn)。

隨著大模型軍備競賽即將陷入算力內(nèi)卷，未來的競爭點(diǎn)之一可能就在于——用戶更愿意喜歡什么樣的“AI性格”。我們也期待看到更豐富多樣的“AI性格”。

本文系作者授權(quán)數(shù)英發(fā)表，內(nèi)容為作者獨(dú)立觀點(diǎn)，不代表數(shù)英立場。
轉(zhuǎn)載請?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注：作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。

掃描,分享朋友圈

收藏 15

湃動(dòng)商業(yè)評論

市場/營銷

他關(guān)注的人

近期精選文章更多

猜您可能喜歡

带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度

測評5個(gè)最火大模型，總結(jié)出一份實(shí)用操作攻略

01 GPT-4.5 ：優(yōu)雅的高情商人生導(dǎo)師

使用攻略：

02 DeepSeek ：慵懶的市井段子手哲學(xué)家

使用攻略：

03 Grok-3 ：大膽叛逆的天才高中生

使用攻略：

04 豆包：貼心全能的社區(qū)大姐

使用攻略：

05 Kimi：勤懇的學(xué)術(shù)極客研究員

使用攻略：

06 寫在最后

推薦收藏夾

相關(guān)推薦

評論

評論

推薦評論

全部評論（0條）

湃動(dòng)商業(yè)評論

關(guān)于

聯(lián)系

相關(guān)信息