測評5個最火大模型,總結出一份實用操作攻略
內容作者:小小,編輯:鄭晶敏
原標題:測評了5個最火大模型,我破解了AI人格密碼(附攻略)
過去一個月,相信很多創作者的工作流已被AI部分接管:
寫稿卡殼時找DeepSeek發散腦洞,查資料時使喚Kimi跑腿,做PPT時抓豆包渲染圖片。
用久了就會發現,這些AI不僅僅是工具,而更像一群性格各異的實習生——
有人精于抖機靈但滿嘴跑火車,有人悶頭干活但毫無情趣,還有人試圖用高情商話術掩蓋邏輯漏洞。
“確診為DeepSeek人格”之類的話題也一度讓網友們玩梗。
網友們把自己代入各種AI,重新定義“16型人格”,比如“很聰明但不干活”的DeepSeek型人格,“有點笨但特別勤奮”的豆包型人格,“海歸留子你用不起”的ChatGPT型人格……
最近OpenAI推出的GPT-4.5更是“人格”鮮明。
繼DeepSeek的推理“魔法”、Grok-3的算力“武器”之后,GPT-4.5展現了一種“高情商AI”的范式。
當AI們側重的能力維度越來越多樣,它們各自的人格也就越來越鮮明。
我們通過測評,總結出以下“AI人格圖譜”以及創作者使用攻略。
01 GPT-4.5 :優雅的高情商人生導師
如果給GPT-4.5貼一張人格標簽,它大概率是“一線城市中產最愛的心理咨詢師”——穿著亞麻襯衫,說話溫和克制,總能從你的抱怨中提煉出“自我價值重構建議”;
但上千元/小時的咨詢費,又讓人忍不住懷疑它華而不實:“這些共情話術,到底值不值這個價?”
高情商和超昂貴,就是GPT-4.5最顯著的特點。
GPT-4.5推出時,山姆·奧特曼稱這是讓他“第一次感覺像和一個有思想的人聊天”的模型,他震驚于居然真的能從AI那兒獲得不錯的建議。
有用戶實測后也發現,相較于其他AI,與GPT-4.5的對話體驗更近似于人類的溝通和情感表達模式。
比如,當用戶表示自己失戀時,其他AI會直接給出大量行動建議,而GPT-4.5則是回復“想聊聊你們的故事嗎?”仿佛它和人類一樣有直覺,能夠和用戶感同身受。
同樣被認為高情商的還有DeepSeek。
而GPT-4.5的優勢在于,它更加循循善誘、春風化雨,而不像DeepSeek喜歡“掉書袋子”、三句一比喻、五句一金句,似乎在共情用戶的同時還想考考用戶的閱讀量。
擅長情商并不意味著GPT-4.5降智了。
事實上,GPT-4.5的幻覺率從GPT-4o的61.8%降至37.1%。OpenAI研究員Mia Glaese對此表示,“如果你知道更多的事情,你就不需要編造東西”。
但這份優雅的代價極其昂貴。
GPT-4.5的API輸出價格達到每百萬tokens75美元,是DeepSeek優惠時段的130倍。普通用戶的使用門檻也很高,奧特曼表示由于GPU不夠用,目前只有Pro用戶才可以使用,而Pro的月費是200美元;本周將推廣到Plus用戶,月費是20美元。
使用攻略:
1、情感咨詢、創意提案等“情緒溢價”場景才能值回票價。
2、用“我希望得到有溫度的回應”觸發共情模式,用“請列舉可落地方案”關閉廢話模式
02 DeepSeek :慵懶的市井段子手哲學家
如果說GPT-4.5是CBD精英咖啡館里的心理咨詢師,DeepSeek就是混跡胡同口的熱心大爺。
它既能用土味段子逗樂,又能一針見血剖析社會現象,主打一個性價比與煙火氣。
每百萬tokens8元的標準價,超高性價比讓DeepSeek成了不少中小企業和個體戶的賽博軍師。
對個人來說,它又是忠實耐心的朋友,以及永不枯竭的靈感永動機。
而它的語言風格,像極了互聯網時代的野生智慧:不端著、不完美,但足夠鮮活。
從它的文字里,總能看見一點貼吧、知乎、小紅書里高質量網友的味道。就連它的幻覺和漏洞,都有一種荒誕的幽默感。
作為“員工”的DeepSeek,雖然便宜、實在,卻很挑活。
比如當我提問其創始人的相關問題,它直接罷工:
還會隨時宕機,在一眾勤奮的AI當中,有著獨一份的慵懶:
使用攻略:
1、文字創作場景優先使用DeepSeek,尤其是短視頻腳本、熱點評論等需要網感的領域,并容忍20%的胡扯,當交“創意稅”。用5%的時間成本批量生成100條備選文案,人工篩選好過自己憋靈感。
2、涉及數字、學術概念時,在提示詞中加一句“請用小學生能聽懂的話解釋”。
3、雖然DeepSeek本體比接入它的其他模型聰明,但建議同時開多個模型,以防它一言不合就罷工。
03 Grok-3 :大膽叛逆的天才高中生
算力投入炸裂的Grok-3,則像極了自詡“全校最聰明”的刺頭少年,熱衷標新立異,但考試成績卻時常打臉。
消耗20萬塊GPU訓練出來的Grok-3,在響應速度上秒了不少AI工具。
當我在等待其他AI回答的幾秒間隙,Grok-3可能已經回答完了。讓我夢回學生時代的課堂上,當大部分人還在費勁理解老師的提問,總有學霸大聲喊出了答案。
這類學霸往往大膽而沒有邊界感。
Grok-3在小紅書等中文社交媒體上,最出圈的應用是寫小黃文。當其他AI都克制地限制用戶生成18禁內容時,用戶在Grok-3即使并非刻意,也會生成一堆大膽的圖片。
Grok-3推出時,官方還將Grok-3可以處理敏感議題作為宣傳點,比如倫理困境、政治爭議等。不過,官方給出的理由是,Grok-3有價值觀校準機制,使回答保持開放,又不會走向極端。
Grok-3的缺乏邊界感,體現在它將X平臺的用戶數據用于模型訓練。它對用戶隱私的漠視,讓不少用戶和隱私敏感行業集體抵制。
當其他AI在內容安全上一致謹慎,刺頭Grok-3似乎不那么在乎爭議,這像極了馬斯克本人。倒不如說,Grok-3最大的人格,或許就是馬斯克自己的人格。
使用攻略:
1、追國際熱點、玩梗吃瓜的一把好手。
2、用Grok-3寫文的“太太”們,建議用合規AI檢查一遍,降低風險。
3、用Grok-3抓取X平臺上的行業信息,有助于快速了解行業的海外實時動態。????
04 豆包:貼心全能的社區大姐
如果AI工具圈是個小區,多模態“雜活王”豆包就像常駐在萬能修補攤的大姐——裁褲腳、配鑰匙、修高壓鍋,收你五塊錢還附贈一袋蔥。
沒有GPT-4.5的優雅深邃,也學不會DeepSeek的瘋癲造梗,但豐富的能力,讓它成了學生黨、小店主、家庭主婦的“數字家政阿姨”——不驚艷,但管飽。
它的核心競爭力在于不挑活,雖然算不上“六邊形戰士”,
但至少真的有“六邊形”——寫作、修圖、做表、寫代碼、做PPT……雖然成品不建議細品,但不會出大問題,緊急時候夠交差。
當它解決不了我的問題,則會補充一些別的資料,主打一個“不會寫也不能空著”的文科生思維。
看似有點笨,但情緒價值拉滿,就像班里那些平庸但能給老師安全感的學生。
使用攻略:
1、需要搜集國內即時資訊時,豆包比起以為自己還活在2023年的DeepSeek強得多。
2、工作以外的日常場景,豆包的語音交互可以讓AI使用體驗更加絲滑,不需要斟酌提示詞。
05 Kimi:勤懇的學術極客研究員
Kimi則像實驗室里的技術宅,癡迷長文本分析與冷門知識挖掘,對于專業一絲不茍,社交技能則接近負數。
和Kimi對話有時讓我想起《IT狂人》里,以“人機感”著稱的Moss,當你讓他幫你修電腦,他給你長篇大論地介紹電腦的各種軟硬件系統的運作方式。
我時常讓Kimi幫我查找數據來源及其鏈接。
當其他AI工具瀏覽幾十個網頁后,仍然羅列出幾篇二次引用的文章時;Kimi已經快準狠地給出原始來源的鏈接,輸出的只有短短一句話。
而當GPT4.5、Grok-3爭相給自己貼上高情商、幽默感的標簽時,Kimi仍然拒絕擬人。模仿人類的情感流露對Kimi來說似乎是累贅。
就連Kimi的推理模型“長思考”(k1.5),其推理過程也更加忠于用戶輸入的字面意思,而不像DeepSeek那樣喜歡猜測用戶的言下之意、無中生有。
使用攻略:
1、硬核內容的學術外掛:創作研究型內容時,利用Kimi處理長文本的能力,輔助查找、閱讀文獻。
2、適用于需要嚴謹、高安全性回答的專業領域。
06 寫在最后
沒有哪個硅基生物是完美的,正如沒有完美的人類。人類之所以有“人格”,就是因為他們的缺陷和閃光點一樣多。正是這種微妙的平衡,才讓人性顯得可愛。而特長各異、缺陷各異的AI們,也開始顯現出它們的可愛之處。
與其造一個完美AI,不如用N個不同性格的AI,來滿足、激發、映照人類自己的N種需求和欲望。它們不光是替我做事,更讓我看到人類優秀品質的最大公約數——比如溫柔、幽默、敏銳、嚴謹。
隨著大模型軍備競賽即將陷入算力內卷,未來的競爭點之一可能就在于——用戶更愿意喜歡什么樣的“AI性格”。我們也期待看到更豐富多樣的“AI性格”。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本文禁止轉載,侵權必究。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)