atypica.AI:用「語言模型」為「主觀世界」建模
人們不是在處理概率,而是在處理故事。
—— 丹尼爾·卡尼曼
People don't choose between things, they choose between descriptions of things.
—— Daniel Kahneman
商業(yè)研究是一門理解人類決策的學(xué)問。人并不只是根據(jù)純粹理性做決策,而是受到敘事、情感和認(rèn)知偏見的影響。所以,理解影響決策的機(jī)制是商業(yè)研究的核心。我們開發(fā)了一個(gè)商業(yè)研究智能體「atypica.AI」:
通過構(gòu)建「用戶智能體」來「模擬」消費(fèi)者的個(gè)性和認(rèn)知;
通過「專家智能體」與「用戶智能體」的「訪談」來分析消費(fèi)者的行為和決策,并產(chǎn)生報(bào)告。
如果,「物理」為「客觀世界」建模;
那么,「語言模型」則有機(jī)會(huì)為「主觀世界」建模。
atypica.AI能夠捕捉數(shù)據(jù)分析無法處理的人類決策機(jī)制,為個(gè)人和商業(yè)決策問題提供深度洞察。
體驗(yàn)地址:https://atypica.ai/
使用 atypica.AI
登陸atypica.AI,你只需要提出一個(gè)具體商業(yè)研究問題,atypica.AI會(huì)通過10-20分鐘的「長(zhǎng)推理」給出一份詳盡的調(diào)研報(bào)告。
在這10-20分鐘的長(zhǎng)推理中,atypica.AI會(huì)自動(dòng)做如下的工作:
1. <atypica.AI>追問你1-5個(gè)問題,把研究問題弄清楚;
2. <atypica.AI>設(shè)計(jì)一系列工作任務(wù);
3. <atypica.AI>按照工作任務(wù)瀏覽社交媒體(現(xiàn)在僅瀏覽小紅書,未來會(huì)有更豐富來源);
4. <atypica.AI>按照瀏覽結(jié)果建立多種「用戶智能體」;
5. <atypica.AI>采訪這些「用戶智能體」,如沒有得到答案,會(huì)繼續(xù)建立「智能體」;
6. <atypica.AI>總結(jié)采訪結(jié)果;
7. <atypica.AI>生成指定視覺風(fēng)格報(bào)告;
「Nerd Stats」會(huì)記錄工作過程中耗費(fèi)多少時(shí)間、步驟、有多少個(gè)智能體角色、耗費(fèi)多少token等,這也是一種智能體的「工作證明」(Proof of Work)。
注:atypica.AI的nerd stats
atypica.AI的使用場(chǎng)景
測(cè)試 / Testing:快速、低成本測(cè)試取消費(fèi)者的反饋
<羅技鼠標(biāo)>在<小紅書>上選題,哪個(gè)會(huì)更受歡迎?
a.【輕薄如羽,性能如虎】羅技MX Keys迷你版陪我高效辦公的日常
b. 從按鍵到芯片:揭秘羅技鍵盤的靜音科技是如何實(shí)現(xiàn)的
c. 一鍵多設(shè)備切換:我用羅技FLOW技術(shù)讓工作效率翻倍的小技巧
d. 30天續(xù)航不是夢(mèng):羅技鍵盤背后的節(jié)能技術(shù)大揭秘
e. 人體工學(xué)設(shè)計(jì)背后的故事:羅技ERGO K860如何拯救我的腕隧道綜合癥
洞察 / Insight:獲取開放性的消費(fèi)者需求
I am the General Manager of LV (Louis Vuitton) Shanghai. What feedback do customers have about the in-store experience at our Shanghai LV boutiques? What areas need improvement, and what aspects are working well that we should continue to enhance? Please give me a holistic report.
共創(chuàng) / Co-create:與消費(fèi)者共同創(chuàng)造新的商業(yè)想法
和一線城市的年輕父母,一起共創(chuàng)Mars的<脆香米>的新產(chǎn)品想法?
規(guī)劃 / Planning:按照市場(chǎng)需求進(jìn)行商業(yè)規(guī)劃
INAH 銀那無醇葡萄飲市場(chǎng)營(yíng)銷策劃書
歡迎體驗(yàn)atypica.AI
atypica.AI還沒有設(shè)計(jì)好如何商業(yè)化,先發(fā)布一個(gè)「體驗(yàn)版」。
用戶可以免費(fèi)進(jìn)行3個(gè)研究,之后每個(gè)請(qǐng)我們一杯咖啡如何 ???
atypica.AI「深入研究」和「企業(yè)版」功能
針對(duì)產(chǎn)生的研究結(jié)果可以繼續(xù)下鉆、追問,觸發(fā)「深度研究」功能,該功能將在「atypica.AI企業(yè)版」上線。這一功能使用戶能夠?qū)⒊醪椒治鲎鳛槠瘘c(diǎn),而非終點(diǎn),從而開啟更加深入的探索旅程。當(dāng)研究人員發(fā)現(xiàn)初步結(jié)果中的關(guān)鍵洞察時(shí),可以通過特定提示或命令激活深度研究模式,系統(tǒng)將自動(dòng)展開多層次分析。
「atypica企業(yè)版」部分規(guī)劃能力如下,感興趣請(qǐng)?jiān)陬^像下面點(diǎn)擊「了解企業(yè)版」留資。
調(diào)用工具能力
多模態(tài)內(nèi)容分析、洞察(文字、圖、視頻、富文本等)
更強(qiáng)的報(bào)告推理能力
針對(duì)報(bào)告內(nèi)容進(jìn)行深度下鉆研究
定制化報(bào)告結(jié)構(gòu)設(shè)計(jì)
調(diào)用數(shù)據(jù)能力
接入企業(yè)私有數(shù)據(jù)(通過DAM)
接入抖音
接入互聯(lián)網(wǎng)
接入海外社媒平臺(tái)(Ins、FB、TT等)
權(quán)限安全管理
團(tuán)隊(duì)協(xié)作功能(分享、協(xié)作)
數(shù)據(jù)安全功能(指定可見、有效期)
atypica.AI也可以用在個(gè)人場(chǎng)景
雖然atypica.AI是以商業(yè)研究分析的智能體,但是也可以進(jìn)行一些個(gè)人決策研究,下面????是我們的小伙伴千奇百怪的問題:
開放問題:
為生日晚餐選合適的中餐餐館?
選擇問題:
便攜式顯示器該怎么選?
規(guī)劃問題:
游泳特長(zhǎng)生,該怎么規(guī)劃去美國(guó)或英國(guó)讀高中?
atypica.AI的局限性
輸入問題的質(zhì)量:輸入問題的準(zhǔn)確度,很大程度上決定了報(bào)告的質(zhì)量;
模型精確度局限:斯坦福的研究中表明這種方法可以80%準(zhǔn)確模擬消費(fèi)者的復(fù)雜決策過程,對(duì)高度情感化或情境依賴的決策預(yù)測(cè)有局限,對(duì)新興小眾消費(fèi)群體的模擬不夠準(zhǔn)確(合成橙汁還是和天然橙汁不一樣);
數(shù)據(jù)整合復(fù)雜性:數(shù)據(jù)質(zhì)量和結(jié)構(gòu)差異大,整合難度高,數(shù)據(jù)干凈度問題可能導(dǎo)致模型扭曲;這種方法更善于模擬用戶的正向和負(fù)向反饋,但是不擅長(zhǎng)模擬用戶的偏見和局限。
創(chuàng)新性預(yù)測(cè)困難:難以預(yù)測(cè)真正突破性的創(chuàng)新反應(yīng)。
atypica.AI的緣起
多智能體:
2023年,斯坦福小鎮(zhèn)的論文(《Generative Agents: Interactive Simulacra of Human Behavior》)讓我們第一次見識(shí)了多智能體互動(dòng)的概念,但是這篇文章并沒有真正的展示智能體是如何進(jìn)行交互的;
注:斯坦福小鎮(zhèn)研究團(tuán)隊(duì)《Generative Agents: Interactive Simulacra of Human Behavior》
語言模型為主觀世界建模:
2024年11月,斯坦福小鎮(zhèn)研究團(tuán)隊(duì)發(fā)表了題為《Generative Agent Simulations of 1,000 People》的開創(chuàng)性論文,該研究成功模擬了1000個(gè)隨機(jī)美國(guó)人的行為模式。研究人員通過AI對(duì)真實(shí)人類進(jìn)行深入采訪,構(gòu)建了能夠準(zhǔn)確反映個(gè)體行為和決策模式的智能體。令人矚目的是,這些智能體與真人的行為一致性高達(dá)85%以上,展現(xiàn)出前所未有的模擬精度。
這項(xiàng)研究揭示了智能體模擬真實(shí)人類行為和進(jìn)行有效訪談的巨大潛力。我們可以用一個(gè)比喻來理解其創(chuàng)新之處:傳統(tǒng)研究用戶(如同研究橙汁)的方法是分析其組成元素(標(biāo)簽),但即使掌握了全部標(biāo)簽,也難以完整重構(gòu)用戶的復(fù)雜性。而這種新方法則相當(dāng)于將橙汁提煉為精華粉末,再通過語言模型作為"水"將其重新沖調(diào)成橙汁。
雖然這種「合成橙汁」并非完全天然,但它盡量模擬了真實(shí)橙汁的口感、色彩和營(yíng)養(yǎng)特性。這種方法突破了傳統(tǒng)用戶畫像中簡(jiǎn)化、標(biāo)簽化的局限,轉(zhuǎn)而采用更為豐富、語境化的方式來建模人類的主觀世界,為我們理解和預(yù)測(cè)人類行為提供了嶄新視角。
注:斯坦福小鎮(zhèn)研究團(tuán)隊(duì)《Generative Agent Simulations of 1,000 People》
讓模型調(diào)用工具:
2023年12月,OpenAI發(fā)布了GPT-4的Function Calling功能,讓模型能夠調(diào)用外部工具;2024年11月,Claude的MCP協(xié)議,讓我們看到了模型操作工具(比如我們做的內(nèi)容管理工具)的可能性。這種技術(shù)進(jìn)步開創(chuàng)了全新的應(yīng)用場(chǎng)景,使模型不再局限于對(duì)話框內(nèi)的交互,而是能夠主動(dòng)與外部世界建立連接。例如,模型現(xiàn)在可以瀏覽小紅書,自主發(fā)掘有趣的內(nèi)容,篩選潛在的熱點(diǎn)話題,甚至能夠分析內(nèi)容表現(xiàn)和用戶反饋。
發(fā)散優(yōu)先的長(zhǎng)推理模型:
2025年2月,Deepseek R1讓我們看到透明的推理過程,因此知道了怎么來設(shè)計(jì)在基座模型基礎(chǔ)上的推理架構(gòu)。與針對(duì)客觀世界 / 科學(xué)問題的推理方法強(qiáng)調(diào)“收斂”不同,主觀世界 / 商業(yè)問題的推理需要強(qiáng)調(diào)“發(fā)散”。我們定義為四個(gè)維度:
1)學(xué)習(xí)過去的案例
2)靈光乍現(xiàn)
3)反饋的質(zhì)量
4)迭代的數(shù)量
因此我們基于這四個(gè)維度,開始進(jìn)行多步驟、長(zhǎng)發(fā)散的推理模型架構(gòu)“Creative Reasoning”的開發(fā),從而形成對(duì)通用商業(yè)問題思考、分析、研究的調(diào)優(yōu);
多智能體的產(chǎn)品形態(tài):
2025年3月,Manus、Claude的Artefacts、Devin的發(fā)布,讓我們看到了多智能體產(chǎn)品設(shè)計(jì)的可能性。尤其是Manus在如何把智能體工作過程表達(dá)出來,并可以進(jìn)行回放上的產(chǎn)品創(chuàng)新。看到智能體如何工作,確實(shí)可以讓人對(duì)其產(chǎn)生的結(jié)果更有同理心。
注:Claude的Artefacts
注:Manus
atypica.AI的皮膚:
來自于代表極客精神的快樂嬉皮鬼社區(qū)HippyGhosts.io,每一個(gè)「智能體」的物理化身都是一枚「hippy ghost」。
立即體驗(yàn):https://atypica.ai/
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
暫無評(píng)論哦,快來評(píng)論一下吧!
全部評(píng)論(0條)