atypica.AI：用「語言模型」為「主觀世界」建模

原創(chuàng) 贊收藏 評(píng)論

舉報(bào) 2025-04-07

掃描,分享朋友圈

人們不是在處理概率，而是在處理故事。
—— 丹尼爾·卡尼曼
People don't choose between things, they choose between descriptions of things.
—— Daniel Kahneman

商業(yè)研究是一門理解人類決策的學(xué)問。人并不只是根據(jù)純粹理性做決策，而是受到敘事、情感和認(rèn)知偏見的影響。所以，理解影響決策的機(jī)制是商業(yè)研究的核心。我們開發(fā)了一個(gè)商業(yè)研究智能體「atypica.AI」：

通過構(gòu)建「用戶智能體」來「模擬」消費(fèi)者的個(gè)性和認(rèn)知；
通過「專家智能體」與「用戶智能體」的「訪談」來分析消費(fèi)者的行為和決策，并產(chǎn)生報(bào)告。

如果，「物理」為「客觀世界」建模；

那么，「語言模型」則有機(jī)會(huì)為「主觀世界」建模。

atypica.AI能夠捕捉數(shù)據(jù)分析無法處理的人類決策機(jī)制，為個(gè)人和商業(yè)決策問題提供深度洞察。

體驗(yàn)地址：https://atypica.ai/

使用 atypica.AI

登陸atypica.AI，你只需要提出一個(gè)具體商業(yè)研究問題，atypica.AI會(huì)通過10-20分鐘的「長(zhǎng)推理」給出一份詳盡的調(diào)研報(bào)告。

在這10-20分鐘的長(zhǎng)推理中，atypica.AI會(huì)自動(dòng)做如下的工作：

1. <atypica.AI>追問你1-5個(gè)問題，把研究問題弄清楚；

2. <atypica.AI>設(shè)計(jì)一系列工作任務(wù)；

3. <atypica.AI>按照工作任務(wù)瀏覽社交媒體（現(xiàn)在僅瀏覽小紅書，未來會(huì)有更豐富來源）；

4. <atypica.AI>按照瀏覽結(jié)果建立多種「用戶智能體」；

5. <atypica.AI>采訪這些「用戶智能體」，如沒有得到答案，會(huì)繼續(xù)建立「智能體」；

6. <atypica.AI>總結(jié)采訪結(jié)果；

7. <atypica.AI>生成指定視覺風(fēng)格報(bào)告；

「Nerd Stats」會(huì)記錄工作過程中耗費(fèi)多少時(shí)間、步驟、有多少個(gè)智能體角色、耗費(fèi)多少token等，這也是一種智能體的「工作證明」（Proof of Work）。

注：atypica.AI的nerd stats

atypica.AI的使用場(chǎng)景

測(cè)試 / Testing：快速、低成本測(cè)試取消費(fèi)者的反饋

<羅技鼠標(biāo)>在<小紅書>上選題，哪個(gè)會(huì)更受歡迎？
a.【輕薄如羽，性能如虎】羅技MX Keys迷你版陪我高效辦公的日常
b. 從按鍵到芯片：揭秘羅技鍵盤的靜音科技是如何實(shí)現(xiàn)的
c. 一鍵多設(shè)備切換：我用羅技FLOW技術(shù)讓工作效率翻倍的小技巧
d. 30天續(xù)航不是夢(mèng)：羅技鍵盤背后的節(jié)能技術(shù)大揭秘
e. 人體工學(xué)設(shè)計(jì)背后的故事：羅技ERGO K860如何拯救我的腕隧道綜合癥

洞察 / Insight：獲取開放性的消費(fèi)者需求

I am the General Manager of LV (Louis Vuitton) Shanghai. What feedback do customers have about the in-store experience at our Shanghai LV boutiques? What areas need improvement, and what aspects are working well that we should continue to enhance? Please give me a holistic report.

共創(chuàng) / Co-create：與消費(fèi)者共同創(chuàng)造新的商業(yè)想法

和一線城市的年輕父母，一起共創(chuàng)Mars的<脆香米>的新產(chǎn)品想法?

規(guī)劃 / Planning：按照市場(chǎng)需求進(jìn)行商業(yè)規(guī)劃

INAH 銀那無醇葡萄飲市場(chǎng)營(yíng)銷策劃書

歡迎體驗(yàn)atypica.AI

atypica.AI還沒有設(shè)計(jì)好如何商業(yè)化，先發(fā)布一個(gè)「體驗(yàn)版」。

用戶可以免費(fèi)進(jìn)行3個(gè)研究，之后每個(gè)請(qǐng)我們一杯咖啡如何 ??？

atypica.AI「深入研究」和「企業(yè)版」功能

針對(duì)產(chǎn)生的研究結(jié)果可以繼續(xù)下鉆、追問，觸發(fā)「深度研究」功能，該功能將在「atypica.AI企業(yè)版」上線。這一功能使用戶能夠?qū)⒊醪椒治鲎鳛槠瘘c(diǎn)，而非終點(diǎn)，從而開啟更加深入的探索旅程。當(dāng)研究人員發(fā)現(xiàn)初步結(jié)果中的關(guān)鍵洞察時(shí)，可以通過特定提示或命令激活深度研究模式，系統(tǒng)將自動(dòng)展開多層次分析。

「atypica企業(yè)版」部分規(guī)劃能力如下，感興趣請(qǐng)?jiān)陬^像下面點(diǎn)擊「了解企業(yè)版」留資。

調(diào)用工具能力

多模態(tài)內(nèi)容分析、洞察（文字、圖、視頻、富文本等）
更強(qiáng)的報(bào)告推理能力
針對(duì)報(bào)告內(nèi)容進(jìn)行深度下鉆研究
定制化報(bào)告結(jié)構(gòu)設(shè)計(jì)

調(diào)用數(shù)據(jù)能力

接入企業(yè)私有數(shù)據(jù)（通過DAM）
接入抖音
接入互聯(lián)網(wǎng)
接入海外社媒平臺(tái)（Ins、FB、TT等）

權(quán)限安全管理

團(tuán)隊(duì)協(xié)作功能（分享、協(xié)作）
數(shù)據(jù)安全功能（指定可見、有效期）

atypica.AI也可以用在個(gè)人場(chǎng)景

雖然atypica.AI是以商業(yè)研究分析的智能體，但是也可以進(jìn)行一些個(gè)人決策研究，下面????是我們的小伙伴千奇百怪的問題：

開放問題：
為生日晚餐選合適的中餐餐館？

選擇問題：
便攜式顯示器該怎么選？

規(guī)劃問題：
游泳特長(zhǎng)生，該怎么規(guī)劃去美國(guó)或英國(guó)讀高中？

atypica.AI的局限性

輸入問題的質(zhì)量：輸入問題的準(zhǔn)確度，很大程度上決定了報(bào)告的質(zhì)量；
模型精確度局限：斯坦福的研究中表明這種方法可以80%準(zhǔn)確模擬消費(fèi)者的復(fù)雜決策過程，對(duì)高度情感化或情境依賴的決策預(yù)測(cè)有局限，對(duì)新興小眾消費(fèi)群體的模擬不夠準(zhǔn)確（合成橙汁還是和天然橙汁不一樣）；
數(shù)據(jù)整合復(fù)雜性：數(shù)據(jù)質(zhì)量和結(jié)構(gòu)差異大，整合難度高，數(shù)據(jù)干凈度問題可能導(dǎo)致模型扭曲；這種方法更善于模擬用戶的正向和負(fù)向反饋，但是不擅長(zhǎng)模擬用戶的偏見和局限。
創(chuàng)新性預(yù)測(cè)困難：難以預(yù)測(cè)真正突破性的創(chuàng)新反應(yīng)。

atypica.AI的緣起

多智能體：

2023年，斯坦福小鎮(zhèn)的論文（《Generative Agents: Interactive Simulacra of Human Behavior》）讓我們第一次見識(shí)了多智能體互動(dòng)的概念，但是這篇文章并沒有真正的展示智能體是如何進(jìn)行交互的；

注：斯坦福小鎮(zhèn)研究團(tuán)隊(duì)《Generative Agents: Interactive Simulacra of Human Behavior》

語言模型為主觀世界建模：

2024年11月，斯坦福小鎮(zhèn)研究團(tuán)隊(duì)發(fā)表了題為《Generative Agent Simulations of 1,000 People》的開創(chuàng)性論文，該研究成功模擬了1000個(gè)隨機(jī)美國(guó)人的行為模式。研究人員通過AI對(duì)真實(shí)人類進(jìn)行深入采訪，構(gòu)建了能夠準(zhǔn)確反映個(gè)體行為和決策模式的智能體。令人矚目的是，這些智能體與真人的行為一致性高達(dá)85%以上，展現(xiàn)出前所未有的模擬精度。

這項(xiàng)研究揭示了智能體模擬真實(shí)人類行為和進(jìn)行有效訪談的巨大潛力。我們可以用一個(gè)比喻來理解其創(chuàng)新之處：傳統(tǒng)研究用戶(如同研究橙汁)的方法是分析其組成元素(標(biāo)簽)，但即使掌握了全部標(biāo)簽，也難以完整重構(gòu)用戶的復(fù)雜性。而這種新方法則相當(dāng)于將橙汁提煉為精華粉末，再通過語言模型作為"水"將其重新沖調(diào)成橙汁。

雖然這種「合成橙汁」并非完全天然，但它盡量模擬了真實(shí)橙汁的口感、色彩和營(yíng)養(yǎng)特性。這種方法突破了傳統(tǒng)用戶畫像中簡(jiǎn)化、標(biāo)簽化的局限，轉(zhuǎn)而采用更為豐富、語境化的方式來建模人類的主觀世界，為我們理解和預(yù)測(cè)人類行為提供了嶄新視角。

注：斯坦福小鎮(zhèn)研究團(tuán)隊(duì)《Generative Agent Simulations of 1,000 People》

讓模型調(diào)用工具：

2023年12月，OpenAI發(fā)布了GPT-4的Function Calling功能，讓模型能夠調(diào)用外部工具；2024年11月，Claude的MCP協(xié)議，讓我們看到了模型操作工具（比如我們做的內(nèi)容管理工具）的可能性。這種技術(shù)進(jìn)步開創(chuàng)了全新的應(yīng)用場(chǎng)景，使模型不再局限于對(duì)話框內(nèi)的交互，而是能夠主動(dòng)與外部世界建立連接。例如，模型現(xiàn)在可以瀏覽小紅書，自主發(fā)掘有趣的內(nèi)容，篩選潛在的熱點(diǎn)話題，甚至能夠分析內(nèi)容表現(xiàn)和用戶反饋。

發(fā)散優(yōu)先的長(zhǎng)推理模型：

2025年2月，Deepseek R1讓我們看到透明的推理過程，因此知道了怎么來設(shè)計(jì)在基座模型基礎(chǔ)上的推理架構(gòu)。與針對(duì)客觀世界 / 科學(xué)問題的推理方法強(qiáng)調(diào)“收斂”不同，主觀世界 / 商業(yè)問題的推理需要強(qiáng)調(diào)“發(fā)散”。我們定義為四個(gè)維度：

1）學(xué)習(xí)過去的案例

2）靈光乍現(xiàn)

3）反饋的質(zhì)量

4）迭代的數(shù)量

因此我們基于這四個(gè)維度，開始進(jìn)行多步驟、長(zhǎng)發(fā)散的推理模型架構(gòu)“Creative Reasoning”的開發(fā)，從而形成對(duì)通用商業(yè)問題思考、分析、研究的調(diào)優(yōu)；

多智能體的產(chǎn)品形態(tài)：

2025年3月，Manus、Claude的Artefacts、Devin的發(fā)布，讓我們看到了多智能體產(chǎn)品設(shè)計(jì)的可能性。尤其是Manus在如何把智能體工作過程表達(dá)出來，并可以進(jìn)行回放上的產(chǎn)品創(chuàng)新。看到智能體如何工作，確實(shí)可以讓人對(duì)其產(chǎn)生的結(jié)果更有同理心。

注：Claude的Artefacts

注：Manus