带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度

一篇關(guān)于阿里云與中國大模型的 「頂流群聊」筆記

轉(zhuǎn)載 3 收藏3 評(píng)論
舉報(bào) 2023-09-05


文:張鵬 來源:極客
原標(biāo)題:《8.23 中國大模型「頂流群聊」筆記》


國內(nèi)的科技創(chuàng)新歷史上,從沒有哪一次像大模型技術(shù)這樣,短短幾個(gè)月就建立了「科技圈共識(shí)」。

1998 年入行科技圈,見證了 PC 時(shí)代、互聯(lián)網(wǎng)時(shí)代、移動(dòng)互聯(lián)網(wǎng)時(shí)代這幾個(gè)時(shí)代變遷,從來沒見過這么迅猛的「共識(shí)達(dá)成速度」。就拿極客公園的創(chuàng)業(yè)者社區(qū) Founder Park 來說,因?yàn)楸容^早關(guān)注到大模型領(lǐng)域的技術(shù)變化,在短短 4 個(gè)月時(shí)間就新增了 15 萬關(guān)注者,社區(qū)成員已經(jīng)擴(kuò)充到七八千人之多。

就在昨天,首批國產(chǎn)大模型通過備案,又點(diǎn)燃了人們的熱情。備案制管理,意味著對(duì)大模型發(fā)展的政策上的寬松,這也意味著大模型在國內(nèi)的商用和產(chǎn)業(yè)化將真正開啟。

只不過「共識(shí)」達(dá)成的太快也會(huì)有讓人擔(dān)心的地方,因?yàn)檫@個(gè)技術(shù)還在早期發(fā)展階段,也還做不到「水銀瀉地」般落地到廣泛領(lǐng)域。客觀地說,如果相信大模型技術(shù)帶來了 AGI 的曙光,那么就要坦誠看到其真正產(chǎn)品化,并成為生產(chǎn)力,現(xiàn)在才算開始探索。

那些在一線的創(chuàng)業(yè)公司經(jīng)歷的 KnowHow 和問題,恰恰是最值得被匯聚起來的星星之火。

基于這個(gè)想法,阿里云聯(lián)合 Founder Park 邀請(qǐng)了 20 多位中國大模型領(lǐng)域模型層、工具層、應(yīng)用層的優(yōu)秀創(chuàng)業(yè)者,到杭州西溪濕地做了一場(chǎng)面對(duì)面的閉門交流。阿里云董事長張勇還給這場(chǎng)閉門會(huì)取了一個(gè)很好的名字——「西溪論道」。

這場(chǎng)長達(dá)五個(gè)小時(shí)的閉門會(huì),張勇就坐在我旁邊,全程參與到創(chuàng)業(yè)者的群聊,我看他筆記就寫滿了好幾頁紙。


8 月 23 號(hào),西溪論道參會(huì)者合影

看得出來,阿里云作為算力基礎(chǔ)設(shè)施層應(yīng)該如何與這幾個(gè)層面連接與共創(chuàng),如何支持各個(gè)層面的創(chuàng)業(yè)者做好大模型用好大模型,這是張勇最關(guān)心的話題。這顯示了阿里云跟國內(nèi)其他公司完全不同的姿態(tài),如何促進(jìn)大模型生態(tài)繁榮才是阿里云最關(guān)心的事情。

這些堪稱國內(nèi)大模型領(lǐng)域最積極最活躍的力量,從下午兩點(diǎn)一直聊到了晚上九點(diǎn),從產(chǎn)業(yè)的多個(gè)層面,立體地做了交流碰撞,也從各自的最新實(shí)踐中聊出了很多有洞見的觀點(diǎn)。按照他們的說法,在這里一起討論,聽到了很多真話,很多「真情實(shí)感」。

我整理了一部分印象深刻的要點(diǎn),用這篇文章也分享給大家。


01
關(guān)注大模型,更需要關(guān)注 infra

現(xiàn)在全球任何一個(gè)地方,做大模型,最稀缺的資源除了人才,就是 GPU。百川智能創(chuàng)始人&CEO 王小川分享他去硅谷和朋友聊到,英偉達(dá)一年的 GPU 出貨量在 100 萬顆,但 OpenAI 說要設(shè)計(jì) 1000 萬顆 GPU 連在一塊的超算。

所以 GPU 到底多少算夠,有限的算力有解嗎?創(chuàng)新工場(chǎng)董事長、零一萬物創(chuàng)始人李開復(fù)表示,盡管千萬張 GPU 是天方夜譚,但是「大力出奇跡」的暴力美學(xué)是有背景的。

強(qiáng)化學(xué)習(xí)之父 Richard Sutton 在《The Bitter Lesson》(《痛苦的教訓(xùn)》)中指出:過去七十年,想在 AI 里放一點(diǎn)知識(shí)進(jìn)去,想要增加一點(diǎn)能力,想調(diào)一調(diào)模型架構(gòu),最后發(fā)現(xiàn)基本沒有價(jià)值。唯一推動(dòng)過去七十年 AI 進(jìn)步的力量就是一個(gè)通用且可擴(kuò)張的計(jì)算能力。

計(jì)算能力增強(qiáng)了,相應(yīng)地帶動(dòng)算法、帶動(dòng)數(shù)據(jù)的進(jìn)步,這是大力出奇跡的背景。因此,在這波大模型浪潮中跑出來的公司首先要有算力,幾個(gè)人、幾十張卡的「稟賦」,還是去選擇調(diào)用中心化的大模型可能更務(wù)實(shí)。

當(dāng)有了相對(duì)足夠的算力,在這個(gè)前提下好好利用算力,可以做出很多今天只用開源、只調(diào) Llama2(Meta 的大語言模型)做不出來的東西」。前有 OpenAI 不計(jì)成本地設(shè)立模型新標(biāo)桿,后有 Meta 開源為所有人鋪平道路,在風(fēng)云詭譎、高度不確定的大模型創(chuàng)業(yè)環(huán)境中,這是李開復(fù)對(duì)大模型公司新目標(biāo)和新實(shí)踐的思考。

這個(gè)打法是什么?怎么讓一塊 GPU 發(fā)揮兩塊、甚至三塊的能力?

這個(gè)問題可能要在團(tuán)隊(duì)構(gòu)成上更加講究。李開復(fù)認(rèn)為,Infra(硬件底層)團(tuán)隊(duì)必須比 Modelling(模型)團(tuán)隊(duì)還要強(qiáng)大。他說很快大家就會(huì)發(fā)現(xiàn),做過大模型 Infra 的人比做大模型的人還要貴、更稀缺;會(huì)做 Scaling Law(擴(kuò)展定律,模型能力隨著訓(xùn)練計(jì)算量增加而提升)的人比會(huì)做大模型 Infra 的人更稀缺

因?yàn)閮?yōu)秀的 Scaling 團(tuán)隊(duì)可以規(guī)避徒勞無功的訓(xùn)練,當(dāng)做訓(xùn)練的時(shí)候,大概率會(huì)成功,一旦不成功,也有能力馬上叫停,有足夠的數(shù)學(xué)能力來做這件事情。除此之外還有很多微妙的細(xì)節(jié)和經(jīng)驗(yàn),比如,讀通論文也會(huì)少走很多彎路,因?yàn)橛行┱撐氖枪室獍巡蛔嘈У臇|西寫出來,不會(huì)很容易被帶偏。其實(shí)客觀來看,GPU 短缺這個(gè)問題,不只是中國創(chuàng)業(yè)者的問題,全球創(chuàng)業(yè)者都要面對(duì)。

所以,怎么把有限的算力做好,會(huì)成為大模型公司角逐的關(guān)鍵。李開復(fù)就提到一個(gè)明確的觀點(diǎn):大模型團(tuán)隊(duì)每一個(gè)位置都要有人才,Pre Train(預(yù)訓(xùn)練)、Post Train(訓(xùn)練后)、Multi-Modal(多模態(tài)),Scaling Up(可擴(kuò)展性),Inference(推理)等等都有其重要性。其中,Infra 團(tuán)隊(duì)這部分人才更稀缺,更應(yīng)該被重視。其實(shí)除了創(chuàng)業(yè)者自己對(duì)大模型要精進(jìn)更深入的理解,也需要更多維度的技術(shù)創(chuàng)新,比如現(xiàn)場(chǎng)一位 infra 層的創(chuàng)業(yè)者,墨芯創(chuàng)始人&CEO 王維就分享了一個(gè)計(jì)算上的解決方案——稀疏計(jì)算。

讓我看到了云端和終端 AI 芯片加速方案通過優(yōu)化計(jì)算模式,能將神經(jīng)網(wǎng)絡(luò)開發(fā)全面稀疏化,提供超高算力、超低功耗的通用 AI 計(jì)算平臺(tái)的可能性。


02
ChatGPT 點(diǎn)燃熱情,Llama2 讓人腳踏實(shí)地

如果說 ChatGPT 點(diǎn)燃了很多創(chuàng)業(yè)者的熱情,那么Meta 開源的 LLaMA和 LIama2,就讓絕大部分創(chuàng)業(yè)者在基礎(chǔ)模型的起跑線上「眾生平等」了。

但未來朝著什么方向發(fā)展,創(chuàng)業(yè)者根據(jù)自己的資源稟賦、能力結(jié)構(gòu),顯然會(huì)有不同的使命和愿景。對(duì)于仍選擇做基座大模型的創(chuàng)業(yè)者而言,開源的底座只是起點(diǎn)。

李開復(fù)就指出,盡管在跟 GPT-3、GPT3.5 等 SOTA(state of the art,先進(jìn))模型的各種評(píng)比中,Llama2 的差距不大。但實(shí)際上用起來,今天 Llama2 的能力跟 GPT-4,以及 Bard(谷歌的大語言模型)的下一個(gè)版本,差別巨大


圖片來源:Meta

這看起來也給了做大模型的企業(yè)一些騰挪空間,在未來,「真有錢」、「真有本事」的大模型創(chuàng)業(yè)者,有機(jī)會(huì)切換到一個(gè) New Bard 或者 New GPT-4 的打法。

另一方面,不少創(chuàng)業(yè)者表示,Meta 開源帶給業(yè)界的觸動(dòng)很大,「今天 xxx 可能還是中國最好的模型,但明天它可能就被超越了。甚至突然有一天會(huì)發(fā)現(xiàn)你原來練的那些模型基本都沒啥用,當(dāng)技術(shù)換代或者更強(qiáng)的開源模型出來,過去的投入可能完全「打水漂」,比如開源模型在預(yù)訓(xùn)練上看了一萬億的英文 Token,你自己的模型非要再看一遍,可能毫無意義。」

出門問問創(chuàng)始人&CEO 李志飛認(rèn)為,要充分看到開源帶來的深遠(yuǎn)影響。「大家雖然都有偉大的理想和抱負(fù),但取決于是否有足夠多的經(jīng)費(fèi)來支撐到那一天。所以要腳踏實(shí)地得看到那,活著可能比什么都重要。」

瀾舟科技 CEO 周明也認(rèn)為,很多原先想做「最好大模型」的企業(yè),其實(shí)需要重新思考創(chuàng)業(yè)的生態(tài)位,選擇擁抱開源,在開源的底座上做「為我所用」的東西。比如英文開源的模型在中文能力上較弱,也沒有在行業(yè)場(chǎng)景、數(shù)據(jù)中打磨過,這恰好是創(chuàng)業(yè)團(tuán)隊(duì)的機(jī)會(huì)。在這一點(diǎn)上,瀾舟科技把開源模型當(dāng) L0 底座,在這之上,做 L1 語言模型、L2 行業(yè)模型、L3 場(chǎng)景模型。

周明認(rèn)為,這樣一層一層做好,跟客戶通過 AI Agents(代理)來互動(dòng)得到反饋,模型一點(diǎn)點(diǎn)迭代,會(huì)逐漸建立壁壘。即便未來有更好的開源模型出現(xiàn),也有辦法在它的基礎(chǔ)上再重新訓(xùn)練或繼續(xù)迭代。「開源模型『水漲船高』,你隨著比你厲害的人的成長而成長。」用好開源模型,也是一種壁壘和門檻。

這可能和很多人想象的不太一樣。

甚至有人會(huì)問,基于開源模型做,還算做大模型嗎?另一邊,很多企業(yè)自身也避談使用了開源模型這一話題。其實(shí),基于開源模型做,后續(xù)的投入門檻并不低,能力要求也不低,用開源只是有效降低了冷啟動(dòng)的成本,對(duì)創(chuàng)業(yè)者這并不丟人。

比如:李志飛分析認(rèn)為,一個(gè)開源模型可能看過 1 萬億 Token 的數(shù)據(jù),幫你省了幾百萬美金,模型廠商需要接著再往下訓(xùn)模型。最終要把模型做到 State of the art(SOTA,特指領(lǐng)先水平的大模型)的水平,數(shù)據(jù)清洗、預(yù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí),各個(gè)步驟都不能少,每年算力可能千萬美元起,并不見得一下子門檻就沒了,更不是使用開源模型就不用繼續(xù)投入了。

從這個(gè)角度來看,開源模型是更務(wù)實(shí)的選擇,優(yōu)化、訓(xùn)練出實(shí)用的模型反而也是真本事。基于開源,有機(jī)會(huì)做出很好的大模型,核心是能夠擁有相對(duì)領(lǐng)先的認(rèn)知,有持續(xù)迭代模型的能力


03
大模型 ToB 現(xiàn)狀和實(shí)踐

模型能力的提升是一方面,落到客戶場(chǎng)景,又是另一回事。

從客戶的角度來看,大模型,「大」并不是唯一的追求,甚至完全不一定是客戶想要的。有創(chuàng)業(yè)者就分享了特別現(xiàn)實(shí)的客戶場(chǎng)景:真正去跟 B 端客戶談,客戶只需要語言理解、多輪對(duì)話和一定的推理能力,其他的 AGI(通用人工智能)能力一概不要。

客戶向他反映說,其他功能反倒帶來了麻煩,「幻象」(Hallucination)問題解決不了,而且客戶原本有很多 AI 1.0 的模型,本來用得好好的,為什么要扔掉不用,AI2.0 并不需要覆蓋 1.0 的能力,能合理調(diào)用就挺好。這也解釋為何在國內(nèi)外 RPA 領(lǐng)域是引入大模型最積極的。

來也科技聯(lián)合創(chuàng)始人&CEO 汪冠春今年在國內(nèi)市場(chǎng)也驗(yàn)證了客戶有這方面的明確需求。這種情況下,只要把自然語言理解清楚了,把參數(shù)傳過來調(diào)用 AI 1.0 的模型以及外部數(shù)據(jù)庫,結(jié)果是可靠的,成本也比較低,最后再用大模型把結(jié)果組裝起來,形成一個(gè)報(bào)告。

模型在這里起到了任務(wù)分發(fā)的作用:分成子任務(wù)、每個(gè)子任務(wù)調(diào)用什么。在子任務(wù)里,有些大模型支撐的,有些是原來的統(tǒng)計(jì)模型,有些甚至都不是自己的,而是某個(gè)第三方的模型,客戶最后要的,只要能完成任務(wù)就行。嘗試找到這樣的 PMF(Product Market Fit,產(chǎn)品市場(chǎng)匹配)后,如果只做這種 To B,其模型能力包含語言理解、多輪對(duì)話和少量的推理,這個(gè)模型并不需要很大,100 億到 1000 億的模型,就相對(duì)夠了。

相應(yīng)地,需要在幾百張卡的基礎(chǔ)上,把語言理解多輪對(duì)話做好,并且有一定的推理能力,再加上 AI Agents,基本上能完成客戶在很多場(chǎng)景下的需求了。一個(gè)通用的大模型,并不意味著可以解決所有問題。B 端客戶的很多場(chǎng)景,通用大模型放上去并不奏效。這意味著模型需要越來越多,有越來越可收斂的場(chǎng)景,也意味著需要更多力量參與進(jìn)來幫助技術(shù)和場(chǎng)景的對(duì)齊,而不是一個(gè)萬能的技術(shù)去適配所有場(chǎng)景。

瀾舟科技 CEO 周明認(rèn)為,必須要把用戶數(shù)據(jù)、行業(yè)數(shù)據(jù),甚至圖譜或者規(guī)則,放到模型里繼續(xù)訓(xùn)練,這是行業(yè)大模型存在的必要性。在通用大模型不能覆蓋到的局部行業(yè),加入這樣的數(shù)據(jù),能把行業(yè)問題解決得很好,而且還能克服很多幻象問題。

我記得李志飛也補(bǔ)充了這一視角,他認(rèn)為,通用大模型與垂直大模型,各盡其用,魚與熊掌不可兼得。模型特別大,就意味著推理成本非常高。而且,一個(gè)做芯片設(shè)計(jì)的大模型,去回答電影、明星等娛樂內(nèi)容,也沒有意義。他認(rèn)為,To B 更多是要垂直和可靠,而通用在于智商,有很強(qiáng)的推理能力、邏輯能力,很豐富的知識(shí)。這不一定是 To B 目前階段需要的。與此同時(shí),國內(nèi)各行各業(yè)對(duì)于在業(yè)務(wù)中加入大模型的需求,是非常強(qiáng)烈的。

藍(lán)湖創(chuàng)始人&CEO 任洋輝,和 Moka 聯(lián)合創(chuàng)始人&CEO 李國興,這兩家 SaaS 公司產(chǎn)品接入大模型后,已經(jīng)得到了客戶的認(rèn)可,真正收到了錢。通過對(duì)這兩位創(chuàng)業(yè)者從 2、3 月份到 7、8 月份的狀態(tài)變化的觀察,我發(fā)現(xiàn)SaaS 領(lǐng)域中越早看到大模型帶來的技術(shù)變化是「重新定義軟件」級(jí)別的,敢于拿出「向死而生」的思維來實(shí)踐這個(gè)「重新定義」的進(jìn)程,基本上幾個(gè)月就會(huì)破除焦慮,并且讓人看到希望。

所以,手里拿著客戶和場(chǎng)景的創(chuàng)業(yè)者,搞不好會(huì)是那些大模型創(chuàng)業(yè)者的更早獲得技術(shù)紅利的受益者。因?yàn)槁涞骄唧w場(chǎng)景下,大模型其實(shí)就會(huì)有不一樣的追求。

比如:華深智藥創(chuàng)始人&CEO 彭健表示,大模型帶來的幻象(Hallucination)對(duì)藥物設(shè)計(jì)這樣的 AI for Science 領(lǐng)域可能是有益的,某種程度上,所謂幻覺在某些領(lǐng)域就是智能的意義所在,因?yàn)檫@可以幫助設(shè)計(jì)出人想不到的蛋白質(zhì)組合方案。

就像智譜 AI 作為國內(nèi)大模型落地案例跑得最多最快的一家,其 CSO 張闊在實(shí)踐中就認(rèn)為,對(duì)未來大模型的價(jià)值來說,「20% 可能是中心化的,80% 會(huì)是非中心化的」,也就是說用更豐富的、更多種類的大模型具體到客戶場(chǎng)景里去產(chǎn)生價(jià)值,而不只是一個(gè)大模型無限泛化能力去解決所有問題,這是一種必然的趨勢(shì)。而這也得到了一起交流的很多創(chuàng)業(yè)者的認(rèn)同。


04
AGI 值得獻(xiàn)身,但也不要「玩命」

大模型是 AI 的一個(gè)分水嶺。過去,人工智能是在封閉的系統(tǒng)追求確定的目標(biāo),比如人臉識(shí)別系統(tǒng)追求百分之百準(zhǔn)確,但現(xiàn)在,大模型帶來的「涌現(xiàn)」是一種開放的智能,產(chǎn)生各種各樣的可能性,超出設(shè)計(jì)者預(yù)料之外,這是智能真正的特點(diǎn),也是人工智能六七十年來最大的一個(gè)變化。

出現(xiàn)這樣一種新的智能系統(tǒng)之后,未來大家都能很便利地、低成本地地獲得智力,就像電力革命一樣。智源人工智能研究院院長黃鐵軍認(rèn)為,這次技術(shù)變革向下傳遞得很快,從大廠到創(chuàng)業(yè)公司迅速共識(shí):

這是一個(gè)新時(shí)代的開始

在這個(gè)時(shí)代不干點(diǎn)啥,好像對(duì)不起這個(gè)時(shí)代,對(duì)不起技術(shù)的發(fā)展。而 4 月份下場(chǎng)的百川智能算是目前國內(nèi)做大模型最「卷」的一家,保持平均 28 天發(fā)一個(gè)模型的節(jié)奏,百川智能創(chuàng)始人&CEO 王小川雖然不承認(rèn)自己在「卷」,但他分享了快速落地的法門:比如搜索技術(shù)有積累的團(tuán)隊(duì),對(duì)數(shù)據(jù)處理問題上是有很大幫助的。

而且通過引入搜索增強(qiáng)、強(qiáng)化學(xué)習(xí),以及其他配套性的全棧技術(shù),確實(shí)可以來幫助模型做得更好。「如果看一下現(xiàn)在場(chǎng)內(nèi)技術(shù)公司的高層背景,你會(huì)發(fā)現(xiàn)很多技術(shù)做的不錯(cuò)的都有搜索背景,這里面體現(xiàn)了一些技術(shù)的邏輯正在逐漸被看清楚。」

不過黃鐵軍認(rèn)為,從科研角度來說,我們依舊只是進(jìn)入一個(gè)偉大時(shí)代的早期,如果類比電力時(shí)代,今天這樣一個(gè)智力時(shí)代,其實(shí)就是當(dāng)年法拉第搞發(fā)電機(jī),一旋轉(zhuǎn),電流產(chǎn)生了;現(xiàn)在是用大數(shù)據(jù)訓(xùn)模型把智力訓(xùn)練出來了,這是一個(gè)階段。

后邊我們還需要一個(gè)人——麥克斯韋,因?yàn)楹筮呺姶艑W(xué)的確立,才是電力在人類社會(huì)開始靠譜可用、并推動(dòng)工業(yè)革命的前提。今天的大模型還有很多東西是黑匣子,一方面大模型的「上限」還有巨大提升空間,AIGC 很多時(shí)候能帶來巨大驚喜,但另一方面大模型的「下限」卻還不能保持足夠穩(wěn)定,這個(gè)時(shí)候理解技術(shù)的邊界,合理的設(shè)定目標(biāo)和要解決的問題,是很有必要的。

有人要解決上限的探索,有人要解決下限的穩(wěn)定。對(duì)創(chuàng)業(yè)者們來說,AGI(通用人工智能)曙光已經(jīng)出現(xiàn),這是一件值得投身的事業(yè),但也不要「玩命」。


圖片來源:視覺中國

另一邊,除了等待大模型技術(shù)更進(jìn)一步,很多中間層的創(chuàng)業(yè)者在改進(jìn)讓大模型落地到應(yīng)用的環(huán)境。BentoML 亞太區(qū)負(fù)責(zé)人劉聰稱,和之前傳統(tǒng)機(jī)器學(xué)習(xí)相比,海外客戶基本都能拿到一些預(yù)算來做大模型相關(guān)的產(chǎn)品原型或者 Demo。

但現(xiàn)在還沒有進(jìn)入生產(chǎn)環(huán)境,去為公司產(chǎn)生商業(yè)價(jià)值,而很多做中間層的創(chuàng)業(yè)者看到了這個(gè)機(jī)會(huì)。Dify.ai 創(chuàng)始人&CEO 張路宇的創(chuàng)業(yè)洞察也正源于此,他說,在開發(fā)者視角,拿到模型是不夠的。他分享了一個(gè)數(shù)據(jù),在對(duì)六萬多個(gè)應(yīng)用的樣本做分析后,發(fā)現(xiàn)現(xiàn)在投產(chǎn)或者接近投產(chǎn)的,這個(gè)比例差不多是 5%。有對(duì)模型技術(shù)不是很滿意的,也有團(tuán)隊(duì)工作流還沒有適應(yīng) AI 應(yīng)用開發(fā)的。

相應(yīng)地,張路宇團(tuán)隊(duì)針對(duì)現(xiàn)在投產(chǎn)可能性更高的應(yīng)用,去做一些專項(xiàng)能力。比如他們有一個(gè)指標(biāo)叫消費(fèi)者摩擦度的改進(jìn),看 AI 在這件事上能提供多大的價(jià)值,提供相應(yīng)的能力。Zilliz 創(chuàng)始人&CEO 星爵補(bǔ)充了這一視角,他認(rèn)為一個(gè)極度簡(jiǎn)單的開發(fā)棧,是AI民主化的一個(gè)前提,基于這個(gè)判斷,他提出了 CVP(大模型+向量數(shù)據(jù)庫+提示詞工程)這樣的開發(fā)棧。


05
如何通向 AI native?

什么是 AI 時(shí)代的的 Killer App(殺手級(jí)應(yīng)用),在今年 3 月微軟發(fā)布 Copilot 之際,很多人的好奇被瞬間點(diǎn)燃。

但在這次閉門會(huì)上,李開復(fù)提出了一個(gè)不同的視角,Copilot 不算是 all in 大模型的產(chǎn)品

他認(rèn)為,從移動(dòng)互聯(lián)網(wǎng)最成功的產(chǎn)品之一微信來看,放棄 compatibility(兼容性)很重要。做得最早的是 MSN、QQ,但是勝出的是微信,因?yàn)閺埿↓堊隽艘粋€(gè)決策,既然是移動(dòng)互聯(lián)網(wǎng)的時(shí)代,就不要 PC 了,微信在早期專注在移動(dòng)互聯(lián)網(wǎng)的特質(zhì)上,百分百押注到新的技術(shù)平臺(tái)上。

從這個(gè)視角看,AI native(AI 原生)的應(yīng)用可能有這樣的特征:如果大模型拿掉了,應(yīng)用就崩潰了,它是一個(gè)完全依靠大模型能力的應(yīng)用。但拿掉 Copilot,Office 軟件還是 Office,AI 只是錦上添花。

這一觀點(diǎn)得到了現(xiàn)場(chǎng)創(chuàng)業(yè)者最多的認(rèn)同,也引發(fā)了大家?guī)е@個(gè)定義,對(duì) AI native 應(yīng)用的探討。前段時(shí)間爆火的產(chǎn)品妙鴨,其產(chǎn)品負(fù)責(zé)人張?jiān)鹿庹J(rèn)為,沒有大模型,就沒有妙鴨,這跟李開復(fù)對(duì) AI first,AI native 的思考一致。他認(rèn)為,妙鴨作為率先出圈的應(yīng)用,最重要的是解決了可控性

妙鴨團(tuán)隊(duì)一開始沒有想做底層模型的工作,更關(guān)注怎么才能用現(xiàn)存生態(tài)上開源愛好者開發(fā)的各種插件和小模型做可控性。錨定了最重要的事情是可控性,妙鴨把照片質(zhì)量做到平均分 90 分以上,也迎來了快速成功。

「我們?cè)趹?yīng)用層特別關(guān)注怎么才能讓模型更可控,就發(fā)現(xiàn)在圖像賽道上,已經(jīng)有一些相對(duì)可控的技術(shù)了。可能語言賽道上,如果出現(xiàn)這樣的東西,會(huì)對(duì)上層應(yīng)用創(chuàng)業(yè)者是一個(gè)質(zhì)變時(shí)刻」。

張?jiān)鹿獾膶?shí)踐給了做大模型應(yīng)用的公司一些啟發(fā),可控性可能是 AI native 應(yīng)用誕生的條件。Stability. AI China Lead 鄭屹州也觀察到了這樣的趨勢(shì),開源社區(qū)貢獻(xiàn)者解決可控性后,大量應(yīng)用冒出來了。在探索新一代應(yīng)用上,元石科技創(chuàng)始人李巖指出,大模型帶來的推理能力,是新一代產(chǎn)品的本質(zhì)不同。

而社交+Agent 是被看好的一個(gè)機(jī)會(huì),并且一定會(huì)是最早一批 AI native 的產(chǎn)品,但這很可能需要?jiǎng)?chuàng)業(yè)者具備從大模型到產(chǎn)品的「端到端」的構(gòu)建能力。比如,李志飛分享了和 Character.ai 探討為什么后者要做自己的大模型時(shí),對(duì)方表示,因?yàn)橛?/strong>OpenAI或者谷歌這樣的中心化大模型,不會(huì)回答「調(diào)情」的問題

這是 Character.ai 找到的獨(dú)特空間,也是可以逐漸積累的壁壘。同一領(lǐng)域的聆心智能,在做社交大模型的應(yīng)用上,發(fā)現(xiàn)了獨(dú)特場(chǎng)景。

聆心智能 CEO 張逸嘉分享了他們看到的與預(yù)想的不同,現(xiàn)在大模型可以落地的社交場(chǎng)景不是陪伴,人們接受虛擬形象的陪伴需要時(shí)間。現(xiàn)在落地的社交場(chǎng)景是角色扮演,用戶畫像是網(wǎng)文小說愛好者,角色扮演是網(wǎng)文小說的新形式

至于現(xiàn)在最新的 AI Agent 方向,是不是大模型「全村的希望」,甚至最終帶來交互革命、終端革命、商業(yè)模式革命,很可能要取決于多模態(tài)能力的發(fā)展。

心識(shí)宇宙創(chuàng)始人&CEO 陶芳波解釋說,一開始大家對(duì) Agent 的期待很高,但在現(xiàn)有技術(shù)條件下發(fā)現(xiàn),Agent 怎么樣比 ChatGPT 解決了更多問題,很難被講清楚。

他認(rèn)為,如果真的要把 Agent 發(fā)揮作用,并不是把那么多軟件的 API 給接進(jìn)來,因?yàn)榻榆浖?API 本質(zhì)上是在做兼容,是新瓶裝舊酒。Agent 有沒有一些更加 Native 的形態(tài)去完成最后一公里。

有很多很多要做的事情,數(shù)字栩生創(chuàng)始人&CEO 宋震說的空間感知能力和多模態(tài)能力。在這些條件成熟之后,可能就會(huì)出現(xiàn) Killer Case。李志飛堅(jiān)定地認(rèn)為,現(xiàn)在看來,多模態(tài)是 C 位,不是花瓶。

因?yàn)?strong>Agent 輸入輸出都依賴于多模態(tài)的能力,沒有多模態(tài)就沒有 Agent,只不過今天的 Agent 更多是通過語言模型,通過文本來反饋,但是最終 Agent 會(huì)是一個(gè)多模態(tài)的觀察、感知、行動(dòng)。他預(yù)判,跨模態(tài)知識(shí)的遷移,再過兩、三年看,反而是大語言模型最大的一個(gè)貢獻(xiàn)。


06
大模型時(shí)代,服務(wù)大 B 還是小 B

幾個(gè)月前,我在舊金山正好趕上數(shù)據(jù)公司 Databricks 的開發(fā)者大會(huì)。

這是一家專門做「數(shù)據(jù)湖」的數(shù)據(jù)平臺(tái)公司,可以說是長在云計(jì)算平臺(tái)上的「中間層」公司。就是這樣一個(gè)公司,幾年時(shí)間估值已經(jīng)達(dá)到幾百億美元,并且還在持續(xù)增長。Databricks 的客戶既有大企業(yè),也有小創(chuàng)業(yè)公司,大小通吃。

今年,這家公司迅速接入大模型,還收購了大模型公司 Mosaic ML,開始幫助客戶落地大模型進(jìn)入業(yè)務(wù),這個(gè)風(fēng)口讓它眼看一路狂奔千億美元價(jià)值而去了。我當(dāng)時(shí)非常好奇的一點(diǎn)是,為什么國內(nèi)好像沒能長出這樣一個(gè)基于云計(jì)算的「中間層」公司,而這一波 AI 技術(shù)進(jìn)步的變量,是否在中國能催生出這樣一批在把云的算力變成業(yè)務(wù)競(jìng)爭(zhēng)力,帶給更多行業(yè)數(shù)字化進(jìn)步的「中間層」的優(yōu)秀企業(yè)?

阿里云董事長張勇認(rèn)為,「中間層」公司的出現(xiàn),一定是有可能的,也是云計(jì)算企業(yè)樂見其成的。但這些公司要解決的還是一個(gè)核心問題——定義清楚要解決誰的什么問題,定義越清晰,能力越到位,做的東西就能真正「收斂」,真正有商業(yè)「穿透力」

這也引發(fā)了參會(huì)創(chuàng)業(yè)者們的探討,比如大模型技術(shù)剛剛開始進(jìn)入行業(yè),但企業(yè)服務(wù)「不收斂」、項(xiàng)目化的問題就開始出現(xiàn)了。比如給 B 端用戶做大模型訓(xùn)練,但由于數(shù)據(jù)是對(duì)方的,所以最終合作完,自己的團(tuán)隊(duì)很難「閉環(huán)」——數(shù)據(jù)沒有飛輪,收入毛利也低,一不小心就做成了「高科技施工隊(duì)」,是技術(shù)企業(yè)面對(duì) B 端的一個(gè)通病。

甚至有創(chuàng)業(yè)者都開始懷疑,大模型 To B 可能天生缺乏土壤。但加入創(chuàng)業(yè)者群聊一直在做筆記的張勇,恰恰在這里很體系化地說了一個(gè)不同的見解:「To B 其實(shí)還有另一種可能,就是「小 B」,也就是那些中小微企業(yè),它們看起來不起眼,但是數(shù)量眾多,單單服務(wù)它們,就能夠造就現(xiàn)在的互聯(lián)網(wǎng)巨頭。」

例如,阿里早期的「黃頁」,讓中小賣家能被外國買家看見,帶來了跨境貿(mào)易的繁榮;淘寶則是解決了信息和物流的流通問題,就成就了電商這一大品類。而且,相對(duì)于大型公司,這些小 B 公司并不關(guān)心技術(shù)和愿景,誰能幫它們解決增長問題,就會(huì)因此付錢。

當(dāng)前大公司的數(shù)據(jù)化,最主要的一個(gè)目的就是要「降本增效」,說白了就是「節(jié)流」。但效率優(yōu)化空間總有盡頭,可是增長和發(fā)展的「開源」空間,卻相對(duì)無限。張勇認(rèn)為,企業(yè)服務(wù)里「開源」遠(yuǎn)比「節(jié)流」重要,人們永遠(yuǎn)愿意為了發(fā)展而付費(fèi)

他甚至認(rèn)為,過去數(shù)字化企業(yè)服務(wù)過于看重「降本增效」可能是個(gè)誤區(qū),因?yàn)樵敢鉃樘嵘俜种畮椎男矢跺X的往往是大公司,他們體量大,這種提升符合投入產(chǎn)出比。然后也讓大家都圍著大公司做項(xiàng)目。但反過來,小公司很難靠「降本增效」去啟動(dòng)需求,它們要的是成長和發(fā)展的能力。

其實(shí),小 B 客戶還有一種雙重性,即如果采用「訂閱」的方式,那它其實(shí)就可以被看成是一個(gè)「C 端用戶」。

在這一點(diǎn)上張勇的觀點(diǎn)也得到了參會(huì)創(chuàng)業(yè)者的認(rèn)同,比如出門問問的李志飛曾經(jīng)在語音識(shí)別領(lǐng)域做過 To B 的業(yè)務(wù),被同行卷得非常痛苦。而后來他做的 AI 配音工具「魔音工坊」,服務(wù)的就是一個(gè)個(gè)內(nèi)容創(chuàng)作者,收斂到一個(gè)真正解決小 B 們普遍問題的產(chǎn)品,這些「小 B」反而讓他真正把 AI 技術(shù)變成了健康成長的業(yè)務(wù)。

張勇還建議創(chuàng)業(yè)公司需要一開始就確定自己要服務(wù)的客戶,是 C 還是 B,是小 B 還是大 B,必須定義好。張勇甚至覺得,做 AI 的公司,如果既做 To 大 B 又做 To 小 B 甚至 To C 是行不通的。

雖然 AI 技術(shù)的發(fā)展帶來了很多變化,會(huì)越來越有通用的能力,但是在技術(shù)層面之外,還有組織的「DNA 問題」,「你一個(gè)公司里做大客戶的和做互聯(lián)網(wǎng)用戶的團(tuán)隊(duì),上班的著裝、說話的方式可能都是不一樣的。」

張勇覺得要定義清楚自己服務(wù)誰,解決什么問題,而不是哪有單子往哪里走。


07
大模型對(duì)云,意味著什么?


幾年前上一波 AI 浪潮中,很多創(chuàng)業(yè)公司一樣獲得了大量融資,出現(xiàn)了很多知名公司和創(chuàng)業(yè)者,但是幾年下來,依舊做得很辛苦。我和很多那一波創(chuàng)業(yè)者一直保持交流,好多次約出來聊天,看到他們一臉疲憊沙啞著嗓子,一問往往是前一天陪某個(gè)大客戶喝了大酒還沒緩過來。

這次的很多創(chuàng)業(yè)者也目睹了那個(gè)時(shí)代,技術(shù)最終因?yàn)闊o法形成標(biāo)準(zhǔn)化產(chǎn)品,變成只能接項(xiàng)目的「高級(jí)人力外包」、「高科技施工隊(duì)」。他們都覺得,一定不能再重蹈覆轍。與此同時(shí),大家也很關(guān)心阿里云這樣的云計(jì)算平臺(tái)在大模型時(shí)代會(huì)面對(duì)什么變化。大家也問張勇,在大模型時(shí)代,他覺得云本身到底是技術(shù),還是產(chǎn)品?

張勇的回應(yīng)倒是很直接,「云本身應(yīng)該是產(chǎn)品,并且不是一個(gè),而是一系列的產(chǎn)品。」

在大模型和 AI 浪潮推動(dòng)下,有一個(gè)事情是確定的,就是行業(yè)和客戶對(duì)算力提出了全新的要求。如何滿足客戶對(duì)算力的進(jìn)一步需求,就成了阿里云的基本出發(fā)點(diǎn)。張勇覺得這里面一定有技術(shù)要解決的問題,但阿里云也一樣要思考如何「收斂」到真正解決產(chǎn)業(yè)生態(tài)問題的產(chǎn)品,而不只是輸出算力本身。

有意思的是,這次交流活動(dòng)雖然是 FounderPark 社區(qū)和阿里云聯(lián)合邀請(qǐng),但卻沒有安排任何關(guān)于「通義千問」的分享。創(chuàng)業(yè)者們當(dāng)然也很關(guān)心云平臺(tái)自己做大模型的目的。

張勇的觀點(diǎn)是:這個(gè)容易出現(xiàn) Hyper Scaler(超大規(guī)模玩家)的跨技術(shù)時(shí)代,肯定沒有人敢掉隊(duì),不可能不去觸摸技術(shù)本身。但他覺得,阿里云在這樣一個(gè)巨變時(shí)代,要把握的還是更核心的角色,就是Cloud Service Provider(云計(jì)算服務(wù)提供者)「而要做好這個(gè)角色,不懂大模型一定是不行的。」

張勇說:「我們?nèi)绻蛔鐾x千問,可能都搞不清楚該如何幫助今天參會(huì)的各位創(chuàng)業(yè)者們。」其實(shí)讓張勇比較興奮的,是他非常確定未來人類社會(huì)對(duì)于對(duì)算力的需求是無限的,對(duì)于其效率的要求也會(huì)越來越高。所以張勇說,阿里云肯定是希望「模型越多越好,場(chǎng)景越多越好」,二者越多,對(duì)算力的需求和技術(shù)要求就更高,這就意味著云有了新的要去面對(duì)和解決的問題。而唯有持續(xù)不斷值得解決的「難問題」,才能驅(qū)動(dòng)云的價(jià)值有更大的成長空間。

云計(jì)算平臺(tái)前所未有需要一個(gè)生態(tài),而不是什么都自己搞。目前,還沒有一家公司能把芯片、云計(jì)算、數(shù)據(jù)平臺(tái)、機(jī)器學(xué)習(xí)框架和大模型,全部用自己家的,形成所謂的「閉環(huán)」,這幾乎在物理上是不可能的。」張勇覺得,AI 技術(shù)的發(fā)展,讓生態(tài)有了新的可能。

他有個(gè)遺憾,過去十年是中國云計(jì)算突飛猛進(jìn)的時(shí)期,但中國的 SaaS 行業(yè),并沒有因?yàn)榛ǖ目焖侔l(fā)展而有了本質(zhì)性的提升。而美國的 SaaS 公司,目前都在探索將 AI 嵌入到平臺(tái)中升級(jí),走了一條和國內(nèi)公司不同的路徑。他認(rèn)為,在 AI 時(shí)代,中國可能會(huì)出現(xiàn)新一代的 SaaS,會(huì)是一種全新的智能服務(wù),和以前 SaaS 流程驅(qū)動(dòng)不同,這種新的服務(wù)會(huì)通過數(shù)據(jù)和智能驅(qū)動(dòng),可能也不叫 SaaS。

面壁智能董事&CEO 李大海指出,國內(nèi) To B 市場(chǎng)非常碎片化,這是 SaaS 服務(wù)起不來的原因。但是現(xiàn)在有了大模型這樣一個(gè)技術(shù)變量,能不能夠形成一些變化,這是比較值得期待的事情。同時(shí)他也期待阿里云這樣的云廠商,能在這里有一些好的方案和底座,帶著大家一起把這個(gè)事兒趟得更平。

在張勇看來,中國過去不少 SaaS 公司,到現(xiàn)在也不能安全算是 Cloud Native(云原生),而對(duì)于一個(gè)天然生長在云上,或者是 intelligent native(智能原生)的新型服務(wù),有機(jī)會(huì)「平替」之前非原生的上個(gè)時(shí)代產(chǎn)品。

很多時(shí)候我們感嘆,上一個(gè)十年中國的 SaaS 行業(yè)成長不盡人意,但大模型如今給創(chuàng)業(yè)公司提供了新的機(jī)會(huì),在一個(gè)全新的數(shù)字化生態(tài)里塑造新的格局的可能性。張勇的結(jié)論是:這樣的機(jī)會(huì)和挑戰(zhàn),對(duì)阿里云,對(duì)所有創(chuàng)業(yè)者,都是相通的,都要面向未來找到自己的位置,共同形成生態(tài)伙伴關(guān)系,共同創(chuàng)造價(jià)值。


以生態(tài)著稱的杭州西溪濕地|來源:視覺中國

好了,以上是我在長達(dá) 7 小時(shí)交流中節(jié)選的一些筆記。

我最強(qiáng)烈的感覺是,今天大模型技術(shù)帶來的時(shí)代變化,才剛剛拉開帷幕。

經(jīng)過前半年的極度興奮和「過度想象」,一個(gè)可能長達(dá) 10 年的技術(shù)革命,現(xiàn)在才真正開啟「萬里長征」。狂熱期之后真正進(jìn)入拓荒期,這里面經(jīng)過足夠時(shí)間磨練和付出堅(jiān)實(shí)代價(jià)才能獲得的「共識(shí)」,才是真共識(shí)

希望創(chuàng)業(yè)者之間,產(chǎn)業(yè)生態(tài)之間,能有更多的帶著「開源精神」的坦誠交流和思考碰撞。其實(shí)張勇給這次交流起的「西溪論道」這個(gè)名字就挺好的。坐而論道,更要起而行之。

我想,這個(gè)「道」應(yīng)該就是 AGI 時(shí)代從技術(shù)到產(chǎn)品,從 vision 到價(jià)值的那個(gè)「創(chuàng)新之道」吧。

注:頭圖來源:視覺中國


作者公眾號(hào):極客公園(ID:geekpark)
1693825069629256.png

本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨(dú)立觀點(diǎn),不代表數(shù)英立場(chǎng)。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨(dú)立觀點(diǎn),不代表數(shù)英立場(chǎng)。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表數(shù)英立場(chǎng)。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
本文系數(shù)英原創(chuàng),未經(jīng)允許不得轉(zhuǎn)載。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。

    評(píng)論

    文明發(fā)言,無意義評(píng)論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評(píng)論

    評(píng)論

    文明發(fā)言,無意義評(píng)論將很快被刪除,異常行為可能被禁言
    800

    推薦評(píng)論

    暫無評(píng)論哦,快來評(píng)論一下吧!

    全部評(píng)論(0條)

    主站蜘蛛池模板: 江口县| 岳西县| 营山县| 淮阳县| 岢岚县| 顺平县| 泽州县| 密山市| 正镶白旗| 顺义区| 玉林市| 江永县| 澳门| 禹城市| 庆阳市| 曲阳县| 肃南| 侯马市| 双江| 阿克陶县| 缙云县| 滁州市| 托克逊县| 赤水市| 昌图县| 黔西县| 佛教| 纳雍县| 拉萨市| 永德县| 高碑店市| 广丰县| 贵南县| 行唐县| 泽库县| 上饶县| 镇原县| 临颍县| 淳化县| 溧水县| 神木县|