作者:月山橘??,編輯:張潔、卷毛,來源:頭號(hào)AI玩家
原標(biāo)題:一文盤點(diǎn)2023年度最熱AI應(yīng)用,打工人必備!建議收藏(內(nèi)附工具匯總文檔)
2023年,是AI行業(yè)的一個(gè)分水嶺。
這一年,我們見證了AI技術(shù)的躍進(jìn)式發(fā)展。
從深度學(xué)習(xí)到自然語言處理,從圖像生成到視頻生成,從聲音克隆到數(shù)字人克隆……很多AI工具和產(chǎn)品猶如冉冉升起的新星,不僅重塑了人們的生活方式,也重新定義了未來的商業(yè)圖景。
正如約翰·卡爾金所說:“我們塑造我們的工具,然后我們的工具塑造我們。”
“頭號(hào)AI玩家”通過梳理和盤點(diǎn)過去一年AI領(lǐng)域頗受關(guān)注的熱門工具,希望能幫助各位更好地回顧AI技術(shù)的突破與最新進(jìn)展,預(yù)見它們將如何繼續(xù)影響我們的世界。
我們參考估值、影響力、用戶評(píng)價(jià)等維度,選取了幾大常見領(lǐng)域一些具有代表性的AI產(chǎn)品,梳理了其迭代歷程、最新性能等,每個(gè)類別都有其獨(dú)特的技術(shù)特點(diǎn)和應(yīng)用場景。
?
一、AI聊天機(jī)器人????????
AI聊天機(jī)器人是AI領(lǐng)域最熱門、最具代表性的發(fā)展趨勢之一,代表了人們獲取信息、做出決策和溝通的變革。
目前,市面上的人工智能聊天機(jī)器人有多種形式,包括獨(dú)立的移動(dòng)應(yīng)用程序、集成在社交網(wǎng)絡(luò)或搜索引擎中的消息應(yīng)用程序等。
ChatGPT
地表最強(qiáng)AI聊天機(jī)器人,由OpenAI研發(fā),于2022年11月30日發(fā)布。
ChatGPT的出現(xiàn)不僅推動(dòng)了自然語言處理技術(shù)的發(fā)展,還推動(dòng)了AI技術(shù)的普及化,提高了AI的社會(huì)認(rèn)知度和影響力。
用戶可以通過訂閱ChatGPT Plus訪問GPT-4(OpenAI最先進(jìn)的語言模型),獲得更快的響應(yīng)速度、更多的功能、更穩(wěn)定的服務(wù)和更靈活的使用方式,訂閱費(fèi)用為每月20美元。
2023年11月6日,OpenAI召開了首屆開發(fā)者大會(huì)(OpenAI DevDay),宣布了GPT的一系列更新,包括推出GPT-4 Turbo(GPT-4的超級(jí)版本)和多模式API等。
值得一提的是,OpenAI將在本周正式推出GPT商店,用戶可以在其中創(chuàng)建自定義GPT并從中獲利。
Claude
美國AI創(chuàng)企Anthropic(由OpenAI前成員創(chuàng)立)旗下的AI聊天機(jī)器人,2023年3月15日正式發(fā)布。
2023年7月,Anthropic發(fā)布Claude 2。升級(jí)后的Claude 2在編碼、數(shù)學(xué)和推理方面的性能都有所提高,處理能力提升至100K個(gè)token,可以處理數(shù)百頁的技術(shù)文檔,甚至整本書。
2023年11月22日,Anthropic發(fā)布Claude 2.1版本。上下文窗口達(dá)到200000個(gè)token,相當(dāng)于Claude此前處理能力的兩倍,大幅高出GPT-4企業(yè)版3.2萬個(gè)token的上限。
Anthropic還稱,Claude 2.1出現(xiàn)“幻覺”或謊言的頻率是以前的一半。
截至目前,Anthropic的估值接近50億美元,總?cè)谫Y額近15億美元。
Bard
2023年2月6日,Google推出由LaMDA大模型驅(qū)動(dòng)的AI聊天機(jī)器人Bard。
2023年4月10日,Bard改用更強(qiáng)大的PaLM大型語言模型,運(yùn)算能力得到增強(qiáng)。
2023年5月10日,PaLM被進(jìn)一步更新為PaLM2,多語言翻譯和邏輯推理能力得到增強(qiáng)。
Bing Chat
2023年2月7日,微軟正式將GPT-4集成進(jìn)新版必應(yīng)(New Bing)和Microsoft Edge瀏覽器中,集成后的聊天機(jī)器人稱為Bing Chat。
2023年3月4日,微軟為Bing Chat引入“精確”、“平衡”和“創(chuàng)意”模式,用戶可在這三種模式之間進(jìn)行切換,以體驗(yàn)不同的聊天語氣。
2023年3月22日,Bing Chat集成Bing Image Creator功能。該功能基于OpenAI的DALL-E,可以基于用戶輸入的文本內(nèi)容自動(dòng)生成圖像。
由于免費(fèi)易用,Bing Chat被認(rèn)為是ChatGPT Plus每月20美元訂閱的替代品。
Character.ai
2021年由前谷歌LaMDA團(tuán)隊(duì)成員Noam Shazeer和Daniel De Freitas共同創(chuàng)立,2022年9月推出測試版。
Character.ai構(gòu)建了一個(gè)AI角色扮演社區(qū),用戶可以和動(dòng)漫人物、明星大佬,以及自定義的各種角色交流對(duì)話。
2023年5月23日,Character.ai移動(dòng)端正式登陸全球iOS和Android系統(tǒng)。Character.ai官方公布的數(shù)據(jù)顯示,自2023年5月發(fā)布以來,其安卓應(yīng)用市場下載量已經(jīng)超過300萬次。
2023年9月,Character.ai的估值就被披露超50億美元。
Pi
Pi是美國AI創(chuàng)企Inflection AI于2023年5月推出的AI聊天機(jī)器人。不同于ChatGPT等產(chǎn)品的生產(chǎn)力工具定位,Pi主打陪伴和情感智能。
Inflection AI成立于2022年,由前DeepMind高管Mustafa Suleyman創(chuàng)建,先后拿到微軟、英偉達(dá)等公司的投資,目前估值已達(dá)40億美元。
Perplexity.ai
Perplexity.ai是一個(gè)免費(fèi)的人工智能聊天機(jī)器人,支持聯(lián)網(wǎng)搜索,點(diǎn)擊文本框下方的“現(xiàn)在流行”,即可查看最流行的提示和新聞。
Perplexity.ai是一個(gè)由AI驅(qū)動(dòng)的搜索引擎,與傳統(tǒng)搜索引擎不同,Perplexity.ai有著類似聊天機(jī)器人的界面,允許用戶用自然語言提問,并在回答搜索查詢時(shí)直接提供答案,而非網(wǎng)站鏈接,Perplexity公司將這項(xiàng)產(chǎn)品稱為“答案引擎”。
2024年1月4日,Perplexity完成了7360萬美元的B輪融資,估值5.2億美元,由Institutional Venture Partners領(lǐng)投,這也是近年來互聯(lián)網(wǎng)搜索初創(chuàng)公司籌集的最大一筆資金。
在此輪融資前,Perplexity.ai的月活用戶已增至1000萬。
Grok
Grok是馬斯克旗下xAI推出的首個(gè)AI大模型產(chǎn)品,2023年11月上線,背后的大模型也與之同名,目前的版本是Grok-1,它的原型Grok-0在xAI宣布成立后即開始訓(xùn)練。
相較于ChatGPT等大模型有具體的知識(shí)庫截止時(shí)間,Grok可以實(shí)時(shí)地從????平臺(tái)獲取最新信息,為用戶提供更及時(shí)的新聞檢索和觀點(diǎn)獲取服務(wù)。
此外,不同于常見AI助手一板一眼的回答,Grok的回答具有幽默和反叛的風(fēng)格。
Gemini
2023年12月6日凌晨,谷歌發(fā)布了多模態(tài)大模型Gemini。
Gemini共有三個(gè)版本:適用于高度復(fù)雜任務(wù)的Gemini Ultra、適用于各種任務(wù)的最佳模型Gemini Pro以及適用于端側(cè)設(shè)備(手機(jī)、PC)的Gemini Nano。
目前,Bard已集成Gemini Pro的微調(diào)版本。未來,Gemini將逐步整合進(jìn)Google Search、廣告、Chrome瀏覽器和Duet AI等多項(xiàng)產(chǎn)品和服務(wù)中,以提升Google生態(tài)系統(tǒng)的智能化水平,為用戶提供更精確、個(gè)性化的體驗(yàn)。
Janitor AI
Janitor AI是一款角色扮演AI聊天機(jī)器人平臺(tái),核心功能在于允許用戶創(chuàng)建虛構(gòu)聊天機(jī)器人角色,并與這些角色進(jìn)行自然語言交互。
用戶可以選擇不同的角色模板,包括性格、語言風(fēng)格、興趣愛好等方面的設(shè)定,為他們的聊天機(jī)器人角色注入多樣的個(gè)性。此外,Janitor AI提供了豐富的API和SDK,方便開發(fā)者將其融入到自己的應(yīng)用程序中。
文心一言
2023年3月16日,百度大語言模型產(chǎn)品“文心一言”正式發(fā)布,這是繼OpenAI發(fā)布ChatGPT后,中國第一款生成式語言大模型產(chǎn)品。
文心一言具備五大能力:文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成。
2023年10月,文心大模型4.0上線,并帶來全線重構(gòu)的新搜索等十余款A(yù)I原生應(yīng)用。截至12月底,文心一言用戶規(guī)模已突破1億。
訊飛星火
2023年5月6日,科大訊飛正式發(fā)布“訊飛星火認(rèn)知大模型”,在文本生成、知識(shí)問答、數(shù)學(xué)能力三大能力上超過ChatGPT。
2023年6月,訊飛星火認(rèn)知大模型通過中國信通院組織的國內(nèi)首個(gè)官方可信AIGC大模型基礎(chǔ)能力(功能)評(píng)測,并且獲得認(rèn)證通過全部功能項(xiàng)。
2023年10月,訊飛星火認(rèn)知大模型V3.0版本發(fā)布,七大能力持續(xù)提升,整體超越ChatGPT,醫(yī)療六大核心能力超越GPT-4。
通義千問
阿里推出的對(duì)話式AI大模型,2023年4月7日開始內(nèi)測。
2023年9月,通義千問成為國內(nèi)首批通過備案的大模型,通義千問APP上線后功能持續(xù)升級(jí),目前可提供文本對(duì)話、語音對(duì)話、翻譯、PPT大綱助手、小紅書文案、視頻生成等幾十項(xiàng)功能。
同時(shí),阿里云陸續(xù)開源了Qwen-7B、Qwen-14B、Qwen-1.8B和視覺理解模型Qwen-VL、音頻理解大模型Qwen-Audio。12月初,720億參數(shù)的大語言模型通義千問Qwen-72B正式開源,被稱為“業(yè)界最強(qiáng)的中文開源模型”。
豆包
豆包是字節(jié)跳動(dòng)基于云雀大模型開發(fā)的AI對(duì)話產(chǎn)品,8月17日正式開始對(duì)外測試。
豆包提供聊天機(jī)器人、寫作助手以及英語學(xué)習(xí)助手等功能,可以回答各種問題并進(jìn)行對(duì)話,支持網(wǎng)頁Web,iOS以及安卓平臺(tái),但iOS需要使用TestFlight安裝。
Kimi Chat
Kimi Chat是由北京月之暗面科技有限公司(Moonshot AI)開發(fā)的一款大模型產(chǎn)品,于2023年10月9日正式上線。
Kimi Chat的獨(dú)特優(yōu)勢在于具有超長上下文支持能力,支持輸入20萬漢字的文本內(nèi)容。還能夠處理多種文件格式,如TXT、PDF、Word 文檔、PPT 幻燈片、Excel電子表格等,且具備瀏覽網(wǎng)址的能力,可以閱讀相關(guān)內(nèi)容后回復(fù)用戶。
二、AI圖像生成工具
2023年,是AI文生圖領(lǐng)域高歌猛進(jìn)的一年。但目前來看,AI生成的圖像仍存在一些局限有待進(jìn)一步突破,例如在細(xì)節(jié)、精度方面不足,多數(shù)情況下仍存在畫面瑕疵、缺陷,光影、色調(diào)的調(diào)整更依賴后期人工處理等等。
Midjourney
Midjourney作為文生圖領(lǐng)域的開拓者和領(lǐng)導(dǎo)者,其生成的圖片質(zhì)量一直是行業(yè)標(biāo)桿。
2022年,一張用Midjourney生成的圖像在科羅拉多州博覽會(huì)數(shù)字藝術(shù)競賽中獲得第一名,引發(fā)了大眾對(duì)于AI繪畫和Midjourney的關(guān)注。
目前,Midjourney已更新至V6版本,生成的圖像質(zhì)量逐步提高,功能也越來越多元、完善。
最初,Midjourney搭載在Discord上,用戶只能通過向其官方Discord服務(wù)器上的Discord機(jī)器人發(fā)送消息來訪問。
2023年12月13日,Midjourney上線了網(wǎng)頁版,但使用門檻是用Midjourney生成了超一萬張圖(可以在Discord里輸入“/info”,查看生成的圖片數(shù)量)。相較于Discord,網(wǎng)頁版Midjourney操作更簡便,但功能少很多。
Stable Diffusion
Stable Diffusion是一款基于擴(kuò)散模型的AI繪畫工具,由Stability AI公司研發(fā),能夠完成文生圖和圖生圖等任務(wù),于2022年8月22日發(fā)布。
Stable Diffusion是一個(gè)完全開源的項(xiàng)目,包括模型代碼、訓(xùn)練數(shù)據(jù)、論文等,這使得其快速構(gòu)建了強(qiáng)大繁榮的上下游生態(tài),比如AI繪畫社區(qū)Civitai、基于SD的自訓(xùn)練模型,以及豐富的輔助AI繪畫工具與插件等。
2023年6月,Stable Diffusion發(fā)布了SDXL 0.9版本的更新,升級(jí)了Stable Diffusion文生圖模型。
2023年11月29日,Stability AI發(fā)布了新一代文生圖模型SDXL Turbo,將生成圖像所需的步驟數(shù)從50步減少到1步,并且大幅提升了推理速度,可以做到實(shí)時(shí)生成圖像。在A100上,SDXL Turbo可以在207毫秒內(nèi)生成一幅512x512的圖像。
不過,Stable Diffusion的安裝和使用對(duì)硬件有較高要求。
DALL·E 3
DALL·E 3是OpenAI于2023年9月21日發(fā)布的圖像生成模型,于2023年10月初向ChatGPT Plus和Enterprise客戶提供。
DALL·E 3的最大特點(diǎn)是與ChatGPT的集成,它原生構(gòu)建在ChatGPT之上,通過ChatGPT來創(chuàng)建、拓展和優(yōu)化prompt。當(dāng)用戶輸入一個(gè)想法時(shí),ChatGPT會(huì)自動(dòng)為DALL·E 3生成量身定制的、詳細(xì)的prompt,同時(shí)用戶也可以使用自己的prompt。
這種集成使得DALL·E 3具備更強(qiáng)的理解能力,能夠更好地理解和處理抽象冗長的提示,使用戶更輕松地將自己的想法轉(zhuǎn)化為準(zhǔn)確的圖像。
Adobe Firefly
Adobe Firefly,也被稱為“螢火蟲”,是一款由Adobe開發(fā)的Web應(yīng)用程序,它的發(fā)布標(biāo)志著Adobe在人工智能和AI繪圖領(lǐng)域的一次重要突破。
主要AI功能包括文本生成圖像和生成式填充,用戶可以通過簡單的文本提示進(jìn)行描述,移除圖像的一部分、向圖像添加其他內(nèi)容,或替換為所生成的內(nèi)容。
此外,Adobe Firefly還支持在Creative Cloud應(yīng)用程序中使用簡單的文本提示,拓展了應(yīng)用程序工作流程和生成式AI結(jié)合的可能性。
Leonardo AI
Leonardo是一個(gè)AI繪畫社區(qū),同時(shí)也是一個(gè)AI繪畫工具。
Leonardo深度集成了Stable Diffusion的各種插件,比如ControlNET的openpose姿勢參考、局部重繪、prompt提示等等,甚至還提供了傻瓜式在線訓(xùn)練模型的功能,這使Leonardo更像是Stable Diffusion模型分享社區(qū)Civitai(civitai.com)和Stable Diffusion的集合體。
三、AI視頻生成工具
???????隨著文生圖技術(shù)的精進(jìn)與成熟,文生視頻賽道也逐漸變得熱鬧起來,以Runway為代表的文生視頻公司不斷涌現(xiàn)。國內(nèi)外互聯(lián)網(wǎng)行業(yè)的巨頭,如谷歌、Meta、微軟、阿里、字節(jié)同樣投入人員和精力參與其中。
Runway Gen-2
Runway是一家成立于2018年的美國AI創(chuàng)企。2023年2月,Runway發(fā)布了文本生成視頻模型Gen-1和Gen-2,通過Web界面訪問Runway官網(wǎng)即可使用。
2023年11月2日,Runway Gen-2迎來了一次里程碑式的更新。以往AI生成視頻飽受詬病的畫面閃爍、不連貫、扭曲變形等問題,在這次更新后得到很大改善。
現(xiàn)在無論是用Gen-2文生視頻還是圖生視頻,視頻的保真度和一致性都有了重大提升,分辨率提升至4K水平。
截至目前,Runway已經(jīng)發(fā)布了大約30余個(gè)AI創(chuàng)作工具,包含音頻、圖片、視頻、3D和生成五個(gè)大類,涵蓋了幾乎所有的音視頻內(nèi)容生成和處理工具。其產(chǎn)品已經(jīng)應(yīng)用于多部好萊塢大片的特效制作。
2023年7月,Runway在谷歌領(lǐng)投的D輪融資中募集到約1億美元,估值現(xiàn)已達(dá)到15億美元。
Pika Labs
Pika Labs被稱為Runway Gen-2的最強(qiáng)競品,它的出現(xiàn)拓展了投資圈對(duì)AI視頻創(chuàng)業(yè)領(lǐng)域的想象空間。
2023年11月29日,Pika Labs發(fā)布了第一個(gè)產(chǎn)品Pika 1.0,并迅速因驚艷的視頻生成效果而火出圈。12月26日,Pika 1.0開啟免費(fèi)公測。
Pika Labs的創(chuàng)始人是兩位華人,郭文景(CEO)和孟晨琳(CTO),均為來自斯坦福AI實(shí)驗(yàn)室的博士生。
11月29日,Pika labs宣布完成5500萬美元A輪融資,目前估值已近2億美元。
Stable Video Diffusion
11月21日,Stability AI上線視頻生成模型“Stable Video Diffusion”。該模型基于Stable Diffusion現(xiàn)有的文本轉(zhuǎn)圖像模型,能夠通過對(duì)現(xiàn)有圖像進(jìn)行動(dòng)畫化生成視頻。
Stable Video Diffusion提供兩個(gè)模型,分別為SVD和SVD-XT。其中,SVD將靜止圖像轉(zhuǎn)換為14幀的576x1024視頻,而SVD-XT在相同的架構(gòu)下將幀數(shù)提升至24幀。這兩者都能以每秒3到30幀的速度生成視頻。
目前,Stable Video Diffusion已經(jīng)開放了用戶候補(bǔ)名單注冊。
Morph Studio
文生視頻領(lǐng)域的“黑馬”。Morph Studio是世界第一個(gè)推出公眾可隨意測試text-to-video產(chǎn)品的團(tuán)隊(duì),比Runway開放Gen2公測的時(shí)間還早。
和一些僅提供720P免費(fèi)服務(wù)的同類產(chǎn)品不同,Morph Studio從一開始就提供默認(rèn)1080P以及最長7秒生成時(shí)間的免費(fèi)服務(wù),注冊Discord即可免費(fèi)體驗(yàn)。
Animate Anyone
?Animate Anyone?是一款可以把靜態(tài)圖像變成動(dòng)畫視頻的軟件,由阿里巴巴智能計(jì)算研究院開發(fā)。它可以應(yīng)用于人類、動(dòng)漫、卡通等不同類型的角色,只需要提供一張角色圖像和一些預(yù)設(shè)的動(dòng)作序列,就可以生成逼真的動(dòng)畫視頻。
與Animate Anyone類似的工具還有Magic Animate,這是新加坡國立大學(xué)和字節(jié)跳動(dòng)聯(lián)合推出的一款“人體圖像動(dòng)畫生成工具”,它同樣能夠根據(jù)用戶指定的人物圖片和動(dòng)作序列,生成對(duì)應(yīng)的動(dòng)效視頻。
四、AI音頻工具
感受過Midjourney、SD等AI繪畫工具帶來的視覺震撼后,AI生成音頻領(lǐng)域也正在掀起一場革命。
從震撼華語樂壇的AI歌手“孫燕姿”到霉霉說普通話的視頻走紅,??????AI音頻生成產(chǎn)品在音樂創(chuàng)作、語音合成和音效設(shè)計(jì)等方面取得了顯著的突破。
ElevenLabs
ElevenLabs是一個(gè)Text to Speech軟件,可以通過將輸入的文本轉(zhuǎn)化成情感和語調(diào)都十分逼真的語音。
其背后的ElevenLabs是一家軟件公司,專門利用人工智能和深度學(xué)習(xí)開發(fā)自然語音合成和文本轉(zhuǎn)語音軟件。
2023年6月,ElevenLabs籌集了1900萬美元的A輪融資,估值約為1億美元。
2023年10月,ElevenLabs推出“AI Dubbing”,這是一種能夠?qū)⒄Z音翻譯成20多種語言,并且保留說話者原始語音、情感和語調(diào)的AI工具。
Suno AI
Suno AI是一個(gè)音樂生成模型,可以通過簡短的文本提示生成音頻,包括語音、音樂和音效。
其中,Suno AI的語音生成模型BaRK,可以根據(jù)用戶需求生成各種語音,適用于廣告、動(dòng)畫和游戲行業(yè)。
Suno AI的音樂生成模型Chirp可以生成包括樂器、歌詞和人聲演唱等在內(nèi)的約30秒音樂片段,涵蓋流行、古典、電子等多種音樂風(fēng)格。
Suno AI的音效生成模型可以生成各種類型的音效,為音視頻項(xiàng)目增添表現(xiàn)力、氛圍感和情感。
Mubert
Mubert是一個(gè)AI音樂生成平臺(tái),用戶可以在Mubert實(shí)時(shí)生成特定長度、風(fēng)格流派和情緒的音樂,并支持自定義。主要面向音樂制作人、創(chuàng)作者和品牌,使他們在人工智能的幫助下創(chuàng)作免版稅音樂。
Google MusicLM
Google MusicLM是谷歌開發(fā)的一個(gè)文本到音樂的生成模型,是“AI Test Kitchen”計(jì)劃的一部分。
MusicLM可以從類似于自然語言提示的簡單文本描述中創(chuàng)作高保真的音樂。它以24kHz的高采樣率生成音樂,意味著生成的音頻質(zhì)量很高。此外,MusicLM的音樂生成速度非常快,幾乎是即時(shí)的。
五、AI數(shù)字人生成工具
伴隨著人工智能技術(shù)的突破性進(jìn)展,AI數(shù)字人以其逼真的外貌、智能的對(duì)話能力和個(gè)性化的服務(wù),成為2023年一大熱門領(lǐng)域。
不過,在技術(shù)層面,AI數(shù)字人產(chǎn)品未來還需要進(jìn)一步突破在圖像合成、語音合成和情感模擬等方面的技術(shù)壁壘,提高數(shù)字人的真實(shí)感和交互能力。在商業(yè)層面,隨著競爭的加劇,產(chǎn)品差異化和用戶體驗(yàn)或?qū)⒊蔀闆Q定市場競爭力的關(guān)鍵因素。
此外,還需要加強(qiáng)對(duì)數(shù)據(jù)收集、存儲(chǔ)和使用的監(jiān)管,以保護(hù)用戶的隱私權(quán)益,并確保數(shù)字人技術(shù)的合法、公正和透明的使用。
Synthesia
Synthesia是一個(gè)AI視頻創(chuàng)作平臺(tái),主要面向大型企業(yè)客戶等B端客戶,可以生成虛擬人視頻等。
Synthesia CEO曾在博客中透露,全球財(cái)富100強(qiáng)中有35%的公司正在使用Synthesia進(jìn)行培訓(xùn)和營銷,并且有超過5萬個(gè)團(tuán)隊(duì)使用這一工具大規(guī)模制作視頻,節(jié)省了80%的預(yù)算。
其背后的公司Synthesia是一家成立于2017年的英國AI創(chuàng)企,2023年6月,該公司獲得約9000萬美元融資,估值達(dá)到10億美元。
HeyGen
2023年10月底,美國知名女歌手Taylor Swift說普通話的視頻片段在網(wǎng)絡(luò)瘋傳,其背后使用的工具HeyGen一時(shí)間也受到廣泛關(guān)注。
HeyGen是一個(gè)數(shù)字人生成平臺(tái),于2022年7月29日上線。用178天的時(shí)間達(dá)成了100萬美元的ARR(年度經(jīng)常性收入)。
如果說Runway和Pika主要面向創(chuàng)意人員和消費(fèi)者,HeyGen則專注于解決B端客戶營銷、培訓(xùn)和教學(xué)視頻的需求。
2023年11月29日,HeyGen宣布獲得由Sarah Guo領(lǐng)投的Conviction Partners的560萬美元風(fēng)險(xiǎn)投資。這輪投資使得HeyGen的估值達(dá)到7500萬美元。
D-ID
D-ID是一家提供人工智能仿真人視頻產(chǎn)品服務(wù)和開發(fā)的公司。用戶只需上傳人像照片,輸入要說的內(nèi)容(臺(tái)詞),D-ID就能利用AI 語音機(jī)器人自動(dòng)將用戶輸入的內(nèi)容轉(zhuǎn)化為視頻。
D-ID的主要技術(shù)是人臉去識(shí)別化技術(shù)服務(wù),可以創(chuàng)造一個(gè)虛擬化講解員,在視頻中代替真人出鏡,介紹視頻內(nèi)容。
六、AI效率工具
由于有著龐大的用戶基數(shù),眾多工作場景也與AIGC的各項(xiàng)能力相適配,辦公是天然適合AI落地的場景之一。
隨著越來越多的辦公軟件卷起了AI,現(xiàn)在只要我們用自然語言描述自己的需求,AI就可以直接滿足。寫會(huì)議紀(jì)要、文案、畫圖、開發(fā)應(yīng)用、自動(dòng)生成PPT和Excel表格等,統(tǒng)統(tǒng)不在話下。
QuillBot
QuillBot是一款基于NLP的文章匯總寫作和增潤色工具,可以通過語義分析,自動(dòng)幫助用戶改寫文章、總結(jié)文章、擴(kuò)展文章。
這類文章助手在過去一年發(fā)展迅猛,但QuillBot近期面臨一定用戶流失。有分析稱,這主要與ChatGPT強(qiáng)大的零樣本學(xué)習(xí)能力有關(guān)。后者可以通過簡單提示實(shí)現(xiàn)無限主題的創(chuàng)作,顯然更具吸引力。
但就實(shí)際效果而言,QuillBot等專業(yè)寫作助手仍占優(yōu)。它們可以提供更加豐富的語法、邏輯和風(fēng)格指導(dǎo),輸出更流暢和更具邏輯性的文章。
Novel AI
Novel AI是一個(gè)針對(duì)內(nèi)容創(chuàng)作者設(shè)計(jì)的AI工具,主要用于輔助寫作,可以幫助作家和創(chuàng)作者產(chǎn)生新的創(chuàng)意,提供寫作靈感,甚至自動(dòng)完成或編輯故事。
Jasper AI
Jasper AI是一個(gè)流行的AI寫作助手,旨在幫助用戶更快、更高效地創(chuàng)建內(nèi)容,主要面向廣告專業(yè)人士、內(nèi)容營銷人員、企業(yè)家等用戶群體。
Jasper AI還提供各種寫作模板,包括博客文章、社交媒體帖子、營銷郵件和網(wǎng)頁內(nèi)容等。
Copy AI
Copy AI是一個(gè)AI驅(qū)動(dòng)的內(nèi)容生成工具,可以自動(dòng)生成創(chuàng)意文案、營銷文本和其他類型的寫作內(nèi)容,特別適用于營銷和廣告領(lǐng)域。
此外,Copy.AI還提供一個(gè)內(nèi)置的文檔編輯器,用戶可以在左側(cè)輸入指令或問題,在右側(cè)編輯和優(yōu)化輸出結(jié)果。
Notion AI
Notion AI是集成在Notion產(chǎn)品中的AI功能。Notion是一個(gè)筆記和項(xiàng)目管理工具,其集成的AI功能包括文本生成、內(nèi)容整理、數(shù)據(jù)分析等,旨在幫助用戶管理筆記、組織項(xiàng)目、自動(dòng)化常規(guī)任務(wù)等,提高工作效率。
回顧2023年,我們見證了人工智能領(lǐng)域的蓬勃發(fā)展和創(chuàng)新。?
除了大模型及生成式AI獨(dú)角獸企業(yè)飽受關(guān)注外,有著明星創(chuàng)始團(tuán)隊(duì)和廣闊應(yīng)用前景的新興AI產(chǎn)品也很容易獲得各路資本青睞。
隨著AI技術(shù)的不斷進(jìn)步,數(shù)據(jù)的不斷積累,以及算力的進(jìn)一步提升,可以預(yù)見,未來幾年,AI產(chǎn)品和應(yīng)用會(huì)越來越豐富,AI技術(shù)將繼續(xù)向更廣泛的領(lǐng)域滲透,包括醫(yī)療、金融、制造業(yè)等等。AI將為這些領(lǐng)域帶來更多的智能化解決方案,從而提高效率、降低成本,并推動(dòng)產(chǎn)業(yè)的轉(zhuǎn)型升級(jí)。
與此同時(shí),如何確保AI系統(tǒng)的公平性、透明性和可解釋性,如何平衡AI的發(fā)展與隱私保護(hù)之間的關(guān)系,以及如何避免AI技術(shù)被濫用或引發(fā)潛在的風(fēng)險(xiǎn)等等,也將成為重要議題。
作者公眾號(hào):頭號(hào)AI玩家(ID:AIGCplayer)
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
全部評(píng)論(1條)