ECI@創(chuàng)新科技 | GPT-3. 5 Turbo微調(diào)和API更新
ECI @HiTech開欄語(yǔ)
【ECI @科技創(chuàng)新】是由ECI@HiTech科技創(chuàng)新專委會(huì)每周從全球精選熱門科技創(chuàng)新主題,幫助科技創(chuàng)新者和初創(chuàng)團(tuán)隊(duì)取得成功!讓我們共同攜手,尋找改變現(xiàn)有游戲規(guī)則的科技創(chuàng)新,激發(fā)人類的智慧和挑戰(zhàn),實(shí)現(xiàn)科技的創(chuàng)新和夢(mèng)想。這就是科技創(chuàng)新的終極魅力!也是ECI”將創(chuàng)新帶入生活Bring Innovation to Life” 的使命所在!
通常來(lái)說,科技的發(fā)展都會(huì)交替經(jīng)歷平臺(tái)期和爆發(fā)期。平臺(tái)期的科技創(chuàng)新更多聚焦于識(shí)別并解決客戶現(xiàn)在的痛點(diǎn),而爆發(fā)期的科技創(chuàng)新更多聚焦于引領(lǐng)并創(chuàng)造客戶未來(lái)的需求,劃時(shí)代的偉大科技創(chuàng)新往往誕生于此。
GPT-3. 5 Turbo的微調(diào)現(xiàn)已上線,GPT-4的微調(diào)將于今年秋季推出。此更新使開發(fā)人員能夠自定義對(duì)其用例性能更好的模型,并大規(guī)模運(yùn)行這些自定義模型。早期測(cè)試表明,經(jīng)過微調(diào)的GPT-3. 5 Turbo版本在某些狹窄的任務(wù)上可以與基本的GPT-4級(jí)別的能力相媲美,甚至超越。與我們所有的API一樣,發(fā)送到微調(diào)API的數(shù)據(jù)歸客戶所有,不會(huì)被OpenAI或任何其他組織用于訓(xùn)練其他模型。
調(diào)優(yōu)使用案例
自GPT-3.5 Turbo發(fā)布以來(lái),開發(fā)人員和企業(yè)一直在要求能夠定制該模型,為其用戶創(chuàng)造獨(dú)特和差異化的體驗(yàn)。通過此次發(fā)布,開發(fā)人員現(xiàn)在可以運(yùn)行監(jiān)督式微調(diào),以使其模型在常見用例中的表現(xiàn)更加出色。
在我們的私人測(cè)試版中,微調(diào)客戶已經(jīng)能夠針對(duì)其用例,顯著提高模型的表現(xiàn),例如:
更高的可操縱性:微調(diào)使企業(yè)能夠更好地控制模型,例如使輸出簡(jiǎn)潔或始終以給定的語(yǔ)言響應(yīng)。例如,開發(fā)人員可以使用微調(diào)確保模型在提示使用該語(yǔ)言時(shí)始終以德語(yǔ)響應(yīng)。
可靠的輸出格式:微調(diào)提高了模型一致性地格式化響應(yīng)的能力——這對(duì)于要求特定響應(yīng)格式的應(yīng)用程序(例如代碼完成或編寫API調(diào)用)是至關(guān)重要的方面。開發(fā)人員可以使用微調(diào)來(lái)更可靠地將用戶提示轉(zhuǎn)換為高質(zhì)量的JSON片段,并可以將其與自己的系統(tǒng)一起使用。
自定義語(yǔ)氣:微調(diào)是調(diào)整模型輸出的質(zhì)量感受(例如語(yǔ)氣)的絕佳方式,使其更好地適應(yīng)企業(yè)的品牌聲音。具有可識(shí)別品牌聲音的企業(yè)可以使用微調(diào)使模型更加符合其語(yǔ)氣。
除了提高性能外,微調(diào)還使企業(yè)能夠縮短提示,同時(shí)確保相似的性能。與GPT-3.5-Turbo一起的微調(diào)還可以處理4k個(gè)標(biāo)記-是我們以前的微調(diào)模型的2倍。早期的測(cè)試人員通過將指令微調(diào)到模型本身,最多可將提示大小減少90%,從而加快每個(gè)API調(diào)用并降低成本。
微調(diào)在與其他技術(shù)(如提示詞工程、信息檢索和函數(shù)調(diào)用)結(jié)合使用時(shí)最為強(qiáng)大。查看我們的微調(diào)指南以了解更多信息。對(duì)函數(shù)調(diào)用和gpt-3. 5-turbo-16k的微調(diào)支持將在今年秋季晚些時(shí)候推出。
微調(diào)步驟
第1步:準(zhǔn)備數(shù)據(jù)
第2步:上傳文件
第3步:創(chuàng)建一個(gè)微調(diào)任務(wù),一旦模型完成微調(diào)過程,就可以立即用于生產(chǎn),并且與底層模型具有相同的共享速率限制。
第4步:使用微調(diào)后的模型
在不遠(yuǎn)的將來(lái),我們還將推出一個(gè)微調(diào)UI,這將為開發(fā)人員提供有關(guān)正在進(jìn)行的微調(diào)任務(wù)、已完成的模型快照等的更輕松的訪問信息。
安全性
對(duì)我們來(lái)說,微調(diào)的部署是安全的,這一點(diǎn)非常重要。為了在微調(diào)過程中保留默認(rèn)模型的安全功能,微調(diào)訓(xùn)練數(shù)據(jù)通過我們的審核API和GPT-4驅(qū)動(dòng)的審核系統(tǒng)傳遞,以檢測(cè)與我們的安全標(biāo)準(zhǔn)沖突的不安全訓(xùn)練數(shù)據(jù)。
定價(jià)問題
微調(diào)成本分為兩個(gè)部分:初始訓(xùn)練成本和使用成本:
訓(xùn)練:0.008/1KTokens使用輸入:0.012/1K Tokens
使用輸出:$0.016/1K Tokens
例如,一個(gè)帶有100,000個(gè)tokens的訓(xùn)練文件的GPT-3.5-turbo微調(diào)作業(yè)經(jīng)過3個(gè)周期的訓(xùn)練,預(yù)計(jì)成本為2.40美元。
GPT-3的最新升級(jí)版本
7月份,我們宣布原始GPT-3基礎(chǔ)模型(ada、babbage、curie和davinci)將于2024年1月4日關(guān)閉。今天,我們提供babbage-002和davinci-002作為這些模型的替代品,可以是基礎(chǔ)模型也可以是微調(diào)模型。客戶可以通過查詢Completions API訪問這些模型。
這些模型可以使用我們新的API端點(diǎn)/v1/fine_tuning/jobs進(jìn)行微調(diào)。這個(gè)新的端點(diǎn)提供分頁(yè)和更多的擴(kuò)展性,以支持微調(diào)API的未來(lái)發(fā)展。從/v1/fine-tunes遷移到更新后的端點(diǎn)非常簡(jiǎn)單,更多詳細(xì)信息可以在我們新的微調(diào)指南中找到。這棄用了舊的/v1/fine-tunes端點(diǎn),該端點(diǎn)將于2024年1月4日關(guān)閉。
GPT-3基礎(chǔ)模型和微調(diào)模型的定價(jià)如下:
注:本文內(nèi)容轉(zhuǎn)載于OpenAI文章:
GPT-3.5 Turbo fine-tuning and API updates
https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates
目前,2023 ECI Awards(艾奇獎(jiǎng))正在征賽中,同時(shí),我們?cè)谂c參賽者的日常交流中,也收到了許多關(guān)于比賽的詢問。為了提升參賽者的體驗(yàn),ECI組委會(huì)將之前在征賽過程中,已經(jīng)發(fā)布的關(guān)于各類常見問題和關(guān)鍵信息等內(nèi)容,整理了一份參賽答疑必備手冊(cè)(請(qǐng)點(diǎn)擊鏈接進(jìn)行了解:ECI Awards 2023丨精彩紛呈!全面掌握?qǐng)?bào)獎(jiǎng)流程與技巧!)我們鼓勵(lì)各位參賽者能夠認(rèn)真準(zhǔn)備作品,并祝愿大家在比賽中斬獲佳績(jī)!
ECI Media官方媒體矩陣
聯(lián)系我們
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。
評(píng)論
評(píng)論
推薦評(píng)論
暫無(wú)評(píng)論哦,快來(lái)評(píng)論一下吧!
全部評(píng)論(0條)