ECI@創(chuàng)新科技 | GPT-3. 5 Turbo微調(diào)和API更新

轉(zhuǎn)載贊收藏 評(píng)論

舉報(bào) 2023-08-25

掃描,分享朋友圈

ECI @HiTech開欄語(yǔ)

【ECI @科技創(chuàng)新】是由ECI@HiTech科技創(chuàng)新專委會(huì)每周從全球精選熱門科技創(chuàng)新主題，幫助科技創(chuàng)新者和初創(chuàng)團(tuán)隊(duì)取得成功！讓我們共同攜手，尋找改變現(xiàn)有游戲規(guī)則的科技創(chuàng)新，激發(fā)人類的智慧和挑戰(zhàn)，實(shí)現(xiàn)科技的創(chuàng)新和夢(mèng)想。這就是科技創(chuàng)新的終極魅力！也是ECI”將創(chuàng)新帶入生活Bring Innovation to Life” 的使命所在！

通常來(lái)說，科技的發(fā)展都會(huì)交替經(jīng)歷平臺(tái)期和爆發(fā)期。平臺(tái)期的科技創(chuàng)新更多聚焦于識(shí)別并解決客戶現(xiàn)在的痛點(diǎn)，而爆發(fā)期的科技創(chuàng)新更多聚焦于引領(lǐng)并創(chuàng)造客戶未來(lái)的需求，劃時(shí)代的偉大科技創(chuàng)新往往誕生于此。

GPT-3. 5 Turbo的微調(diào)現(xiàn)已上線，GPT-4的微調(diào)將于今年秋季推出。此更新使開發(fā)人員能夠自定義對(duì)其用例性能更好的模型，并大規(guī)模運(yùn)行這些自定義模型。早期測(cè)試表明，經(jīng)過微調(diào)的GPT-3. 5 Turbo版本在某些狹窄的任務(wù)上可以與基本的GPT-4級(jí)別的能力相媲美，甚至超越。與我們所有的API一樣，發(fā)送到微調(diào)API的數(shù)據(jù)歸客戶所有，不會(huì)被OpenAI或任何其他組織用于訓(xùn)練其他模型。

調(diào)優(yōu)使用案例

自GPT-3.5 Turbo發(fā)布以來(lái)，開發(fā)人員和企業(yè)一直在要求能夠定制該模型，為其用戶創(chuàng)造獨(dú)特和差異化的體驗(yàn)。通過此次發(fā)布，開發(fā)人員現(xiàn)在可以運(yùn)行監(jiān)督式微調(diào)，以使其模型在常見用例中的表現(xiàn)更加出色。

在我們的私人測(cè)試版中，微調(diào)客戶已經(jīng)能夠針對(duì)其用例，顯著提高模型的表現(xiàn)，例如：

更高的可操縱性：微調(diào)使企業(yè)能夠更好地控制模型，例如使輸出簡(jiǎn)潔或始終以給定的語(yǔ)言響應(yīng)。例如，開發(fā)人員可以使用微調(diào)確保模型在提示使用該語(yǔ)言時(shí)始終以德語(yǔ)響應(yīng)。
可靠的輸出格式：微調(diào)提高了模型一致性地格式化響應(yīng)的能力——這對(duì)于要求特定響應(yīng)格式的應(yīng)用程序（例如代碼完成或編寫API調(diào)用）是至關(guān)重要的方面。開發(fā)人員可以使用微調(diào)來(lái)更可靠地將用戶提示轉(zhuǎn)換為高質(zhì)量的JSON片段，并可以將其與自己的系統(tǒng)一起使用。
自定義語(yǔ)氣：微調(diào)是調(diào)整模型輸出的質(zhì)量感受（例如語(yǔ)氣）的絕佳方式，使其更好地適應(yīng)企業(yè)的品牌聲音。具有可識(shí)別品牌聲音的企業(yè)可以使用微調(diào)使模型更加符合其語(yǔ)氣。

除了提高性能外，微調(diào)還使企業(yè)能夠縮短提示，同時(shí)確保相似的性能。與GPT-3.5-Turbo一起的微調(diào)還可以處理4k個(gè)標(biāo)記-是我們以前的微調(diào)模型的2倍。早期的測(cè)試人員通過將指令微調(diào)到模型本身，最多可將提示大小減少90％，從而加快每個(gè)API調(diào)用并降低成本。

微調(diào)在與其他技術(shù)（如提示詞工程、信息檢索和函數(shù)調(diào)用）結(jié)合使用時(shí)最為強(qiáng)大。查看我們的微調(diào)指南以了解更多信息。對(duì)函數(shù)調(diào)用和gpt-3. 5-turbo-16k的微調(diào)支持將在今年秋季晚些時(shí)候推出。

微調(diào)步驟

第1步：準(zhǔn)備數(shù)據(jù)
第2步：上傳文件
第3步：創(chuàng)建一個(gè)微調(diào)任務(wù)，一旦模型完成微調(diào)過程，就可以立即用于生產(chǎn)，并且與底層模型具有相同的共享速率限制。
第4步：使用微調(diào)后的模型

在不遠(yuǎn)的將來(lái)，我們還將推出一個(gè)微調(diào)UI，這將為開發(fā)人員提供有關(guān)正在進(jìn)行的微調(diào)任務(wù)、已完成的模型快照等的更輕松的訪問信息。

安全性

對(duì)我們來(lái)說，微調(diào)的部署是安全的，這一點(diǎn)非常重要。為了在微調(diào)過程中保留默認(rèn)模型的安全功能，微調(diào)訓(xùn)練數(shù)據(jù)通過我們的審核API和GPT-4驅(qū)動(dòng)的審核系統(tǒng)傳遞，以檢測(cè)與我們的安全標(biāo)準(zhǔn)沖突的不安全訓(xùn)練數(shù)據(jù)。

定價(jià)問題

微調(diào)成本分為兩個(gè)部分：初始訓(xùn)練成本和使用成本：

訓(xùn)練：0.008/1KTokens使用輸入：0.012/1K Tokens

使用輸出：$0.016/1K Tokens

例如，一個(gè)帶有100,000個(gè)tokens的訓(xùn)練文件的GPT-3.5-turbo微調(diào)作業(yè)經(jīng)過3個(gè)周期的訓(xùn)練，預(yù)計(jì)成本為2.40美元。

GPT-3的最新升級(jí)版本

7月份，我們宣布原始GPT-3基礎(chǔ)模型（ada、babbage、curie和davinci）將于2024年1月4日關(guān)閉。今天，我們提供babbage-002和davinci-002作為這些模型的替代品，可以是基礎(chǔ)模型也可以是微調(diào)模型。客戶可以通過查詢Completions API訪問這些模型。

這些模型可以使用我們新的API端點(diǎn)/v1/fine_tuning/jobs進(jìn)行微調(diào)。這個(gè)新的端點(diǎn)提供分頁(yè)和更多的擴(kuò)展性，以支持微調(diào)API的未來(lái)發(fā)展。從/v1/fine-tunes遷移到更新后的端點(diǎn)非常簡(jiǎn)單，更多詳細(xì)信息可以在我們新的微調(diào)指南中找到。這棄用了舊的/v1/fine-tunes端點(diǎn)，該端點(diǎn)將于2024年1月4日關(guān)閉。

GPT-3基礎(chǔ)模型和微調(diào)模型的定價(jià)如下：

注：本文內(nèi)容轉(zhuǎn)載于OpenAI文章：

GPT-3.5 Turbo fine-tuning and API updates

https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates

目前，2023 ECI Awards（艾奇獎(jiǎng)）正在征賽中，同時(shí)，我們?cè)谂c參賽者的日常交流中，也收到了許多關(guān)于比賽的詢問。為了提升參賽者的體驗(yàn)，ECI組委會(huì)將之前在征賽過程中，已經(jīng)發(fā)布的關(guān)于各類常見問題和關(guān)鍵信息等內(nèi)容，整理了一份參賽答疑必備手冊(cè)（請(qǐng)點(diǎn)擊鏈接進(jìn)行了解：ECI Awards 2023丨精彩紛呈！全面掌握?qǐng)?bào)獎(jiǎng)流程與技巧！）我們鼓勵(lì)各位參賽者能夠認(rèn)真準(zhǔn)備作品，并祝愿大家在比賽中斬獲佳績(jī)！

ECI Media官方媒體矩陣

聯(lián)系我們

本文系作者授權(quán)數(shù)英發(fā)表，內(nèi)容為作者獨(dú)立觀點(diǎn)，不代表數(shù)英立場(chǎng)。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_頭和結(jié)尾顯眼處標(biāo)注：作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。