带玩具逛街时突然按下按钮的故事,丰满的妺妺3伦理播放,新婚人妻不戴套国产精品,大肉大捧一进一出好爽视频百度

怎么向大模型要生產力,訊飛星火的“三問三答”

原創 收藏 評論
舉報 2024-03-30

埃弗雷特·羅杰斯在《創新與擴散》中提出過一個著名觀點:一種創新在剛起步時接受程度比較低,使用人數較少,擴散過程也就相對遲緩,當使用者比例達到臨界值后,創新擴散過程就會快速地增加。

風頭正盛的大模型浪潮,再次印證了創新擴散理論的適用性:三年前還只有少數幾個科技大廠參與,價值被初步驗證的2023年,即上演了“百模大戰”的一幕,2024年大概率是大模型落地應用的元年,向千行萬業加速擴散。

由此產生的一個問題是:怎么將大模型的能力延伸到產業一線,最適合中國產業結構的路徑是什么?

半個多月前的華為中國合作伙伴大會2024上,科大訊飛副總裁劉江參與了“計算峰會”的討論,圍繞大模型落地應用的路線、場景和生態,分享了訊飛星火在過去一年時間里的探索和答案。

01 大模型的能力從何而來?

盡管不同統計口徑下的數據有所差別,但可以肯定的是,目前國內的大模型數量已經有上百個,用“遍地都是”來形容大模型行業,并不算夸張。問題在于,為什么大模型的數量越來越多,產業應用尚未渡過拐點?

大模型的行業競爭,從來都不是拼數量的游戲,經過一段時間的跟風、躁動后,還是要回到能力上。

2024年1月30日,訊飛星火正式升級到V3.5版本,在語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力和多模態能力七個方面進行了全面升級,其中語言理解、數學能力超過GPT-4 Turbo,代碼達到GPT-4 Turbo的96%,多模態理解達到GPT-4V的91%。

同期發布的星火語音大模型,在中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI的Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個語種平均MOS分絕對提升了0.25,擬人度超過83%,均達到了國際領先水平。

訊飛星火認知大模型在“百模大戰”中脫穎而出的背后,離不開昇騰AI和科大訊飛在算力底座上的聯合突破。

時間回到2023年4月,訊飛星火V1.0發布前夕。有別于一些大模型廠商搶時間上線的做法,科大訊飛在同步思考一個長遠問題:為了避免被卡脖子,怎么將大模型的能力架構在一個自主創新的體系上?

接下來近一年的時間里,昇騰AI和科大訊飛針對大模型訓練進行了一系列技術攻關,包括大模型底層算子庫開發和優化、大模型算法遷移、超大規模集群智能化運維軟件開發等等。

雙方聯合開發和優化了50多個大模型算子,其中科大訊飛基于昇騰自主開發自定義的關鍵算子就超過10個,最終讓大模型的訓練性能提升了3倍以上,和國外同類產品不相上下。

6個月后的訊飛開發者節上,雙方向外界公布了一個新消息:首個支撐萬億參數大模型訓練的國產算力平臺“飛星一號”正式啟用,基于昇騰AI基礎軟硬件平臺和大容量交換機構建參數面無損ROCE組網,配置高空間的全閃和混閃并行文件系統,可以支撐萬億參數大模型高速訓練。

解決了大模型的算力底座后,聯合創新的勢能被進一步釋放,先后訓練出了訊飛星火V3.5、星火語音大模型、星火開源大模型以及12個行業大模型,為大模型的能力提升注入了源源不斷的動力。

02 大模型的能力怎么輸出?

大模型的能力不能停留在參數上,停留在評測報告中,想要解放生產力,前提是讓大模型的能力落到一個個業務場景中。由此產生的關鍵問題是:大模型的能力怎么輸出,怎么降低落地門檻?

經過一年多的摸索后,行業上下游逐漸形成了一種共識,即通過預訓練產生通用大模型,再在通用大模型的基礎上,使用特定的行業數據精調出行業大模型,然后基于通用大模型或行業大模型來開發應用。

訊飛星火遵循了大模型落地的行業共識。有所不同的是,訊飛星火還提供了一條條通往產業一線的路。

為了滿足不同規模不同場景的快速部署需求,訊飛星火在“飛星一號”的基礎上,進一步開放了底層算力構建和運維能力、大模型訓練平臺和工具鏈,以及數據清洗、數據訓練、應用開發等全套工具,讓企業可以構建自己的智算底座。

為了滿足企業專有大模型的推理應用需求,科大訊飛和華為在2023年8月發布了“星火一體機”,提供底層算力、AI框架、訓練算法、推理能力、應用成效等AI能力,讓每家企業或機構都能獲得“開箱即用”的大模型一體化解決方案。

為了加速企業大模型應用價值的落地,科大訊飛的答案是星火優化套件,包含星火通用大模型、行業大模型優化套件和場景應用優化套件,并未局限在模型和算力層面,而是嘗試在配套服務和能力上打通大模型落地的“最后一公里”。

回到創新擴散理論的話題上,創新擴散的過程離不開千千萬萬的開發者,他們無疑是大模型走進千行萬業的“螞蟻雄兵”。特別是整個行業還處于“摸著石頭過河”的階段時,“獨角戲”注定不是可行的方式。

所以,訊飛星火在幫助企業和機構降門檻的同時,不斷向開發者拋出橄欖枝,不斷拉近開發者和大模型的距離。

比如訊飛星火在昇思社區等平臺上開源了13B大模型,并向開發者提供基礎模型、精調模型、微調工具、人格定制工具、高質量多語種語料等等,通過給開發者提供全生命周期的服務,讓他們把精力聚焦在想要解決的問題上,做最大的投入和努力,而非把時間花在不必要的事務中。

簡單做個總結的話,訊飛星火的路線并不復雜:一方面降低大模型的門檻,涵蓋訓練、推理、部署等環節;另一方面為開發者賦能,讓他們參與到大模型落地應用的浪潮中。初衷則是借助合理的分工,跑通大模型價值釋放的產業鏈條,讓大模型不再是美好卻空洞的花瓶,而是實實在在的生產力。

03 大模型落地到哪些場景?

大模型的落地又不能一味求快。很多行業對大模型的態度仍是技術上的新鮮感,勢必要有一個價值持續驗證的過程,落地到哪些場景,帶來什么樣的價值,直接影響著外界對新生產力的認知。

就像瓦特在改良蒸汽機后,沒有預想中那樣迅速在全世界鋪開,而是經歷了近半個世紀的探索,直到在紡織領域“打敗”水能,才讓蒸汽機和產業革命掛鉤。每一次工業革命的出現,與其說是技術課題,不如說是一個經濟課題。

同樣的問題也擺在大模型面前,成為新一輪工業革命“引擎”的前提,是產生肉眼可見的經濟效益。

科大訊飛在2023年7月打造了一支名為“星火軍團”的精銳隊伍,被定義為探索大模型價值落地的戰略業務組織。歷經9個月的穩扎穩打,星火大認知模型帶來的生產力變革正在被越來越多的行業認可。

在能源領域,國家能源集團與科大訊飛聯手開啟了能源行業數字化、智能化轉型的新篇章。

在智慧城市領域,湖北省利川市依托訊飛星火認知大模型和昇騰算力,構建了自主創新人工智能公共算力平臺,驅動利川數字產業、智慧文旅、康養產業、智慧農業等領域全面發展。

其中利川文旅大模型發布將在今年五一正式上線使用,將從旅游線路規劃、旅客需求收集、客流高峰控制等方面,為景區的精細化管理提供科學高效的輔助決策,推動文化和旅游深度融合、一體化發展。

在科研領域,中科院文獻情報中心與科大訊飛合作推出的星火科研助手,提供成果調研、論文研讀和學術寫作三大功能;三亞崖州灣科技城借助科研助手增強科研文獻檢索和分析能力,并通過科技文獻大模型為科研人員提供建議指導,提高了研究效率和質量。

在銀行領域,與某國有銀行強強聯合,實現訊飛星火在客服、展業、辦公、研發等場景的賦能,并正在重點打造銀行領域的代碼能力應用標桿。

在教育領域,謙萃智能利用iFlyCode智能編程助手為教師提供了高效的備課支持,簡化課程內容,使學生更易于理解和掌握。在團隊協作的項目中,iFlyCode顯著減少了所需的人力和時間資源。這些綜合效果共同促進了教育資源的優化配置和學習效率的整體提升,得到了師生們的廣泛認可。

諸如此類的案例還有很多。需要說明的是,以上只是訊飛星火示范的標志性應用場景,目的是幫助企業探索大模型在B端的商業化之路,讓千行萬業看見大模型的價值所在。

在訊飛開放平臺上,生態開發者團隊609.5萬,其中大模型直接開發者的數量41萬,他們才是點燃大模型落地應用的星星之火,不斷將大模型的能力帶入到實際工作中,不斷拓寬大模型應用的邊界。

04 寫在最后

大模型的產業之路還很長,昇騰AI和訊飛星火的合作,無疑為外界提供了一種值得借鑒的范式:在算力等基礎設施上打破大模型訓練的瓶頸,為大模型的能力輸出開辟出一條條可行的路,然后由開發者們創造無數個解決問題的應用。

有理由相信,沿著這樣已經被證實的路徑走下去,持續做好應用落地,形成數據飛輪,同時在大模型層面進行可持續迭代和進化,終將會渡過大模型產業應用的“拐點”,帶來百倍、千倍的需求,營造出充滿生機的大模型產業生態。


本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
轉載請在文章開頭和結尾顯眼處標注:作者、出處和鏈接。不按規范轉載侵權必究。
本文系作者授權數英發表,內容為作者獨立觀點,不代表數英立場。
未經授權嚴禁轉載,授權事宜請聯系作者本人,侵權必究。
本內容為作者獨立觀點,不代表數英立場。
本文禁止轉載,侵權必究。
本文系數英原創,未經允許不得轉載。
授權事宜請至數英微信公眾號(ID: digitaling) 后臺授權,侵權必究。

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評論

    評論

    文明發言,無意義評論將很快被刪除,異常行為可能被禁言
    800

    推薦評論

    暫無評論哦,快來評論一下吧!

    全部評論(0條)

    主站蜘蛛池模板: 临颍县| 龙陵县| 泾川县| 凌源市| 昌江| 甘谷县| 图木舒克市| 朝阳市| 松潘县| 前郭尔| 南宁市| 镇巴县| 田阳县| 吐鲁番市| 寻乌县| 柳江县| 花垣县| 宁陵县| 嘉祥县| 舟曲县| 西安市| 通州区| 洛宁县| 博客| 丰顺县| 厦门市| 东乌| 大冶市| 陇西县| 行唐县| 福州市| 天柱县| 当雄县| 宝鸡市| 平昌县| 太仆寺旗| 廉江市| 云安县| 闵行区| 手机| 观塘区|