12月20日,2023百度云智大會·智算大會在北京舉辦,大會以「大模型重構云計算,Cloud for AI」為主題,深度聚焦大模型引發(fā)的云計算變革。
百度智能云表示,為滿足大模型落地需求,正在基于「云智一體」戰(zhàn)略重構云計算服務,目前已完成從底層基礎設施—大模型開發(fā)與應用—AI原生應用開發(fā)的端到端升級重構:全面升級百舸等20多個云計算基礎設施、千帆大模型平臺再升級、AI原生應用開發(fā)工作臺“千帆AppBuilder”全面開放。
智算大會現場,百度智能云還公布了最新“成績單”。自8月31日文心大模型向全社會全面開放以來,在千帆大模型平臺上,大模型API日調用量增長10倍。目前千帆平臺已經累計服務超過4萬家企業(yè)用戶,累計幫助企業(yè)用戶精調近1萬個大模型。相較于自建系統(tǒng)訓練大模型,使用千帆平臺訓練的成本最高可以下降90%。
大模型正在重構云計算
“AI原生時代開啟,大模型正在驅動云計算產業(yè)創(chuàng)新變革?!卑俣燃瘓F副總裁侯震宇表示:“大模型重構云計算主要體現在三個層面:AI原生云將改變云計算的格局,模型即服務(MaaS)會成為新的基礎服務,AI原生應用催生新的研發(fā)范式?!?br /> 首先,在云基礎設施層,移動互聯網時代的應用,底層大多依賴CPU算力,而AI應用對GPU或異構計算的需求大幅增加,云市場的底層算力需求將逐漸轉向以GPU為主。
其次,在模型層,大模型正在成為通用的服務能力,即MaaS。MaaS將大幅降低Al落地的門檻,實現真正的Al普惠。
最后,在應用層,應用開發(fā)的范式已經被徹底顛覆。大模型理解、生成、邏輯、記憶的獨特能力會催生A原生應用研發(fā)新范式,整個應用技術棧、數據流和業(yè)務流都將被改變。
百度集團副總裁侯震宇
侯震宇表示,總體來說,構建繁榮的A原生應用生態(tài),需要大模型、智能算力、AI原生應用研發(fā)新范式三要素相輔相成。大模型是AI原生應用的“大腦”,智能計算則為A原生應用運行提供堅實支撐,新研發(fā)范式助力開發(fā)者高效基于大模型能力開發(fā)應用。數據飛輪是成功的AI原生應用的充分必要條件,讓大模型能力高速迭代,產品體驗持續(xù)進步。
云計算全面升級:五大領域20余款全棧產品集中發(fā)布
AI原生時代,面向大模型的云計算基礎設施體系將全面重構。侯震宇表示,百度智能云將在三大方面重構云計算服務,即:面向模型的智算基礎設施、面向數據的數據基礎設施、面向應用的云基礎設施,以支撐AI原生應用落地。
大會現場,百度智能云密集發(fā)布和升級了20多款云計算產品,涵蓋智能計算、通用計算、數據庫和大數據、分布式云、應用開發(fā)平臺五大領域。
在智能計算領域,算力是大模型落地的基礎條件,當前大模型訓練、推理、部署對高速互聯、計算效率、算力成本等都提出了高要求,需要打造新型的智算基礎設施。但目前的計算集群還面臨不少挑戰(zhàn),大模型訓練時間長、易出錯、穩(wěn)定性差,算力集群規(guī)模大、系統(tǒng)復雜度高也增加了運維難度。
全新發(fā)布的百度百舸·AI異構計算平臺3.0,針對AI原生應用以及大模型的訓練、推理等環(huán)節(jié)進行了專項優(yōu)化。百舸3.0在穩(wěn)定、高效、易運維三個方面大幅升級產品能力,實現萬卡級別任務有效訓練時長達到98%以上,帶寬有效性可達95%。相比自建智算基礎設施,可以實現模型訓、推吞吐分別最高提升30%和60%。
百度百舸3.0發(fā)布
針對AI原生時代智能算力的供給平衡問題,百度智能云發(fā)布智算網絡平臺。在算力資源層面,智算網絡平臺支持將百度及第三方建設的智算中心、超算中心、邊緣節(jié)點等智算節(jié)點進行全域接入,將分散和異構的算力資源連接起來,形成統(tǒng)一的算力網絡資源池,再通過百度自主研發(fā)的算力調度算法,智能分析各類算力資源的狀態(tài)、性能和利用率等指標,統(tǒng)一調度算力,讓智算資源靈活、穩(wěn)定、高效地交付給有需求的用戶,實現智算資源的“南水北調”。
在通用計算領域,計算、存儲、網絡等云原生基礎設施也需要面向AI原生時代重構升級,提供更具彈性、高性能和智能化的運維能力。
本次大會,百度太行·計算新增了三款計算實例:全新推出第7代(通用計算型)云服務器實例G7,綜合性能較上一代產品提升10%;發(fā)布昆侖芯彈性裸金屬實例NKL5,搭載了百度自研的昆侖芯R300加速處理器,在大模型推理場景綜合性能較業(yè)界主流加速卡可提升達50%;發(fā)布基于昇騰910B加速處理器打造的彈性高性能計算實例NH6T,在大模型訓練場景中,綜合性能較業(yè)界主流加速卡提升可達40%。
同時,高性能計算平臺CHPC(CloudHPC)正式發(fā)布,為用戶提供的一站式公共云HPC服務。在資源使用層面,CHPC支持用戶一鍵創(chuàng)建高性能計算環(huán)境,并根據業(yè)務變化靈活使用云上資源;在業(yè)務應用層面,CHPC支持集成藥物研發(fā)、基因測序等行業(yè)的應用。此外,結合集成在VPC內的百度網盤等服務,用戶可以輕松實現HPC源文件從提交、上傳、處理、結果回傳,到分發(fā)的數據全鏈路打通,助力研發(fā)提效。
在分布式云方面,百度智能云帶來三大升級:邊緣計算節(jié)點BEC產品能力升級,打造全球統(tǒng)一的邊緣計算網絡和產品體驗,打造AI原生應用時代能力最完善的“云邊一體”;專有云ABCStack新能力發(fā)布,支持本地部署百度智能云千帆大模型平臺;本地計算集群LCC新能力發(fā)布,支持全新一代CPU/GPU實例以及完整的百度智能云AI&HPC集群管理能力,進一步豐富完善基礎設施與云產品支持能力矩陣。
大模型落地不僅需要算力支持,還需要對各類數據和海量的知識進行存儲、管理和分析工作。百度智能云在云存儲、云原生數據庫、大數據平臺等數據基礎設施領域發(fā)布了一系列重磅新品。
百度滄?!ご鎯?#xff0c;統(tǒng)一技術底座正式發(fā)布,能夠支持各類存儲產品,同時滿足AI原生時代的大規(guī)模、高性能、低成本的存儲要求。全新升級的對象存儲BOS、云磁盤CDS、并行文件存儲PFS等產品,面向數據湖存儲和AI存儲能力進行了全面增強,加速智能計算,釋放數據價值。
云原生數據庫GaiaDB4.0版本正式發(fā)布,增強并行查詢能力,突破單機計算瓶頸,實現跨機多核并行查詢,在混合負載和實時分析業(yè)務場景中性能提升超過10倍;針對不同的工作負載推出列存索引和列存引擎,提升不同規(guī)模數據的查詢速度,其中列存引擎最大可支持PB級數據的復雜分析,并且與事務處理業(yè)務嚴格復雜隔離;通過共識協議優(yōu)化、鏈路優(yōu)化、自適應動態(tài)回放存儲多版本等一系列數據流深度優(yōu)化,大幅提升GaiaDB整體性能60%以上。
大會期間,杭州吉利易云科技有限公司總經理成品耀,分享了吉利集團攜手百度智能云的打造集團專有云,打造數字基建底座。目前吉利集團已實現車聯網、生產制造業(yè)務上云,且正在基于這套高效、穩(wěn)定的基礎設施平臺構建企業(yè)級AI大模型能力,全方位賦能集團業(yè)務。
杭州吉利易云科技有限公司總經理成品耀
模型即服務(MaaS):千帆大模型平臺再升級
在AI原生時代,大模型將作為新的通用服務能力,由模型即服務(MaaS)平臺提供給廣大用戶。百度智能云千帆大模型平臺(以下簡稱“千帆平臺”)作為業(yè)界領先的MaaS服務平臺,預置了包括百度文心大模型在內的、國內最多的54個主流基礎大模型和行業(yè)大模型,還為大模型的持續(xù)預訓練、精調、評估、壓縮和部署等環(huán)節(jié)提供最完善易用的工具鏈,幫助客戶針對自身業(yè)務場景快速定制專屬大模型。相較于自建系統(tǒng)訓練大模型,使用千帆平臺訓練的成本最高可以下降90%。
百度智能云千帆大模型平臺
目前,千帆平臺已經累計服務超過40000家企業(yè)用戶,精調近10000個大模型。本次智算大會,針對客戶應用大模型最關心的“提效”和“降本”兩大核心訴求,千帆平臺發(fā)布一系列全新功能。
在數據方面,千帆平臺提供完善、高效的大模型數據管理工具鏈,包括數據采集,清洗、自動標注、自動增強與推理數據多維評估等功能,助力用戶快速構建自身業(yè)務“數據飛輪”,實現反饋驅動增長。全新發(fā)布的數據統(tǒng)計分析、數據質量檢查等功能,支持用戶獲取全方位的數據洞察信息,結合數據清洗可視化Pipeline,能夠構建出面向大模型場景的高質量數據燃料,為大模型訓練“保駕護航”,千帆也因此成為國內首個支持大模型多方位數據分析的MaaS服務平臺。
作為模型部署上線前的“最后一公里”,模型評估能夠對大模型的輸出效果、計算性能等進行全方位評估,確保大模型上線后AI原生應用的效果穩(wěn)定可靠。千帆平臺創(chuàng)新性地引入自動化與人工結合的雙重評估機制,充分發(fā)揮雙方優(yōu)勢,大幅提升模型評估效率與質量。一方面,百度文心大模型作為AI裁判員,能夠對被評估模型的回答進行自動化打分,極大程度地減少海量重復性人工作業(yè);另一方面,由數據標注員/業(yè)務專家對大模型回答進行打分,則能夠實現對大模型回答質量的精細化衡量。
此外,千帆平臺靈活的計價方式,如Tokens(適用靈活性要求較高的業(yè)務)、TPM(TokensperMinute,適用于較大并發(fā)量業(yè)務)、批量計算(適用于離線內容生產等對實時性要求較低,吞吐較大的任務)、算力單元(適用于需要專享硬件部署模型的客戶)等,可以輕松滿足客戶的多種業(yè)務場景需要,助力企業(yè)低成本用好大模型。
賦能AI原生應用開發(fā):千帆AppBuilder正式開放服務
為了滿足企業(yè)敏捷、高效地進行AI原生應用開發(fā)的需求,降低AI原生應用開發(fā)門檻,百度智能云千帆AppBuilder正式開放服務。
AppBuilder將大模型開發(fā)AI原生應用的常見模式、工具、流程,沉淀成一個工作臺,幫助開發(fā)者聚焦業(yè)務本身,而無需為開發(fā)過程牽扯多余精力。具體來講,AppBuilder主要由組件、框架兩層服務構成。
「組件」服務由多模態(tài)的AI能力組件(如文字識別、文生圖等)、基于大語言模型的能力組件(如長文總結、nl2sql等)、基礎組件(如向量數據庫、對象存儲等)三部分組成,是對底層服務能力的組件化封裝,讓每個組件完成一個特定的功能。
「框架」則是通過將上述這些組件有選擇地串聯、組合起來,讓它們能夠比較完整地完成一個特定場景的任務。目前,AppBuilder提供的檢索增強生成(RAG)、智能體(Agent)、智能數據分析(GBI)就是常用的AI原生應用框架。
AppBuilder提供兩種產品形態(tài),代碼態(tài)與低代碼態(tài)。對于有深度AI原生應用開發(fā)需求的用戶,AppBuilder代碼態(tài)提供包括SDK、開發(fā)環(huán)境、調試工具、應用示例代碼等各種開發(fā)套件和應用組件;而AppBuilder低碼態(tài)則提供可視化工具,用戶只需簡單點選,即可快速定制、上線AI原生應用。
百度智能云千帆AppBuilder
百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏認為,繁榮的AI原生應用生態(tài),會驅動經濟增長。今年10月,百度智能云推出了國內首個大模型全鏈路生態(tài)支持體系,為合作伙伴提供包括賦能培訓、AI原生應用孵化、銷售商機、市場營銷等全方位的支持,致力于繁榮AI原生應用生態(tài)。
侯震宇預判,2024年將成為AI原生應用的元年,迎來AI原生應用的爆發(fā)式增長。百度智能云將持續(xù)推出有競爭力的產品方案,與伙伴一起深耕客戶應用場景,讓更多的AI原生應用創(chuàng)新涌現。
相關稿件