“過去一臺(tái)AI服務(wù)器裝四張顯卡,現(xiàn)在客戶要的都是能裝八張甚至十張顯卡的高端設(shè)備?!?2月18日,在2023?AI?Tech?Day暨首屆人工智能生態(tài)發(fā)展峰會(huì)現(xiàn)場(chǎng),服務(wù)器廠商正展示全新升級(jí)的AI大模型服務(wù)器。中國證券報(bào)記者在現(xiàn)場(chǎng)了解到,AI大模型迭代速度越來越快,廠商對(duì)智能算力投入大幅增加,支持存儲(chǔ)和訓(xùn)練的高端AI服務(wù)器的需求激增。不少AI服務(wù)器廠商今年訂單都集中在高端AI服務(wù)器上。?
業(yè)內(nèi)人士表示,隨著AI大模型加速迭代,智能算力已成為稀缺資源。未來較長一段時(shí)間內(nèi),我國AI服務(wù)器市場(chǎng)維持供不應(yīng)求狀態(tài),國產(chǎn)AI芯片市場(chǎng)規(guī)模增長迎來關(guān)鍵窗口期。?
高端AI服務(wù)器搶手?
當(dāng)前,大模型廠商產(chǎn)品迭代如火如荼。據(jù)百川智能創(chuàng)始人、CEO王小川介紹,目前百川大模型保持每個(gè)月一次模型數(shù)據(jù)的迭代。?
AI大模型正帶動(dòng)AI服務(wù)器算力需求持續(xù)擴(kuò)張。安擎計(jì)算機(jī)相關(guān)負(fù)責(zé)人告訴記者,2023年,由于行業(yè)投資趨于謹(jǐn)慎,判別式AI應(yīng)用場(chǎng)景收縮,AI服務(wù)器市場(chǎng)整體銷售臺(tái)數(shù)同比有所下降,但訂單金額同比將會(huì)呈現(xiàn)增長態(tài)勢(shì)。這是由于AI大模型算力需求集中爆發(fā),成為智能算力的最大需求方。?
“AI大模型廠商都在加快迭代速度,客戶根本等不起你去建機(jī)房,而是希望拎包入住。”鴻博股份副總裁、英博數(shù)科CEO周韡韡告訴記者,“我們現(xiàn)在都是找一些已經(jīng)建好的機(jī)房,然后把設(shè)備放進(jìn)去,快速組網(wǎng),調(diào)試好后交付給客戶。AI大模型的發(fā)展讓人看到的不僅是效率提升,似乎全行業(yè)迭代周期都在縮短?!?
高端AI服務(wù)器設(shè)備十分緊俏?!按竽P陀?xùn)練所需數(shù)據(jù)激增,AI大模型廠商需要的是能夠支持存儲(chǔ)和訓(xùn)練的高端AI服務(wù)器。因此各服務(wù)器廠商目前都在升級(jí)芯片規(guī)格、擴(kuò)大卡組數(shù)量,向高端AI服務(wù)器方向升級(jí)?!鄙鲜霭睬嬗?jì)算機(jī)相關(guān)負(fù)責(zé)人稱。?
我國智能算力資源稀缺。艾瑞咨詢發(fā)布的《2023年中國智能計(jì)算中心行業(yè)發(fā)展白皮書》顯示,2022年,中國智能算力規(guī)模占全部算力的比重為22%;從服務(wù)器結(jié)構(gòu)來看,2022年,我國通用服務(wù)器占服務(wù)器總量比重為93.2%,而AI服務(wù)器僅占服務(wù)器總量的6.8%。多位業(yè)內(nèi)人士表示,未來較長一段時(shí)間內(nèi),我國AI服務(wù)器市場(chǎng)維持供不應(yīng)求狀態(tài)。?
算力產(chǎn)業(yè)鏈迎利好?
隨著AI大模型算力需求強(qiáng)勁,今年以來,國內(nèi)算力產(chǎn)業(yè)鏈公司接連斬獲新訂單。?
12月4日,鴻博股份公告稱,子公司英博數(shù)科向百川智能提供一定規(guī)模的英偉達(dá)智算服務(wù)器,及其所有的算力資源以及配套軟件應(yīng)用和技術(shù)服務(wù),涉及交易總金額預(yù)計(jì)達(dá)313.82億元。據(jù)周韡韡介紹,截至2023年12月,英博數(shù)科累計(jì)簽約額超18億元。?
公開資料顯示,神州數(shù)碼在10月29日至11月19日期間共簽訂四筆銷售神州鯤泰品牌昇騰AI服務(wù)器訂單,合同總金額達(dá)6.24億元。?
青云科技10月15日公告稱,公司向高新興訊美科技股份有限公司采購6.84億元GPU服務(wù)器(含配套產(chǎn)品),并與客戶簽訂6.90億元銷售合同,向其銷售上述GPU服務(wù)器(含配套產(chǎn)品)。?
在AI大模型浪潮的帶動(dòng)下,人工智能芯片、服務(wù)器、數(shù)據(jù)中心市場(chǎng)規(guī)模將顯著提升。IDC預(yù)計(jì),2023年中國人工智能芯片出貨量將達(dá)到133.5萬片,同比增長22.5%。?
人工智能服務(wù)器方面,IDC預(yù)計(jì),2023年中國人工智能服務(wù)器市場(chǎng)規(guī)模將達(dá)到91億美元,同比增長82.5%;2027年將達(dá)到134億美元,年均復(fù)合增長率為21.8%。?
智算中心建設(shè)步伐加快。據(jù)不完全統(tǒng)計(jì),截至2023年8月,全國已有超過30個(gè)城市建設(shè)智算中心。?
中信證券表示,AI的持續(xù)發(fā)展拉動(dòng)智能算力需求和建設(shè)水平提升,為光模塊、服務(wù)器等領(lǐng)域帶來持續(xù)增長機(jī)會(huì)。?
做好生態(tài)建設(shè)?
AI大模型時(shí)代,進(jìn)口品牌GPU等高端芯片供應(yīng)面臨周期波動(dòng)挑戰(zhàn),為國產(chǎn)AI芯片加速推向市場(chǎng)打開關(guān)鍵窗口。不過,AI大模型的訓(xùn)練、推理和海量數(shù)據(jù)存儲(chǔ)無一不需要高性能算力支撐,也對(duì)國產(chǎn)算力底層基礎(chǔ)設(shè)施能力和生態(tài)建設(shè)提出考驗(yàn)。?
艾瑞咨詢產(chǎn)業(yè)數(shù)字化研究院負(fù)責(zé)人徐樊磊表示,在AI大模型爆發(fā)之前,國內(nèi)的智能算力資源主要用于推理端。AI大模型趨勢(shì)到來,使國內(nèi)廠商開始推出訓(xùn)練端的算力硬件產(chǎn)品和服務(wù),但目前相關(guān)產(chǎn)品能力比起全球領(lǐng)先算力能力仍有較大差距。?
業(yè)內(nèi)人士表示,在計(jì)算層面,由于芯片廠商在開發(fā)過程中使用的技術(shù)路線不同,導(dǎo)致芯片適配服務(wù)器等設(shè)備的開發(fā)周期普遍很長。在訓(xùn)練層面,單芯片算力有限,而大模型訓(xùn)練需要大規(guī)模的算力集群,需要算力系統(tǒng)具有靈活的算力擴(kuò)展能力。在存儲(chǔ)層面,多模態(tài)大模型的訓(xùn)練和推理對(duì)存儲(chǔ)提出了更高要求。?
近年來,我國AI算力市場(chǎng)高度依賴英偉達(dá)GPU硬件和相應(yīng)的軟件生態(tài)。周韡韡坦言,全球90%的AI工程師都在使用英偉達(dá)GPU配套的CUDA軟件生態(tài),這和英偉達(dá)GPU在全球的壟斷地位完全匹配?!耙恍﹪a(chǎn)GPU計(jì)算性能并非絕對(duì)不夠,而是若要把國產(chǎn)GPU和基于CUDA架構(gòu)開發(fā)的設(shè)備進(jìn)行適配,需要在調(diào)試和優(yōu)化上花費(fèi)大量精力,導(dǎo)致用戶使用算力的效率下降。”?
然而,隨著英偉達(dá)芯片進(jìn)口難度不斷提升,國產(chǎn)AI芯片自主創(chuàng)新任重道遠(yuǎn)。?
記者梳理發(fā)現(xiàn),浪潮信息、海光信息、希姆計(jì)算、中科通量、瀚博半導(dǎo)體、墨芯人工智能、摩爾線程、天數(shù)智芯、寒武紀(jì)、燧原科技等芯片公司推出了應(yīng)用于不同場(chǎng)景的AI推理和訓(xùn)練任務(wù)的芯片加速卡,涉及CPU、GPU、RISC-V等不同設(shè)計(jì)架構(gòu)。?
海光信息表示,海光DCU兼容CUDA生態(tài),對(duì)文心一言等大多數(shù)國內(nèi)外主流大模型適配良好。依托DCU可以實(shí)現(xiàn)LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型全面應(yīng)用。?
如何進(jìn)一步提升國產(chǎn)AI芯片競(jìng)爭(zhēng)力?中國工程院院士、清華大學(xué)教授鄭緯民認(rèn)為,要開發(fā)基于國產(chǎn)AI芯片的系統(tǒng),這一過程中最重要的是做好生態(tài)建設(shè)?!皣a(chǎn)AI芯片只要達(dá)到國外芯片60%的性能,如果生態(tài)做好了,客戶也會(huì)滿意?!编嵕暶穹Q。?
徐樊磊建議,做好自主創(chuàng)新要從人才、設(shè)施、科研和生態(tài)領(lǐng)域四方面突破,逐步提升智能算力設(shè)備軟硬件功能。在硬件方面,提高國產(chǎn)AI芯片的穩(wěn)定性和兼容性,特別是提升芯片之間、服務(wù)器集群之間的數(shù)據(jù)傳輸效果。在軟件生態(tài)方面,降低適配門檻,讓開發(fā)者逐漸使用國產(chǎn)芯片生態(tài)。
相關(guān)稿件