算力是數(shù)字經(jīng)濟(jì)的底座,一個(gè)國家適度超前布局算力基礎(chǔ)設(shè)施建設(shè),有重要意義。
第三方市場(chǎng)調(diào)研機(jī)構(gòu)IDC在《2021-2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》中分析了包括美國、中國等15個(gè)重點(diǎn)國家的算力指數(shù)(根據(jù)多項(xiàng)指標(biāo)測(cè)算的算力綜合指數(shù))得出的結(jié)論是:算力指數(shù)平均每提高1點(diǎn),國家的數(shù)字經(jīng)濟(jì)和GDP將分別增長3.5‰和1.8‰。
每一代網(wǎng)絡(luò)基礎(chǔ)設(shè)施都會(huì)催生新一代產(chǎn)業(yè)。不同算力基礎(chǔ)設(shè)施上,也會(huì)誕生不同的軟件。3G、4G網(wǎng)絡(luò)讓移動(dòng)互聯(lián)網(wǎng)誕生。在傳統(tǒng)的CPU算力上誕生了云。以GPU為代表的AI算力,則催生了ChatGPT和AI大模型。
2022年12月,微軟投資的AI創(chuàng)業(yè)公司OpenAI推出了聊天機(jī)器人ChatGPT。ChatGPT本質(zhì)是OpenAI自主研發(fā)的GPT-3.5語言大模型,該大模型包含近1800億個(gè)參數(shù)。2023年3月15日,OpenAI將該大模型迭代至GPT-4.0。GPT-3.5只是單模態(tài)大模型,只能回復(fù)文本。但GPT-4.0是多模態(tài)大模型,能同時(shí)實(shí)現(xiàn)圖像、文本輸入。GPT-4.0的回復(fù)準(zhǔn)確度、語義理解力大幅提升。
今年2月,阿里、百度等中國企業(yè)宣布將研發(fā)類ChatGPT產(chǎn)品,或?qū)⑼度肷墒紸I的研發(fā)。3月16日,百度發(fā)布了對(duì)標(biāo)ChatGPT的大語言模型“文心一言”。不過,目前中國企業(yè)對(duì)外發(fā)布的大模型普遍是單模態(tài)的,且普遍面臨GPU算力不足的挑戰(zhàn)。
《財(cái)經(jīng)》在3月初與三位技術(shù)背景出身的專家進(jìn)行了一場(chǎng)對(duì)話。他們經(jīng)歷了中國產(chǎn)業(yè)技術(shù)發(fā)展的不同階段,擁有不同領(lǐng)域的專業(yè)視角。這場(chǎng)對(duì)話的主題是,“中國離算力自由有多遠(yuǎn)”。我們?cè)谶@場(chǎng)對(duì)話中探討了三大問題:
智能算力是什么,為何興起?智能算力會(huì)帶來哪些產(chǎn)業(yè)變革?中國要如何科學(xué)規(guī)劃算力產(chǎn)業(yè)?
對(duì)話人簡(jiǎn)介:
新華三集團(tuán)副總裁、計(jì)算存儲(chǔ)產(chǎn)品線總裁 徐潤安(新華三是國內(nèi)重要的數(shù)字化解決方案提供商。新華三提供計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、5G、安全、終端等數(shù)字化基礎(chǔ)設(shè)施,客戶覆蓋百行百業(yè))
百度杰出系統(tǒng)架構(gòu)師 王雁鵬(百度智能云業(yè)務(wù)2022年?duì)I收177億元,正在成為集團(tuán)的第二增長曲線。3月16日,百度發(fā)布了對(duì)標(biāo)ChatGPT的大語言模型“文心一言”)
獨(dú)立分析師,數(shù)字化行業(yè)專家 寧宇
主持人:《財(cái)經(jīng)》雜志副主編 謝麗容
以下是對(duì)話實(shí)錄精華版:
智能算力是什么,為何興起?
《財(cái)經(jīng)》謝麗容:ChatGPT的風(fēng)靡讓大家關(guān)注智能算力,就像多年前谷歌的AlphaGo戰(zhàn)勝圍棋世界冠軍時(shí),讓普通人認(rèn)識(shí)了人工智能,算力是什么?尤其智能算力是什么?它是一種什么樣的資源?
寧宇:算力是通過對(duì)信息數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)目標(biāo)結(jié)果輸出的計(jì)算能力。算力會(huì)和算法、存儲(chǔ)一起構(gòu)成我們數(shù)字社會(huì)的基礎(chǔ)。
徐潤安:大眾意義上理解的通用算力是CPU(中央處理器)。無論個(gè)人使用的電腦、手機(jī),企業(yè)使用的服務(wù)器都最關(guān)心CPU主頻性能。這是衡量算力的一個(gè)重要指標(biāo)。但數(shù)字化正在讓算力需求發(fā)生變化。CPU作為通用算力,已經(jīng)無法完全滿足新需求。異構(gòu)算力,比如GPU(圖形處理器)、DPU(深度學(xué)習(xí)處理器)、NPU(神經(jīng)網(wǎng)絡(luò)處理器)通常被用來處理AI計(jì)算的需求。所以通常也被稱為智能算力。
王雁鵬:智能算力和通用算力采用了不同的計(jì)算方法。以CPU為代表的通用算力,善于執(zhí)行邏輯指令進(jìn)行高效率的計(jì)算。GPU為代表的智能算力,善于處理大量無邏輯關(guān)系數(shù)據(jù)的并行計(jì)算。
AI訓(xùn)練和推理通常不涉及復(fù)雜控制指令,卻又依賴大量數(shù)據(jù)的并行運(yùn)算。GPU/DPU/NPU這些專用處理器因此誕生。在過去的計(jì)算體系結(jié)構(gòu)中,CPU要處理所有工作。現(xiàn)在的計(jì)算體系結(jié)構(gòu)形成了不同的分工。GPU/DPU/NPU會(huì)針對(duì)不同的場(chǎng)景去做深度的優(yōu)化定制。
《財(cái)經(jīng)》謝麗容:ChatGPT這類AI應(yīng)用正在讓智能算力需求爆發(fā)。2022年中國服務(wù)器出貨量約380萬臺(tái),AI服務(wù)器出貨量超25萬臺(tái),在大盤中占比約6.5%。哪些行業(yè)、哪些領(lǐng)域?qū)χ悄芩懔τ袕?qiáng)需求?
徐潤安:典型的使用場(chǎng)景包括互聯(lián)網(wǎng)的搜索和推薦、零售電商業(yè)務(wù)數(shù)據(jù)分析;政府的智慧城市及治理,比如新華三已經(jīng)為杭州濱江、呼和浩特等60余個(gè)地市通過城市大腦進(jìn)行公共事務(wù)的輔助決策;自動(dòng)駕駛的仿真訓(xùn)練,需要大量真實(shí)道路數(shù)據(jù)進(jìn)行模擬學(xué)習(xí)。
王雁鵬:百度在AI領(lǐng)域投入很久,云業(yè)務(wù)標(biāo)簽是“智能云”。我們提出了一個(gè)理念,叫AINative(AI原生)。也就是說,千行百業(yè)都可以使用AI算力和模型訓(xùn)練。例如,金融機(jī)構(gòu)反欺詐、鋼鐵工廠AI質(zhì)檢、能源企業(yè)的線路檢修都采用了百度類似深度應(yīng)用。這個(gè)趨勢(shì)未來會(huì)給各行業(yè)帶來翻天覆地的變化。不過,這需要一段時(shí)間。
《財(cái)經(jīng)》謝麗容:這么多領(lǐng)域都要用到智能算力,那么資源相對(duì)充沛的通用算力是不能用,還是效率跟不上?從客戶需求來看,智能算力占比已經(jīng)超過甚至替代通用算力了?
徐潤安:這是計(jì)算效率的問題。最常見的CPU算力是x86服務(wù)器芯片。x86芯片單核性能強(qiáng)、通用性好,但是AI場(chǎng)景通常需要多核、高并發(fā)、高帶寬的芯片。綜合考慮成本、效率,GPU/DPU/NPU這些專用處理器通常會(huì)處理得更好。
現(xiàn)代計(jì)算機(jī)是遵循馮·諾依曼架構(gòu)設(shè)計(jì)的,這套架構(gòu)已經(jīng)延續(xù)70多年??梢源_定的是,CPU作為中央處理器的地位在短期內(nèi)不會(huì)改變。只是在數(shù)據(jù)挖掘等場(chǎng)景下,CPU的職能被其他專用芯片分擔(dān)了。CPU、GPU及其他AI芯片,這三種蛋糕的比例會(huì)有變化。不過未來會(huì)誕生新的計(jì)算機(jī)架構(gòu)。
現(xiàn)在有一種理念叫做“多元算力”。過去10年大家通常只談x86計(jì)算架構(gòu)。但計(jì)算芯片和計(jì)算進(jìn)程都在多元化,這是必然的趨勢(shì)。
王雁鵬:簡(jiǎn)單理解的話,CPU像是大腦,它需要完成復(fù)雜的邏輯。GPU/DPU/NPU這些專用芯片就像四肢。它們不需要腦子太發(fā)達(dá),只需要四肢足夠強(qiáng)壯,去解決需要解決的工作。
《財(cái)經(jīng)》謝麗容:把CPU/GPU/DPU/NPU這些算力資源組合在一起,什么樣的組合才是效率最高的?專用芯片是不是需要足夠大的規(guī)模,成本才會(huì)下降?
寧宇:通常情況下,特殊需求一定要足夠大的規(guī)模,才能支撐起專用芯片。專用芯片,需要規(guī)模化運(yùn)作,才能更經(jīng)濟(jì)。多元算力持續(xù)增長,專用需求規(guī)模化擴(kuò)張。這才會(huì)讓專用芯片的研發(fā)、生產(chǎn)、制造需求也不斷擴(kuò)大。另一種場(chǎng)景是,傳統(tǒng)芯片無法完成新的工作。因此,哪怕成本更高,也需要用專用芯片去解決,企業(yè)自然而然也會(huì)去使用專用芯片。
徐潤安:是否使用專用芯片其實(shí)是種商業(yè)考量。所有活動(dòng)都要考慮投入產(chǎn)出比,追根溯源還是效率問題。專門為一個(gè)算法或一個(gè)場(chǎng)景研發(fā)專用芯片,前提是可以產(chǎn)生足夠的效益,最終能覆蓋研發(fā)和制造成本。過去幾十年,x86架構(gòu)芯片的生產(chǎn)成本降到了很低,因此CPU無法被替代。但是大模型和其他業(yè)務(wù)場(chǎng)景的出現(xiàn),專用芯片的綜合計(jì)算效率更高,使得其他廠商有機(jī)會(huì)研發(fā)生產(chǎn)專用芯片。
《財(cái)經(jīng)》謝麗容:專用芯片需要面臨成本、效率這個(gè)矛盾。ChatGPT背后的AI大模型和生成式AI是不是也需要面臨類似的矛盾?如何解決這些問題?
王雁鵬:阻礙上一代AI技術(shù)大規(guī)模落地的瓶頸有三個(gè)。一是企業(yè)需要針對(duì)不同業(yè)務(wù)場(chǎng)景,定制不同的算法,研發(fā)成本很高。二是,AI的后面是人工,企業(yè)需要耗費(fèi)大量人工去標(biāo)注數(shù)據(jù),人力有限且成本高昂。三是,語音、圖像、自然語言分別有不同的研究框架,三者無法融合。
大模型代表了新一代AI技術(shù),帶來了里程碑式的變化,解決了三個(gè)核心問題。一是,一個(gè)通用的算法就可以應(yīng)對(duì)過去數(shù)十種場(chǎng)景,落地空間變得更大。二是,數(shù)據(jù)無需人工標(biāo)注,大量數(shù)據(jù)可以得到自動(dòng)訓(xùn)練,而且模型結(jié)構(gòu)是統(tǒng)一的。三是,語音、圖像、自然語言可以實(shí)現(xiàn)多模態(tài)融合,三者互相關(guān)聯(lián)。AI的思考方式會(huì)更符合人類認(rèn)知方式。上述三個(gè)變化,更通用的模型、大規(guī)模數(shù)據(jù)訓(xùn)練、多模態(tài)融合,會(huì)帶來AI技術(shù)的井噴和AI應(yīng)用的爆發(fā)。
寧宇:過去AI模型往往用于專業(yè)領(lǐng)域、專業(yè)場(chǎng)景。大模型讓AI能夠成為通用工具平臺(tái),應(yīng)對(duì)足夠多的場(chǎng)景。上層AI應(yīng)用使用規(guī)模變大,會(huì)激發(fā)AI算力的需求,進(jìn)而會(huì)使得下層硬件可以衍生出專用AI場(chǎng)景的芯片、服務(wù)器。這是一個(gè)從專業(yè)到通用再到專業(yè)的產(chǎn)業(yè)循環(huán)。
徐潤安:AI從水平場(chǎng)景影響到了應(yīng)用、硬件一個(gè)個(gè)不同的層次,這使得業(yè)務(wù)既解耦又打通。比如,底層的智能算力可以提供專用芯片,進(jìn)一步降低上層AI應(yīng)用的成本。
智能算力會(huì)帶來哪些產(chǎn)業(yè)變革?
《財(cái)經(jīng)》謝麗容:AI技術(shù)這輪演變和創(chuàng)新會(huì)帶來大量新的機(jī)會(huì),其中誰會(huì)受益?是不是會(huì)有一批優(yōu)秀的創(chuàng)業(yè)公司誕生?未來會(huì)形成怎樣的產(chǎn)業(yè)生態(tài)?
徐潤安:生成式AI爆發(fā)會(huì)帶來巨大的算力消耗,那么第一輪機(jī)會(huì)是ICT企業(yè)的。頭部企業(yè)投入大模型研發(fā),對(duì)新華三這種ICT企業(yè)來說就是機(jī)會(huì)。我們有更多機(jī)會(huì)服務(wù)好這些頭部客戶,為他們建設(shè)基礎(chǔ)設(shè)施。
第二輪機(jī)會(huì)是頭部大公司的。頭部廠商開發(fā)出大模型之后,可以利用平臺(tái)對(duì)外賦能。對(duì)外服務(wù)的過程,也是這些大公司受益的過程。
第三輪機(jī)會(huì)是各類創(chuàng)業(yè)公司的。大公司研發(fā)出大模型后,會(huì)形成平臺(tái)生態(tài)。大量公司在平臺(tái)上,針對(duì)千行百業(yè)研發(fā)上層AI應(yīng)用。黃教主(英偉達(dá)CEO黃仁勛)說,ChatGPT相當(dāng)于iPhone。iPhone帶來了移動(dòng)互聯(lián)網(wǎng)的爆發(fā),大模型也是類似的。這個(gè)過程中會(huì)有起有伏,有人成功有人失敗,但一定會(huì)有最終的受益者。
王雁鵬:在AI領(lǐng)域,百度有芯片、框架、大模型和應(yīng)用的全面積累。
我認(rèn)為未來可能會(huì)形成三層生態(tài)?;A(chǔ)層是提供基礎(chǔ)大模型服務(wù)的企業(yè),只有大公司才有能力。因?yàn)檫@需要長期投入,如資金、人力和技術(shù)積淀。第二層主要是各領(lǐng)域的公司。一些公司有較強(qiáng)的行業(yè)研究能力,可以基于大模型做各領(lǐng)域的專業(yè)應(yīng)用。第三層是開發(fā)者。他們只需要放開手腳,把應(yīng)用做好。開發(fā)者一定是更繁榮和開放的生態(tài)。
寧宇:大模型可能會(huì)讓AI產(chǎn)業(yè)出現(xiàn)類似移動(dòng)互聯(lián)網(wǎng)誕生前后的產(chǎn)業(yè)變革。早年通信設(shè)備商為電信運(yùn)營商提供硬件,中國移動(dòng)、中國聯(lián)通、中國電信鋪設(shè)3G、4G高速通信網(wǎng)絡(luò)?;A(chǔ)設(shè)施建設(shè)完成后,移動(dòng)互聯(lián)網(wǎng)群雄并起。微信、淘寶、支付寶這些APP都因此誕生。
AI產(chǎn)業(yè)在中國發(fā)展很快,現(xiàn)在新華三這類企業(yè)為大廠提供硬件,助力建設(shè)算力中心,大廠建成大模型,大模型上會(huì)雨后春筍般孵化出AI應(yīng)用。AI產(chǎn)業(yè)鏈會(huì)重構(gòu),大中小企業(yè)都可以找到自己的定位。所以,黃教主才會(huì)說,ChatGPT出現(xiàn)不亞于iPhone誕生給產(chǎn)業(yè)帶來的沖擊。
要如何科學(xué)規(guī)劃算力產(chǎn)業(yè)?
《財(cái)經(jīng)》謝麗容:ChatGPT出現(xiàn)后,國內(nèi)部分企業(yè)正在開始追趕。但也有人質(zhì)疑,我們的算力、算法、數(shù)據(jù)實(shí)力能不能支撐中國做好類似的應(yīng)用?
王雁鵬:在AI領(lǐng)域,中國和美國是絕對(duì)領(lǐng)先的。當(dāng)前中國算力的確受到了一定制約。但從長線來看,一定可以突破,我對(duì)此有信心。接下來的挑戰(zhàn)是,數(shù)據(jù)是不是夠多??陀^現(xiàn)狀是,中文數(shù)據(jù)豐富度小于英文,但模型的邏輯推理能力可以彌補(bǔ)這個(gè)短板。
寧宇:算力、算法、數(shù)據(jù),這些要素其實(shí)中國都有。我們未來的問題是監(jiān)管這類非技術(shù)因素。訓(xùn)練內(nèi)容如何監(jiān)管、應(yīng)用場(chǎng)景如何適配、社會(huì)如何跟進(jìn)技術(shù)發(fā)展,這都是挑戰(zhàn)。
《財(cái)經(jīng)》謝麗容:ChatGPT這類生成式AI應(yīng)用和大模型正在涌現(xiàn)。面向未來,中國應(yīng)該如何科學(xué)地規(guī)劃自己的算力產(chǎn)業(yè)?
王雁鵬:我們希望,算力的供給能像水電一樣簡(jiǎn)單。以CPU為代表的通用算力有標(biāo)準(zhǔn)的軟件、接口,在云上已接近水電。但是GPU/DPU/NPU這些異構(gòu)算力,軟件復(fù)雜度越來越高。它的使用并不像CPU那樣簡(jiǎn)單。這意味著我們需要芯片、框架、模型、應(yīng)用都一體化整合發(fā)展。這樣才能把智能算力也變成CPU算力一樣標(biāo)準(zhǔn)化的水電資源。
徐潤安:我們需要摒棄過去幾十年看待算力的視角。過去是攤大餅似的買設(shè)備,堆砌算力,這種發(fā)展模式太粗放了。一方面我們需要應(yīng)對(duì)多元算力的發(fā)展趨勢(shì),讓算力得到更高效使用。另一方面,算力對(duì)電力消耗很大,所以這也催生了東數(shù)西算這樣的政策規(guī)劃。
此外,中國一直在提“算力網(wǎng)絡(luò)”概念,思考如何把國內(nèi)的數(shù)據(jù)中心跨區(qū)域連接在一起。這是個(gè)系統(tǒng)工程。如果算力網(wǎng)絡(luò)建成,算力、存儲(chǔ)、網(wǎng)絡(luò)都可以統(tǒng)一調(diào)度,那么它會(huì)成為數(shù)字化變革的核心。新華三在去年推出了H3CUniServerG6新一代AI服務(wù)器,為此還搭配了智能管理中樞,這就像是算力操作系統(tǒng)?,F(xiàn)在的異構(gòu)算力太多了,我們希望彌補(bǔ)這些鴻溝,讓企業(yè)能更簡(jiǎn)單、高效地使用AI算力。
寧宇:算力作為資源需要整體分配。對(duì)企業(yè)來說,需要不斷降低算力成本。對(duì)國家來說,需要對(duì)產(chǎn)業(yè)鏈的不同角色進(jìn)行重新定位。東數(shù)西算與碳中和等其他國家戰(zhàn)略是相互匹配的。就像中國建設(shè)高鐵、4G/5G網(wǎng)絡(luò)一樣,算力基礎(chǔ)設(shè)施建設(shè)也要有規(guī)劃。既要讓成本足夠經(jīng)濟(jì),又要讓地區(qū)平衡發(fā)展,還要協(xié)調(diào)算力基建、AI應(yīng)用的供需節(jié)奏。
把分散的服務(wù)器、數(shù)據(jù)中心簡(jiǎn)單匯總計(jì)算出中國總體算力,這種統(tǒng)計(jì)方式便于操作。但我個(gè)人并不完全贊同拿浮點(diǎn)運(yùn)算總數(shù)去衡量一個(gè)國家的算力能力。政策方提“算力網(wǎng)絡(luò)”、“云網(wǎng)融合”概念,是因?yàn)樗懔ο噙B成網(wǎng)絡(luò)之后才有意義。這就像局域網(wǎng)不成體系,互聯(lián)網(wǎng)才能創(chuàng)造產(chǎn)業(yè)價(jià)值。
《財(cái)經(jīng)》謝麗容:以電信行業(yè)為例,中國普通人的的通信自由,不為流量資費(fèi)發(fā)愁的日子似乎是從4G開始的。對(duì)中國來說,什么是算力自由?算力自由是什么狀態(tài)?
王雁鵬:我理解的算力自由是,算力要支撐算法的發(fā)展,不要限制人類的想象力。從歷史發(fā)展來看,大型機(jī)/小型機(jī)被x86架構(gòu)芯片取代,原因是大型機(jī)/小型機(jī)太昂貴,無法建成互聯(lián)網(wǎng)和云計(jì)算。互聯(lián)網(wǎng)讓廉價(jià)的x86架構(gòu)芯片最終一統(tǒng)天下。Google在2003年-2006年發(fā)表的三篇論文又為云計(jì)算奠定理論基礎(chǔ)——用廉價(jià)的通用計(jì)算設(shè)備(x86架構(gòu),Linux系統(tǒng))搭建低成本的計(jì)算集群。每個(gè)時(shí)代都可以重構(gòu)不同的計(jì)算模式。這需要百度、新華三等企業(yè)在不同領(lǐng)域跨產(chǎn)業(yè)層的努力。
寧宇:第一是便宜,第二是易用。每一代通信技術(shù)迭代的周期是10年左右。電信運(yùn)營商在這個(gè)周期內(nèi),一方面要保證經(jīng)營能夠覆蓋基站的建設(shè)、維護(hù)成本,另一方面要讓用戶增長和網(wǎng)絡(luò)規(guī)模同步發(fā)展。在這兩個(gè)平衡的前提下提速降費(fèi),實(shí)現(xiàn)通信自由。未來如果有算力運(yùn)營商,或者說是今天的云計(jì)算廠商,國家需要有宏觀政策指導(dǎo)產(chǎn)業(yè)演進(jìn)。讓資源供給、市場(chǎng)需求以及運(yùn)營商的收入能夠?qū)崿F(xiàn)良好的匹配。
徐潤安:算力自由不是簡(jiǎn)單的攤大餅,核心是供需平衡。和通信產(chǎn)業(yè)不同的是,通信技術(shù)10年一次迭代,但算力是3年-5年一次,因?yàn)榉?wù)器的平均使用周期大約是4年。這會(huì)導(dǎo)致算力運(yùn)營商的成本是偏高的。算力設(shè)備采購后,3年內(nèi)必須充分發(fā)揮作用。如果算經(jīng)濟(jì)賬,這會(huì)帶來很大的挑戰(zhàn)。
關(guān)于算力的技術(shù)演進(jìn),這需要端到端的優(yōu)化,產(chǎn)業(yè)鏈從上到下打破這壁壘。新華三和這類云計(jì)算廠商、三大電信運(yùn)營商都需要探討這些需求。我們不能只生產(chǎn)、提供設(shè)備,我們需要對(duì)未來做出預(yù)測(cè),進(jìn)行適當(dāng)?shù)耐度?#xff0c;提前做技術(shù)布局。
相關(guān)稿件