5月10日消息,近期中國移動研究院發(fā)布《我國人工智能大模型發(fā)展動態(tài)》報告,對國內(nèi)涉足人工智能大模型訓(xùn)練的多家企業(yè)及科研院所進行評估。中國移動研究院認為,從大模型業(yè)界評估看,國內(nèi)大模型與GPT-4有差距,但科技大廠具備追趕實力,百度、阿里巴巴、騰訊、華為等在大模型研發(fā)投入、技術(shù)能力和人才團隊等綜合實力較強;在商用推進方面,依托現(xiàn)有業(yè)務(wù)領(lǐng)域形成大模型應(yīng)用規(guī)模效應(yīng)。
報告指出,國內(nèi)大模型研發(fā)應(yīng)用領(lǐng)域熱潮持續(xù)高漲。據(jù)不完全統(tǒng)計,目前國內(nèi)至少有19家企業(yè)及科研院所涉足人工智能大模型訓(xùn)練,主要分為大型科技公司、科研院校和初創(chuàng)科技團隊三類。
從大模型的布局體系來看,百度、阿里、華為等大型科技公司從算力層、平臺層、模型層、應(yīng)用層進行了全面布局,科研院及初創(chuàng)科技公司主要以研發(fā)大模型算法及細分領(lǐng)域應(yīng)用為主。以百度為例,百度“昆侖芯+飛槳平臺+文心大模型+行業(yè)應(yīng)用”在芯片層、框架層、模型層和應(yīng)用層布局最完整。四層架構(gòu)之間能形成層到層的反饋、端到端的優(yōu)化,尤其是框架層的飛槳和模型層的文心大模型。最新數(shù)據(jù)顯示,飛槳與文心一言協(xié)同專項優(yōu)化在一個月內(nèi)迭代4次,推理性能提升10倍,其中分布式推理引擎推理性能提升了123%。阿里的“含光800芯片+M6-OFA底座+通義大模型+行業(yè)應(yīng)用”、華為的“昇騰芯片+MindSpore框架+盤古大模型+行業(yè)應(yīng)用”也是多層布局。
報告認為,從大模型參數(shù)量看,大型科技公司的參數(shù)量遠大于科研院所,但基本都處于千億及以上規(guī)模,而科研院校大模型的參數(shù)量在千億級及以下。公開資料顯示,2019年,百度發(fā)布文心大模型ERNIE,目前已迭代至千億級參數(shù)的ERNIE3.0Zeus。2023年3月起,百度相繼發(fā)布了知識增強大語言模型產(chǎn)品“文心一言”和一站式企業(yè)級大模型生產(chǎn)平臺“文心千帆大模型平臺”。
報告數(shù)據(jù)顯示,從綜合實力和商用推進方面,百度文心大模型和文心一言均領(lǐng)先,處于第一梯隊頭部。在商用推進方面,百度文心大模型拓展內(nèi)外部應(yīng)用,目前面向公眾和企業(yè)用戶同時進行開放測試。文心大模型在金融、能源、制造、城市、傳媒、互聯(lián)網(wǎng)等行業(yè)應(yīng)用案例落地廣泛。截至目前,已經(jīng)有15萬企業(yè)申請加入文心一言內(nèi)測,覆蓋政務(wù)、金融、媒體、電商零售等行業(yè)。
另據(jù),國際權(quán)威咨詢機構(gòu)IDC在今年2月發(fā)布的《2022中國大模型發(fā)展白皮書》中,提出了行業(yè)首個大模型評估框架,根據(jù)評估結(jié)果,百度文心大模型在市場格局中同樣處于第一梯隊領(lǐng)先位置,產(chǎn)品能力、生態(tài)能力、應(yīng)用能力均受到廣泛認可。
相關(guān)稿件