7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議在上海開幕,深圳計算科學(xué)研究院首席科學(xué)家樊文飛院士應(yīng)邀出席,在中信集團(tuán)承辦的投融資主題論壇發(fā)表了“AI=機器學(xué)習(xí)+邏輯推理”的主旨演講,和與會嘉賓分享了AI領(lǐng)域前沿趨勢和在垂直領(lǐng)域應(yīng)用的重大機遇。
大模型——挑戰(zhàn)與機遇并存
樊文飛院士指出,通用大模型推動了行業(yè)的變革,引起社會的廣泛關(guān)注,但也存在局限性。做為輔助工具,大模型表現(xiàn)優(yōu)異;但在智能制造的應(yīng)用前景還有待觀察。當(dāng)下的大語言模型是基于統(tǒng)計類的機器學(xué)習(xí)模型,無法滿足結(jié)果的可解釋,且無法同時滿足模型的“準(zhǔn)確性”“公平性”和“魯棒性”要求,邏輯推理能力不強,訓(xùn)練成本高(算力、數(shù)據(jù)、能耗),而且經(jīng)常產(chǎn)生“幻覺” (hallucination)。可否應(yīng)用大模型在生產(chǎn)關(guān)鍵環(huán)節(jié)做出實時“決策”,解決行業(yè)痛點,提高生產(chǎn)效率?如何確保大模型在智能制造決策中的準(zhǔn)確性和可靠性?如何減少它們所產(chǎn)生的幻覺?能否增強機器學(xué)習(xí)的邏輯推理能力?所以要討論大模型的遠(yuǎn)景,首先要確定大模型的定位,不能企望大模型做到其所不能。
如何在工業(yè)界發(fā)揮人工智能的效能,解決行業(yè)痛點,是業(yè)界需要關(guān)注和解決的一項重大機遇和挑戰(zhàn)。在解決行業(yè)痛點問題時,大模型是否最優(yōu)解?能否找到成本低、高精度、易解釋的方法,為行業(yè)痛點提供實時解決方案?
以“AI+”的自動化、高精度、可解釋、低成本賦能工業(yè)界
在人工智能技術(shù)的發(fā)展大潮中,中國應(yīng)發(fā)揮在制造業(yè)規(guī)模大、垂直領(lǐng)域數(shù)據(jù)積累多等優(yōu)勢。樊文飛院士提出:以“機器學(xué)習(xí)+邏輯推理”的“AI+”發(fā)展思路,在提高模型結(jié)果準(zhǔn)確度的同時賦予結(jié)果可解釋性;與此同時,通過邏輯規(guī)則融入行業(yè)(小)模型預(yù)測,大幅降低模型的落地成本。深算院通過獨創(chuàng)的機器學(xué)習(xí)模型與業(yè)務(wù)邏輯規(guī)則的高效結(jié)合,研發(fā)填補國際空白的釣魚城數(shù)據(jù)分析系統(tǒng),并衍生出生產(chǎn)工藝、配方優(yōu)化、網(wǎng)絡(luò)安全、新藥研發(fā)、金融風(fēng)控、精準(zhǔn)推薦等行業(yè)的AI應(yīng)用創(chuàng)新,均已上線應(yīng)用。如在動力電池制造行業(yè),助力頭部企業(yè)在保證誤差率0.06%-0.01%的同時,縮短80%化成分容生產(chǎn)周期,降低50%能耗,單條產(chǎn)線節(jié)省上千萬設(shè)備成本,每GWh產(chǎn)能年節(jié)省上百萬元電費,并可擴展優(yōu)化更多工藝環(huán)節(jié)。釣魚城系統(tǒng)已證明可以實現(xiàn)實時決策、精準(zhǔn)解釋、自動適配,并在算力不足、訓(xùn)練樣本較少的情況下,得到遠(yuǎn)超大模型的精度,解決許多行業(yè)痛點。
語料準(zhǔn)備與算力同等重要
樊文飛院士表示,目前社會廣泛聚焦的是大模型以及與其相關(guān)的算力,忽視了大模型訓(xùn)練必需的語料準(zhǔn)備這一關(guān)鍵環(huán)節(jié)。大模型的精度和可用性取決于所訓(xùn)練的語料數(shù)據(jù),如果致力于打造一個具備產(chǎn)線實時應(yīng)用的大模型決策系統(tǒng),那么語料清洗的重要性和算力同等重要。基于“大數(shù)據(jù)質(zhì)量保證模型與方法”原創(chuàng)理論,深算院研發(fā)的采石磯數(shù)據(jù)質(zhì)量系統(tǒng),為上海數(shù)據(jù)交易所的數(shù)據(jù)評估和數(shù)據(jù)交易流程提供底層能力支撐,落地國內(nèi)首創(chuàng)的大數(shù)據(jù)精準(zhǔn)量化質(zhì)量評估,實現(xiàn)了自動化的數(shù)據(jù)質(zhì)量評估和數(shù)據(jù)質(zhì)量增強,真正打通數(shù)據(jù)要素進(jìn)入流通的關(guān)鍵節(jié)點。下一步將繼續(xù)為大模型的訓(xùn)練提供優(yōu)質(zhì)的語料數(shù)據(jù)和行業(yè)調(diào)優(yōu)數(shù)據(jù),以提升行業(yè)大模型的準(zhǔn)確性。
走出國產(chǎn)基礎(chǔ)軟件的“寒冬”
重要性不亞于大模型的是標(biāo)準(zhǔn)化基礎(chǔ)軟件的研發(fā)。目前芯片受制于人。如果開源軟件被禁用,中國的大模型發(fā)展將何去何從?所以堅持自主源頭創(chuàng)新和自研根技術(shù),才能推動中國軟件行業(yè)真正走出受制于人的困境。例如,深算院以有界計算、跨模計算等創(chuàng)新理論,研發(fā)出全自研滿足AI場景需求的崖山數(shù)據(jù)庫系統(tǒng),實現(xiàn)與國際主流數(shù)據(jù)庫在高端場景提供1:1的平替能力,在中國人民銀行數(shù)字貨幣場景,通過反復(fù)數(shù)十萬次的故障和高可用測試,故障恢復(fù)和數(shù)據(jù)一致性得到強保證,在兼容、功能、故障、運維、備份、安全、性能等維度,滿足數(shù)字貨幣場景對數(shù)據(jù)庫的業(yè)務(wù)訴求。
相關(guān)稿件