學(xué)習(xí)或挑戰(zhàn)ChatGPT的“正確姿勢(shì)”,或許還是在更基礎(chǔ)、更底層的原始創(chuàng)新中尋找力量。一些中國(guó)企業(yè)在芯片、操作系統(tǒng)、AI大模型等方面持續(xù)投入,并且有所產(chǎn)出,ChatGPT的出現(xiàn),也是中國(guó)AI企業(yè)加速奔跑,迎來(lái)新一輪發(fā)展的契機(jī)。
最近,AI(人工智能)圈一股以“ChatGPT”為核心的熱潮從美國(guó)“硅谷”涌入中國(guó)。
2022年11月底,初創(chuàng)公司OpenAI發(fā)布了名為ChatGPT的對(duì)話式聊天機(jī)器人模型,一經(jīng)推出,便在網(wǎng)絡(luò)上迅速走紅。美國(guó)科技公司微軟的聯(lián)合創(chuàng)始人比爾·蓋茨高度評(píng)價(jià)這項(xiàng)技術(shù),認(rèn)為它的出現(xiàn)不亞于互聯(lián)網(wǎng)和個(gè)人電腦(PC)的誕生。
進(jìn)入2023年,微軟推新,谷歌入局,“ChatGPT”熱潮迅速升溫,國(guó)內(nèi)的科技巨頭也陸續(xù)涌入潮中。ChatGPT發(fā)布后,包括百度、科大訊飛、京東等在內(nèi)的多家企業(yè)紛紛公布自己在AI領(lǐng)域的布局。
近日,360創(chuàng)始人周鴻祎在一場(chǎng)直播中表示,如果企業(yè)搭不上ChatGPT這班車,很可能會(huì)被淘汰。確實(shí),作為一個(gè)現(xiàn)象級(jí)的應(yīng)用(模型),ChatGPT的出現(xiàn)為AI領(lǐng)域的技術(shù)發(fā)展和產(chǎn)業(yè)布局帶來(lái)新的變化。
回溯ChatGPT的誕生過(guò)程,可以發(fā)現(xiàn)這是一個(gè)創(chuàng)業(yè)團(tuán)隊(duì)先“活下來(lái)”,再實(shí)現(xiàn)“服務(wù)所有人”目標(biāo)的故事,這也是一個(gè)從某個(gè)企業(yè)閉環(huán)研發(fā)到整個(gè)行業(yè)開(kāi)源共創(chuàng)的AI大模型,更是一個(gè)利用超大數(shù)據(jù)、超強(qiáng)算力、超強(qiáng)算法“喂養(yǎng)”出來(lái)的跨越式AI產(chǎn)品,是量變引起質(zhì)變的產(chǎn)物。
梳理人工智能產(chǎn)業(yè)的歷史和現(xiàn)實(shí),可以看到數(shù)據(jù)背后是廣泛的應(yīng)用場(chǎng)景,算力背后靠的是完善的信息基礎(chǔ)設(shè)施,算法背后需要深厚的人才儲(chǔ)備。這些方面中國(guó)已經(jīng)有所準(zhǔn)備,甚至可以說(shuō)已經(jīng)積累了龐大的數(shù)據(jù)、算力和人才優(yōu)勢(shì)。而在ChatGPT浪潮洶涌而至?xí)r,盲目跟風(fēng)、“Copy To China”早已落伍,甚至只是在應(yīng)用層面“搭車”也顯得不合時(shí)宜。
學(xué)習(xí)或挑戰(zhàn)ChatGPT的“正確姿勢(shì)”,或許還是在更基礎(chǔ)、更底層的原始創(chuàng)新中尋找力量。一些中國(guó)企業(yè)在芯片、操作系統(tǒng)、AI大模型等方面持續(xù)投入,并且有所產(chǎn)出,ChatGPT的出現(xiàn),也是中國(guó)AI企業(yè)加速奔跑,迎來(lái)新一輪發(fā)展的契機(jī)。
ChatGPT潮涌
“今天我們推出了ChatGPT,嘗試在這里與它交談”。
2022年11月30日,熱潮來(lái)襲。OpenAI首席執(zhí)行官山姆·阿爾特曼當(dāng)天發(fā)布了一則推特,推特中除了上述文字,還包括一個(gè)鏈接,任何人都可以點(diǎn)擊鏈接、注冊(cè)賬戶,免費(fèi)與ChatGPT交談。
與Siri、小愛(ài)同學(xué)等語(yǔ)音助手類似,ChatGPT也是人機(jī)交互應(yīng)用的一種。但在與ChatGPT“對(duì)話”的過(guò)程中,人們發(fā)現(xiàn)它的“智慧程度”遠(yuǎn)超其他的人工智能機(jī)器人。除了聊天,ChatGPT被網(wǎng)友們用來(lái)寫(xiě)文案、翻譯文本、為代碼糾錯(cuò),甚至用來(lái)編寫(xiě)代碼。
據(jù)OpenAI官網(wǎng)介紹,ChatGPT能夠連續(xù)回答問(wèn)題、承認(rèn)錯(cuò)誤、質(zhì)疑不正確的前提和拒絕不適當(dāng)?shù)恼?qǐng)求。“第一次,它(指ChatGPT)答錯(cuò)了,我告訴它正確信息后,再問(wèn)同樣的問(wèn)題,它的答案就被改正了過(guò)來(lái)了。”一位曾嘗試與ChatGPT對(duì)話的程序員對(duì)記者說(shuō),“它甚至為此對(duì)我說(shuō)‘抱歉’”。
憑借出色的表現(xiàn),ChatGPT僅用兩個(gè)月便吸引了超過(guò)1億用戶的關(guān)注,一躍成為20年來(lái)互聯(lián)網(wǎng)領(lǐng)域增長(zhǎng)最快的消費(fèi)類應(yīng)用。
北京時(shí)間2月7日凌晨,美國(guó)科技巨頭谷歌緊急入局,宣布基于LaMDA大模型的人工智能對(duì)話式機(jī)器人“Bard”正在進(jìn)行內(nèi)測(cè)。次日,微軟宣布推出由ChatGPT支持的最新版本Bing搜索引擎和Edge瀏覽器,熱潮升溫并迅速觸及中國(guó)。
就在谷歌官宣Bard內(nèi)測(cè)的當(dāng)天下午,百度官宣了大模型新項(xiàng)目“文心一言”(ERNIE Bot),并表示預(yù)計(jì)在3月完成內(nèi)測(cè)。隨后一段時(shí)間,阿里巴巴、360、科大訊飛、騰訊等多家國(guó)內(nèi)企業(yè)紛紛表示對(duì)AI技術(shù)發(fā)展的關(guān)注。2月10日,京東云宣布旗下言犀人工智能應(yīng)用平臺(tái)將推出產(chǎn)業(yè)版ChatGPT--ChatJD。
從科技巨頭,到行業(yè)龍頭,中國(guó)企業(yè)競(jìng)逐AI賽道,AIGC(利用人工智能技術(shù)來(lái)生成內(nèi)容)等人工智能概念在股市一路狂飆,雖然在監(jiān)管出手后很快平息躁動(dòng),但漲勢(shì)依然存在。中信證券研究報(bào)告認(rèn)為,ChatGPT在全球的流行正在推動(dòng)AIGC產(chǎn)業(yè)化全面提速,將引領(lǐng)創(chuàng)成式AI新變革。
“ChatGPT”熱潮涌動(dòng),正處于冷靜期的人工智能投資和產(chǎn)業(yè)布局迎來(lái)小陽(yáng)春。
用大數(shù)據(jù)、大算力、強(qiáng)算法“喂養(yǎng)”
商企入局,資本關(guān)注。“ChatGPT”熱潮涌動(dòng)的背后,是AI大模型的一次場(chǎng)景化落地?!癈hatGPT的成功,意味著AI大模型之路的發(fā)展成熟?!敝袊?guó)信通院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏日前在一篇評(píng)論文章中寫(xiě)道。
AI大模型是人工智能邁向通用智能的里程碑技術(shù),模型可以自動(dòng)從數(shù)據(jù)中學(xué)習(xí)知識(shí),提升性能。GPT是OpenAI推出的AI大模型系列。從2018年到2022年,OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3和InstructGPT,此次發(fā)布的ChatGPT就是在GPT-3的基礎(chǔ)上通過(guò)指令微調(diào)后得到的。
2022年初,OpenAI團(tuán)隊(duì)開(kāi)始用GPT-3構(gòu)建ChatGPT。據(jù)《財(cái)富》雜志報(bào)道,通過(guò)GPT-3訓(xùn)練ChatGPT的過(guò)程并不順利,對(duì)話的效果并不理想,因此OpenAI決定將ChatGPT放到“野外”供大眾使用。
結(jié)果,2022年年底ChatGPT實(shí)現(xiàn)了現(xiàn)象級(jí)的傳播,這出乎制作團(tuán)隊(duì)所料?!斑@絕對(duì)令人驚訝?!監(jiān)penAI首席技術(shù)官米拉·穆拉蒂在接受媒體采訪時(shí)說(shuō)。OpenAI用了5年時(shí)間在GPT大模型迭代上完成了一場(chǎng)自我革命,在對(duì)話的場(chǎng)景中實(shí)現(xiàn)爆發(fā)。
“ChatGPT通過(guò)一種非常簡(jiǎn)單的對(duì)話方式,構(gòu)造了非常好的應(yīng)用場(chǎng)景。”360創(chuàng)始人周鴻祎認(rèn)為,ChatGPT提供的這些應(yīng)用場(chǎng)景非常貼近大多數(shù)人日常的剛需和痛點(diǎn),所以它才會(huì)火起來(lái),能出圈。
出圈是偶然的,但ChatGPT的成功卻并非偶然,“OpenAI在GPT系列模型的基礎(chǔ)上,對(duì)算法、算力、數(shù)據(jù)等人工智能關(guān)鍵要素都進(jìn)行了一定的升級(jí)和優(yōu)化?!敝袊?guó)信通院云計(jì)算與大數(shù)據(jù)研究所人工智能部副主任董曉飛說(shuō)。
在算法層面,ChatGPT的基礎(chǔ)是世界上最強(qiáng)大的LLM(大語(yǔ)言模型)之一——GPT-3,同時(shí)引入了基于人類反饋的強(qiáng)化學(xué)習(xí)方法,提高了對(duì)話的質(zhì)量。“從GhatGPT的表現(xiàn)上來(lái)看,它的精確性和整個(gè)性能效果確實(shí)提高了?!倍瓡燥w說(shuō)。
同時(shí),AI的訓(xùn)練和使用也需要強(qiáng)大的算力支持。ChatGPT的訓(xùn)練是在微軟云上進(jìn)行的,在全球云計(jì)算市場(chǎng),微軟云的市場(chǎng)份額排名第二。高水平、高市場(chǎng)份額,再加上芯片技術(shù)的高速發(fā)展,這都為ChatGPT的橫空出世奠定了堅(jiān)實(shí)的算力基礎(chǔ)。
除了算法和算力,AI大模型的進(jìn)步迭代,需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練。2020年發(fā)布的GPT-3,其訓(xùn)練參數(shù)量已經(jīng)達(dá)到了驚人的1750億個(gè),“大量的數(shù)據(jù)被反復(fù)‘喂’給ChatGPT。”一位目前在北京大學(xué)從事人工智能研究的博士生對(duì)記者說(shuō)。
而且,ChatGPT的訓(xùn)練成本支出巨大。據(jù)Lambda Labs首席科學(xué)官Chuan li介紹,擁有1750億個(gè)參數(shù)的GPT-3單次訓(xùn)練成本達(dá)到460萬(wàn)美元。在知乎上,網(wǎng)友在討論ChatGPT時(shí),也都認(rèn)為它很“燒錢”。因此,可以說(shuō)ChatGPT是一個(gè)靠大算力、高成本,用大規(guī)模的數(shù)據(jù)“喂”出來(lái)的AI模型。
董曉飛指出,雖然國(guó)內(nèi)外企業(yè)在算法研發(fā)上基本保持同等水平,但國(guó)內(nèi)更注重大模型技術(shù)與行業(yè)場(chǎng)景的融合,對(duì)于數(shù)據(jù)標(biāo)注和模型訓(xùn)練等高成本的人力投入更為謹(jǐn)慎。
“我們真正缺乏的是技術(shù)積累,包括數(shù)據(jù)怎么清洗、標(biāo)注以及模型的結(jié)構(gòu)設(shè)計(jì),怎么訓(xùn)練、推理,這個(gè)地方很多都需要經(jīng)驗(yàn)和積累?!本W(wǎng)上一篇爆火的《ChatGPT專家深度解讀》這樣解釋。
搜狐創(chuàng)始人張朝陽(yáng)在一場(chǎng)直播中說(shuō):“ChatGPT的產(chǎn)生是量變到質(zhì)變的過(guò)程,積累了很多年,涉及到算力要有多少服務(wù)器,知識(shí)庫(kù)、標(biāo)注等很多問(wèn)題,若沒(méi)有這些能力的公司跟風(fēng)入局,會(huì)消耗掉許多資源?!?/p>
把握優(yōu)勢(shì),競(jìng)逐“生成式AI”浪潮
熱潮已經(jīng)襲來(lái),有技術(shù)基礎(chǔ)的企業(yè)在強(qiáng)勢(shì)突圍,沒(méi)有技術(shù)基礎(chǔ)的企業(yè)準(zhǔn)備發(fā)力,尚待進(jìn)場(chǎng)。而等熱潮退去,能否留在場(chǎng)上,還需看清自己的優(yōu)勢(shì)和短板。
ChatGPT是AIGC的一種實(shí)現(xiàn)。董曉飛認(rèn)為,在AIGC的大模型建設(shè)和應(yīng)用層面,國(guó)內(nèi)企業(yè)在技術(shù)基礎(chǔ)和創(chuàng)新環(huán)境上都存在著相對(duì)優(yōu)勢(shì)。
首先,國(guó)內(nèi)持續(xù)投入大模型研發(fā)、技術(shù)基礎(chǔ)扎實(shí)。目前,阿里達(dá)摩院的多模態(tài)大模型M6參數(shù)量已達(dá)10萬(wàn)億,是全球最大的AI預(yù)訓(xùn)練模型;華為盤古、百度文心等大模型的參數(shù)量都超過(guò)了千億,其中百度文心模型參數(shù)量已經(jīng)達(dá)到2600億,不遜于GPT-3?!皣?guó)內(nèi)有關(guān)企業(yè)、研究機(jī)構(gòu)近幾年在大模型方面已經(jīng)有了技術(shù)積淀?!倍瓡燥w說(shuō)。
其次,國(guó)內(nèi)加快“產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型”、實(shí)現(xiàn)人工智能與實(shí)體經(jīng)濟(jì)融合等政策為人工智能提供了創(chuàng)新發(fā)展環(huán)境。近日,國(guó)務(wù)院國(guó)資委印發(fā)《關(guān)于做好2023年中央企業(yè)投資管理進(jìn)一步擴(kuò)大有效投資有關(guān)事項(xiàng)的通知》,指出要加大對(duì)5G、人工智能、數(shù)據(jù)中心等新基建投入。近年來(lái),我國(guó)發(fā)布了一系列政策文件,為人工智能核心技術(shù)攻關(guān)、產(chǎn)品落地應(yīng)用以及探索發(fā)展新模式新路徑提供支持。
把握優(yōu)勢(shì)的同時(shí),也要看到目前面臨的一些挑戰(zhàn)。如AI領(lǐng)軍人才相對(duì)短缺,AI與實(shí)體經(jīng)濟(jì)的融合程度仍需進(jìn)一步加深等等。對(duì)此,董曉飛建議,要特別關(guān)注一些底層技術(shù)的發(fā)展,如大模型框架、算法等,還要進(jìn)一步拓展AI的應(yīng)用場(chǎng)景。同時(shí)他也表示,要進(jìn)一步提升大眾對(duì)AI的認(rèn)知,“這對(duì)于AI的發(fā)展是有好處的?!?/p>
但董曉飛也指出,基于大模型的聊天機(jī)器人成本投入巨大,“企業(yè)前期投入需保持一定的謹(jǐn)慎,且需要看清方向。”
中國(guó)新一代人工智能發(fā)展戰(zhàn)略研究院發(fā)布的《中國(guó)新一代人工智能科技產(chǎn)業(yè)發(fā)展報(bào)告(2022)》數(shù)據(jù)顯示,中國(guó)人工智能企業(yè)布局側(cè)重在應(yīng)用層和技術(shù)層。其中,應(yīng)用層人工智能企業(yè)數(shù)占比最高,達(dá)85.18%;技術(shù)層和基礎(chǔ)層企業(yè)數(shù)分別占比12.41%和2.41%。由此可以看出,我國(guó)人工智能發(fā)展在應(yīng)用層面有較大優(yōu)勢(shì)。
在董曉飛看來(lái),ChatGPT的成功出圈模式為企業(yè)提供了大模型、生成式AI、智能對(duì)話等技術(shù)的商業(yè)化應(yīng)用路徑,尤其將助力“生成式AI”通過(guò)更多形式實(shí)現(xiàn)在更多行業(yè)的探索和應(yīng)用。
“目前來(lái)看,國(guó)內(nèi)大模型開(kāi)發(fā)廠商一是布局以大模型為基礎(chǔ)的通用對(duì)話、生成等能力;二是將其能力整合到搜索引擎、智能客服、智能音箱等產(chǎn)品線中;三是通過(guò)能力調(diào)用為中小企業(yè)滿足具體場(chǎng)景落地需求?!倍瓡燥w說(shuō)。
隨著ChatGPT的爆火,隨之而來(lái)的安全、隱私保護(hù)、知識(shí)產(chǎn)權(quán)等問(wèn)題也值得關(guān)注。“目前國(guó)外出現(xiàn)有學(xué)生使用ChatGPT寫(xiě)論文作弊的情況。模型使用大量的數(shù)據(jù)進(jìn)行訓(xùn)練,也存在使用過(guò)程中可能提供他人創(chuàng)作的侵權(quán)行為風(fēng)險(xiǎn)?!倍瓡燥w認(rèn)為,如何防止ChatGPT類產(chǎn)品的濫用對(duì)社會(huì)產(chǎn)生潛在負(fù)面影響亟須得到重視,“更希望我們目前的一些主流企業(yè)、科研機(jī)構(gòu),在生成式AI上發(fā)力,能引領(lǐng)新時(shí)代的AI發(fā)展?!?#xff08;中青報(bào)·中青網(wǎng)見(jiàn)習(xí)記者 賈驥業(yè) 記者 王林)
相關(guān)稿件