◎作者|李心瑩
◎來源|已獲授權(quán)
在大模型掀起國內(nèi)科技熱潮后,所有人都想知道產(chǎn)業(yè)的下一步將如何發(fā)展。對(duì)此,恐怕沒人比百度李彥宏更有資格做出判斷。
百度是在3月發(fā)布的文心一言,成為全球科技大廠中第一個(gè)大模型牌桌的玩家。更重要的是,百度也是國內(nèi)科技大廠中第一個(gè)投入、以及堅(jiān)持最久的AI玩家。
從李彥宏2013年宣布成立深度學(xué)習(xí)實(shí)驗(yàn)室至今,百度投入AI的時(shí)間已經(jīng)超過10年,既見證了AI技術(shù)的發(fā)展迭代,也見證了這項(xiàng)技術(shù)從實(shí)驗(yàn)室一步步走向現(xiàn)實(shí)生活的過程。
如今,大模型時(shí)代已來,未來最大的產(chǎn)業(yè)機(jī)會(huì)在哪?AI原生應(yīng)用究竟長什么樣?基礎(chǔ)模型與Killer Apps如何共融共生?垂類模型與基礎(chǔ)模型是互為競(jìng)爭(zhēng)關(guān)系嗎?
當(dāng)然,這些問題都能在文心一言上找到答案。但我更想知道李彥宏怎么看——作為一位堅(jiān)信AI的技術(shù)人、一位帶領(lǐng)公司All in AI的企業(yè)家、一位用幾十萬字宣揚(yáng)AI的布道師。
百度官方消息稱,李彥宏將會(huì)在10月17日的百度世界大會(huì)上帶來長達(dá)一小時(shí)的主題演講,“手把手教你做AI原生應(yīng)用”。
現(xiàn)在,距離這次演講還有兩周時(shí)間,我梳理了李彥宏今年以來關(guān)于大模型和生成式AI的全部講話內(nèi)容,從上萬字的演講實(shí)錄中選摘出33條干貨,算是先做做功課。通過他的思考,我希望能進(jìn)一步揭示AI原生應(yīng)用的本質(zhì),為正在大模型創(chuàng)業(yè)、創(chuàng)新路上的同行人提供一份啟示。
以下為實(shí)錄摘編,enjoy:
大模型如何重新定義人工智能
1、人工智能的發(fā)展正在從辨別式走向生成式。什么叫辨別式?搜索引擎就是典型的辨別式。什么叫生成式?用AI進(jìn)行文學(xué)創(chuàng)作,寫報(bào)告、繪制海報(bào)等等,這些都是生成式。
2、過去的人工智能是,我們想讓機(jī)器學(xué)會(huì)什么技能,就教它什么技能。教過的可能會(huì),沒教過的就不會(huì)。大模型出現(xiàn)“智能涌現(xiàn)”后,以前沒教過的技能,它也會(huì)了。這就是為什么有人講,我們現(xiàn)在朝著通用人工智能(AGI)方向發(fā)展。
3、大模型如何重新定義人工智能?主要體現(xiàn)在人機(jī)交互方式的變化。過去幾十年,人機(jī)交互方式共經(jīng)歷了三次變革,從命令行到圖形用戶界面(GUI),再到人工智能時(shí)代,我們可以用自然語言跟電腦進(jìn)行交互。也就是說,未來的應(yīng)用是通過自然語言提示詞來調(diào)動(dòng)AI原生應(yīng)用實(shí)現(xiàn)的。
4、人工智能時(shí)代的到來,讓IT技術(shù)棧從三層變成了四層:底層仍然是芯片層,但主要的芯片已經(jīng)不是CPU ,而是以GPU為代表的新一代適合并行大規(guī)模浮點(diǎn)運(yùn)算的芯片;上面我們叫做框架層,就是深度學(xué)習(xí)的框架,像百度的PaddlePaddle飛槳、Meta的PyTorch、谷歌的TensorFlow都是在這一層;再上面一層是模型層,Chat GPT、文心一言等都屬于模型層;最上面是應(yīng)用層,以后AI時(shí)代的原生應(yīng)用,都會(huì)基于大模型來進(jìn)行開發(fā)。
5、模型本身并不直接產(chǎn)生價(jià)值,基于基礎(chǔ)大模型開發(fā)出來的AI原生應(yīng)用才是模型存在的意義。
6、我們不在乎榜單,就是要一步一個(gè)腳印往前走,打造好基礎(chǔ)模型能力,支持好在這個(gè)基礎(chǔ)模型之上開發(fā)出來的AI原生應(yīng)用。在模型之上開發(fā)出來的應(yīng)用越厲害、用的人越多、生產(chǎn)效率和工作效率提升的越多,這才是基礎(chǔ)大模型真正強(qiáng)大的表現(xiàn)。
7、垂類模型不是基礎(chǔ)模型的競(jìng)爭(zhēng)對(duì)手,反而應(yīng)該建立在強(qiáng)大的基礎(chǔ)模型之上。沒有足夠強(qiáng)大的基礎(chǔ)模型做支撐,垂類模型就很難持續(xù)提升和發(fā)展。然而,只有少數(shù)公司會(huì)在基礎(chǔ)模型上達(dá)到較高水平。
8、開源模型在發(fā)展過程不一定都會(huì)變得更好,如果反饋回路不理想,是不利于基礎(chǔ)模型改善升級(jí)的。走彎路的成本變高,就難以建立持久的商業(yè)模式。
卷大模型沒意義,卷應(yīng)用機(jī)會(huì)更大
9、生成式大模型的問世,會(huì)帶來哪些創(chuàng)業(yè)和投資機(jī)會(huì)?我覺得至少有三方面機(jī)會(huì):首先是新型云計(jì)算,第二類是行業(yè)模型的精調(diào),第三類是應(yīng)用開發(fā)。
10、大模型是Game Changer,它會(huì)徹底改變?cè)朴?jì)算的游戲規(guī)則。未來云計(jì)算公司的主要商業(yè)模式會(huì)變成MaaS,就是模型即服務(wù)(Model as a Service)。以后的應(yīng)用會(huì)建立在大模型上,而不是建立在云計(jì)算的這些算力或者存儲(chǔ)上。
11、過去,云計(jì)算主要賣算力,看速度、看存儲(chǔ);今天,客戶購買云服務(wù),要看框架好不好、模型好不好,而不僅僅是看算力怎么樣。
12、大模型時(shí)代,最大的機(jī)會(huì)既不在基礎(chǔ)服務(wù),也不在行業(yè)服務(wù),恰恰是在應(yīng)用。就好像在移動(dòng)互聯(lián)網(wǎng)時(shí)代,最大的商業(yè)機(jī)會(huì)不是iOS或者安卓這樣的操作系統(tǒng),而是微信、抖音、淘寶這些應(yīng)用一樣。
13、美國有幾十個(gè)基礎(chǔ)大模型,跟中國量級(jí)一樣,但在基礎(chǔ)大模型之上,美國已經(jīng)有上千個(gè)“AI原生應(yīng)用”,但中國市場(chǎng)是沒有的,這是最大的區(qū)別。
14、只有在大模型的基礎(chǔ)之上產(chǎn)生了足夠多的AI原生應(yīng)用,才是一個(gè)健康的生態(tài)環(huán)境,這代表了大的技術(shù)發(fā)展趨勢(shì)。
15、對(duì)創(chuàng)業(yè)者來說,卷大模型沒意義,卷應(yīng)用機(jī)會(huì)更大。
16、大模型時(shí)代來了,每一個(gè)產(chǎn)品都值得重做一遍。但誰真正重新做了一遍呢?百度要做第一個(gè)把全部產(chǎn)品重做一遍的公司,不是整合,不是接入,是重做和重構(gòu)。
AI原生應(yīng)用的交互不能超過兩級(jí)菜單
17、AI原生應(yīng)用,不是簡(jiǎn)單地重復(fù)PC時(shí)代軟件或移動(dòng)時(shí)代的APP,而得是“AI”原生,沒有AI就不存在的應(yīng)用。
18、什么是AI原生應(yīng)用?我認(rèn)為至少滿足三個(gè)條件:第一,能用自然語言交互,這是最根本的變化;第二,能充分利用理解、生成、推理、記憶等,這些過去不具備的技術(shù)能力;第三,每個(gè)應(yīng)用的交互都不超過兩級(jí)菜單。
19、每個(gè)AI原生應(yīng)用的交互都不能超過兩級(jí)菜單。如果超過兩級(jí)菜單,大家就記不住這個(gè)功能到底在哪。好多工程師辛苦開發(fā)出來的功能隱藏在第三級(jí)甚至第四級(jí)菜單里,沒有人用。PPT、Excel都是這樣,可能80%的功能,絕大多數(shù)人從來沒用過,就是因?yàn)槭褂瞄T檻太高了,不知道在哪。
20、你只要思路活躍、表達(dá)清晰,機(jī)器就能給你干活兒,這就是AI原生的應(yīng)用。
21、明顯的AI原生應(yīng)用,并不表明就是最好的AI原生應(yīng)用。我認(rèn)為直到今天,最好的AI原生應(yīng)用還沒有出現(xiàn),就是類似于抖音、微信、Uber這種移動(dòng)互聯(lián)網(wǎng)時(shí)代的Mobile Native的APP。沒有手機(jī)的時(shí)候大家是不能想象它們的存在的,但它們確實(shí)產(chǎn)生了很大的社會(huì)影響力。
22、我們四萬百度人,沒有一個(gè)是AI時(shí)代的原住民。雖然大多數(shù)人都經(jīng)歷了PC時(shí)代、移動(dòng)時(shí)代,但某種意義上思維方式仍然被固化了。未來,我們要有意識(shí)地培養(yǎng)AI原生應(yīng)用的思維方式和理念,用新的理念去重構(gòu)現(xiàn)在的每一個(gè)產(chǎn)品和業(yè)務(wù)。
23、生成式AI的來臨,讓我們發(fā)現(xiàn)很多時(shí)候只需要敲一兩個(gè)關(guān)鍵詞、點(diǎn)擊下鼠標(biāo)就能解決問題,不再像過去要用一大段話來描述需求才能獲得想要的內(nèi)容。這也讓我們意識(shí)到,有多少工程師辛辛苦苦開發(fā)出來的功能被藏在一層層菜單下永遠(yuǎn)無人問津,有多少苦思冥想的靈感都無法獲得反饋,但現(xiàn)在,它們可能會(huì)通過一些簡(jiǎn)單的提示詞被激發(fā)出來,所以我們應(yīng)該有勇氣去改變自己的思維方式。
24、改變思維方式是痛苦的,會(huì)經(jīng)歷各種挫折和煎熬,這需要我們用毅力去克服慣性,用發(fā)現(xiàn)和探索的眼光來看待這個(gè)新的世界。
25、我要求公司所有產(chǎn)品重構(gòu)、重做,就是放棄過去對(duì)于桌面、PC這種瀏覽器的依賴,對(duì)于移動(dòng)APP的依賴。要重新想象一下,有了理解、生成、邏輯、推理、記憶能力之后,能夠做成什么應(yīng)用。
自然語言人機(jī)交互會(huì)帶來“提示詞革命”
26、所謂“AI Native”,最明顯的特征就是“提示詞工程(Prompt Engineering)”。過去沒有這個(gè)行當(dāng),我們也不覺得跟計(jì)算機(jī)交互需要那么多講究。但在未來,通過寫好提示詞來激發(fā)大模型的潛力,是非常有意思的行當(dāng),我也認(rèn)為這是新工作機(jī)會(huì)最容易出現(xiàn)的地方。
27、我做過一個(gè)大膽預(yù)測(cè),10年后,全世界有50%的工作會(huì)和“提示詞工程”有關(guān)。這就好像教育方式一樣,提出問題往往比解決問題更重要。未來我們會(huì)需要越來越多的提示詞工程師。
28、今天百度有上萬個(gè)工程師,會(huì)C++、Python,但到了AI原生應(yīng)用全面落地的時(shí)候,可能會(huì)要求大家都來寫Prompt,而且要看寫了之后run出來的結(jié)果如何。
29、人類要學(xué)習(xí)跟機(jī)器打交道的能力,提示詞說成什么樣,機(jī)器就會(huì)匹配什么樣的結(jié)果,這些結(jié)果就是生產(chǎn)力。
30、大模型本身的能力放在那,用得好不好完全靠提示詞決定。提示詞寫得好,智能涌現(xiàn)可能就多一些,反饋結(jié)果就更有價(jià)值一些;提示詞不好,出來的東西就是一本正經(jīng)胡說八道,或者是錯(cuò)誤結(jié)論。
31、提示詞的書寫是有技術(shù)含量的,是需要學(xué)習(xí)的。怎么把提示詞寫好,這既是技術(shù)也是藝術(shù),甚至藝術(shù)的成分還更多些。
32、未來的應(yīng)用是通過自然語言提示詞來調(diào)動(dòng)原生AI應(yīng)用實(shí)現(xiàn)的。這意味著,未來薪酬水平將取決于提示詞寫得好不好。
33、不同的大模型,比如文心大模型和Chat GPT,它們的提示詞也存在明顯差異。畢竟這些模型是通過獨(dú)立底層訓(xùn)練得出來的。如果把它們比喻成一個(gè)人的話,它們的“脾氣秉性”肯定是不同的,在與它們交互的過程中,我們也需要不斷摸索,逐漸了解如何寫提示詞才能達(dá)到更好的效果。
想了解大模型、生成式AI的更多精彩內(nèi)容嗎?即刻報(bào)名參加10月17日在北京首鋼園召開的「百度世界2023」,目前大會(huì)已經(jīng)開放公眾參會(huì)報(bào)名,在大會(huì)官方網(wǎng)站提交申請(qǐng),就有機(jī)會(huì)親臨現(xiàn)場(chǎng),體驗(yàn)這場(chǎng)前沿科技盛會(huì)。
相關(guān)稿件