百度股價三天連漲了12.8%。看網(wǎng)上評論和分析,應(yīng)該是與上周(3月16日)發(fā)布了被稱為“中國版ChatGPT”生成式對話產(chǎn)品“文心一言”有關(guān)。
隨著美國OpenAI研發(fā)的聊天機器人程序ChatGPT的推出,最近一個時期,有關(guān)ChatGPT和AI是網(wǎng)上、微信群討論的熱門話題。我歸納了一下,討論的主題主要集中在兩個方面,一是AI未來會如何發(fā)展,將會給人類的未來帶來什么?二是中國與美國在這方面有多大差距,差距是如何造成的,何時能夠趕上?很多人為此感到焦急和憂慮,有些“恨鐵不成鋼”的情緒。百度比較及時地推出“文心一言”,客觀上是對這種焦慮情緒的回應(yīng),應(yīng)該能夠在一定程度上緩解這種焦慮情緒。
從現(xiàn)場演示來看,“文心一言”在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成等方面的能力比較突出。“文心一言”依托于百度搜索業(yè)務(wù)所積累的海量的知識圖譜,在上述幾個方面做得比較好應(yīng)該是順理成章的。據(jù)介紹,“文心一言”大模型的訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級語音日均調(diào)用數(shù)據(jù)及5500億事實的知識圖譜,因此其在中文語言的處理上,具有獨特的優(yōu)勢。而且,據(jù)說數(shù)據(jù)規(guī)模大,參數(shù)達到千億級,大模型就可能發(fā)生“智能涌現(xiàn)”,涌現(xiàn)出知識和邏輯推理能力。此外,百度的數(shù)據(jù)形態(tài)也最貼合回答和生成需求。在百度搜索中,問答和生成類的搜索請求占比很高。這些,都為“文心一言”在自然語言問答和創(chuàng)意內(nèi)容生成上提供了很好的條件。
也有網(wǎng)友指出“文心一言”對有些問題回答得不夠好。我的理解是目前“文心一言”還有些“偏科”。要它在各個方面都做得好,還需要進行不斷訓(xùn)練。我們相信它會不斷一進步,很可能會進步很快。
值得肯定的是,在全球各大廠中,類似的AI產(chǎn)品,百度是第一個做出來的。這類大型的語言模型,需要多年的研發(fā),不斷地改進,不是短期內(nèi)靠突擊能做出來的。特別是深度學(xué)習(xí)、自然語言處理,需要多年的堅持和積累,沒法速成。
在類似OpenAIChatGPT和百度“文心一言”這樣的領(lǐng)域,硬件的限制少,主要是軟件的能力,應(yīng)該說基本上沒有“卡脖子”的問題。我們國家在這方面應(yīng)該是有優(yōu)勢的。百度有很好的基礎(chǔ),又有很好的政策、市場、人才方面的優(yōu)勢,達到世界先進水平應(yīng)該是很有希望的。我們拭目以待。
(作者系作者上海交大上海高級金融學(xué)院教授陳欣)
相關(guān)稿件