狂飆200天,中國門徒不寫詩只做事。
文|《中國企業(yè)家》記者 趙東山
編輯|李薇
大模型創(chuàng)業(yè)狂飆200多天后,中國探索者們的心態(tài),從理想亢奮來到現(xiàn)實落地。
在此之前,AI大模型的創(chuàng)業(yè)在其公司本身之外,還被賦予了民族情緒、時代風口等更多的意義——面對通用大模型ChatGPT的橫空出世,中國創(chuàng)業(yè)者們壯志未酬很快達成共識:如何打造一個中國版的OpenAI和ChatGPT。
毫無疑問,ChatGPT是今年的世界頂流。因為它,OpenAI網(wǎng)站的流量在4月份就超過了18億,進入了全球流量排名前20。然而,網(wǎng)絡分析公司Similarweb公布的數(shù)據(jù)顯示,在狂飆半年后,ChatGPT的訪問量首次出現(xiàn)負增長,6月份的訪問量環(huán)比下滑9.7%。
ChatGPT流量驟降引發(fā)全球科技界對AI產(chǎn)業(yè)泡沫化風險的擔憂和討論,《經(jīng)濟學人》雜志甚至做出“越大越好的AI之路快行不通了”的論斷。而成為“中國版ChatGPT”的想法,也在和中國創(chuàng)業(yè)圈漸行漸遠。
金沙江創(chuàng)始合伙人朱嘯虎在朋友圈寫道:“不要迷信通用大模型,因為明年GPT-3.5就成commodity(通用基礎(chǔ)設施),而三年后,GPT-4也會是。對于大部分創(chuàng)業(yè)者,場景優(yōu)先,數(shù)據(jù)為王!”
從業(yè)者們心態(tài)變化的同時,大模型創(chuàng)業(yè)市場已經(jīng)開始出現(xiàn)分野。
中國的大模型企業(yè)們已經(jīng)不再執(zhí)著于“成為中國的OpenAI”這種理想化目標,也不再癡迷于對參數(shù)模型和算力的追求,他們有了更務實的答案,也更注重其對實際產(chǎn)業(yè)場景中的問題解決。
AI大模型的競逐迎來了新的賽道節(jié)點
集體務實
今年年初,攜程創(chuàng)始人、董事局主席梁建章開始接觸ChatGPT。近些年,他以人口學家的身份活躍在學界和企業(yè)界,不過他也曾是中國最早和最小的程序員,也差點成為人工智能方向的博士。
13歲時梁建章設計了一個寫格律詩的程序獲得全國大獎,15歲考入復旦大學少年班,畢業(yè)后赴美國留學并在21歲獲得喬治亞理工學院電腦系碩士學位。22歲那年正在攻讀博士的梁建章,突然意識到理論知識的局限性,選擇放棄讀博入職美國甲骨文。
ChatGPT的出現(xiàn),讓梁建章慶幸自己當年沒有繼續(xù)念人工智能博士,因為“所有的這些自然語言處理的算法,都一下被它(ChatGPT)全部打敗了”。他回憶,剛開始接觸ChatGPT的時候,“非常非常震驚”,第二個感覺是謙卑,“我們最后做出來最智能的算法,竟然是跟人腦的生物構(gòu)造那么的接近”。
梁建章開始思考AI大模型與攜程業(yè)務的結(jié)合點。
在梁建章看來,智能社會背景下,旅游業(yè)作為“難以自動化的精神需求行業(yè)”,其需求會隨著整體社會富裕程度的提升而增多,在經(jīng)濟中的占比也會擴大。他將目光鎖定在旅游行業(yè)的垂直大模型上。
過去半年,來自攜程各個業(yè)務的成員組成攜程大模型技術(shù)團隊。在大模型研發(fā)初期,攜程根據(jù)大模型的戰(zhàn)略要求進行了組織架構(gòu)調(diào)整,并形成了包括通用技術(shù)團隊、內(nèi)容策略團隊、榜單團隊等不同部門,根據(jù)大模型產(chǎn)品的不斷升級迭代對技術(shù)團隊進行適配。
梁建章表示,攜程會不遺余力地為大模型投入,“長遠對我們的客戶或者是商戶有價值的,我們就應該非常堅定地投資下去。這個(大模型)非常新,技術(shù)團隊不斷優(yōu)化他們的投資數(shù)額,但是我們不設限?!?/p>
攜程在7月中旬正式發(fā)布了旅游行業(yè)垂直大模型問道。問道篩選了200億非結(jié)構(gòu)性旅游數(shù)據(jù),結(jié)合攜程現(xiàn)有的結(jié)構(gòu)性實時數(shù)據(jù),以及攜程歷史訓練的機器人和搜索算法,進行了自研垂直模型的訓練,“同時,我們投入了巨大人力對旅行通用回復內(nèi)容進行生成和校驗。”梁建章強調(diào)。
在問道發(fā)布前,攜程已經(jīng)進行內(nèi)測,客服人員王蕓明顯感覺自己的工作發(fā)生了很大的變化。以前,她一天要接150多個電話,為客人解答售后訂單取消、行李丟失等問題;如今,王蕓轉(zhuǎn)型成行前推薦客服,從幕后走進直播間,為網(wǎng)友提供旅行前需要準備的服務和建議。
在梁建章看來,通用大模型的基礎(chǔ)上,解決旅游行業(yè)準確率的問題依然是關(guān)鍵:“旅游是個重消費的行業(yè),即使規(guī)劃節(jié)省了半小時,但推薦的酒店或者行程結(jié)果可能有5%的幾率是錯的?!币虼?#xff0c;相較于ChatGPT那樣的通用大模型,梁建章更看重垂直大模型的機會。
雖然在參數(shù)上不及通用大模型,也沒有通用大模型對算力等條件的苛刻要求,但垂直大模型對數(shù)據(jù)和場景提出了更高的要求。
問道大模型訓練中最大的挑戰(zhàn)是真實場景下,用戶獲取旅游信息過程中,多輪交互數(shù)據(jù)的搜集和清洗,數(shù)據(jù)量和數(shù)據(jù)準確性需要不斷修正,特別是旅游行業(yè)變化巨大,三年前的目的地信息到現(xiàn)在有可能已經(jīng)全部過時,特別是疫情對全球旅游業(yè)的影響更是加劇了數(shù)據(jù)的時效性。
和攜程一樣,越來越多的公司把大模型的賽道放到了垂直領(lǐng)域。
京東交出的言犀大模型答卷,也將產(chǎn)業(yè)大模型作為重要特征。在京東集團新CEO許冉看來,過去的人工智能技術(shù)發(fā)展,曾經(jīng)數(shù)次臨近應用爆發(fā)的邊緣,但最終往往曇花一現(xiàn),而技術(shù)沒有在產(chǎn)業(yè)端形成扎實的應用是重要的原因之一。
在7月7日華為盤古大模型3.0的發(fā)布會上,華為云CEO張平安更是直言,“盤古大模型沒有時間作詩和聊天。參數(shù)再多、對話能力做得再好,但如果解決不了實際問題,也沒有多大用處?!?/p>
騰訊至今還沒有公布通用大模型混元的進展,但卻高調(diào)公布了行業(yè)大模型路線,一口氣拋出10大行業(yè)超過50個解決方案。騰訊副總裁、騰訊政企業(yè)務總裁李強同樣表示:“通用大模型不是模型應用的唯一方向,面向垂直產(chǎn)業(yè)的模型會成為大模型價值的引爆點?!?/p>
心態(tài)轉(zhuǎn)變
大模型創(chuàng)業(yè)者心態(tài)轉(zhuǎn)變的一個顯性的節(jié)點,是從王慧文被確診抑郁癥,其創(chuàng)辦的光年之外被美團收購開始。大家突然意識到,即便是那個曾經(jīng)眾望所歸、被寄予厚望的明星公司,也可能因為各種意外的出現(xiàn)而不得不停止。
就在半年前,一夜之間其他風口似乎都消散了,只有大模型是C位。中國科技圈的創(chuàng)業(yè)者與投資人,紛紛飛往硅谷向OpenAI學習,張一鳴、馬化騰、王興,這些巨頭的一號位或者決策中心人物,一夜間回到剛創(chuàng)業(yè)時的亢奮、好奇狀態(tài),深夜閱讀論文、交流技術(shù)。
那時候,似乎每個中國大模型探索者思考問題的角度都是帶著家國情懷的。面對ChatGPT的快速迭代,中國創(chuàng)業(yè)者們給自己設定的目標都是如何在多少時間內(nèi)實現(xiàn)反超。
李彥宏稱,“百度文心一言在研發(fā)階段時,百度技術(shù)團隊曾與ChatGPT進行對比測試,當時差距是40分的水平,一個月能追得上”;王小川也表示,將在年底做出中國最好的大語言模型。
360創(chuàng)始人周鴻祎在此前接受《中國企業(yè)家》的采訪時說道,大模型已不是商業(yè)競爭的維度了,如果中文互聯(lián)網(wǎng)的封閉性和移動互聯(lián)網(wǎng)導致的APP之間的數(shù)據(jù)孤島問題未能解決,很可能導致人工智能引擎訓練的局限性,進而可能導致中美之間新一輪AI革命的代際差距。
關(guān)于為什么沒有在中國誕生OpenAI這樣的公司,中國的企業(yè)家們甚至在當時開始反思,過往國內(nèi)的人工智能探索過于實用主義了,一切以KPI為導向,以至于大家根本沒有那樣的投入決心和耐心,而因此錯過了這樣的重要節(jié)點。
激情之下,在百度文心一言打響第一槍之后,超過80個AI大模型在半年內(nèi)涌現(xiàn),僅在上海舉辦的2023世界人工智能大會上就出現(xiàn)了30多個大模型,用“百模大戰(zhàn)”來形容當下大模型的火熱一點也不夸張。
但我們真的需要這么多大模型嗎?我們到底需要什么樣的大模型?
事實上,李彥宏很早便提出,“創(chuàng)業(yè)公司重新做一個ChatGPT其實沒有多大意義。我覺得基于這種大語言模型開發(fā)應用機會很大,沒有必要再重新發(fā)明一遍輪子,有了輪子之后,做汽車、飛機,價值可能比輪子大多了。”
京東集團技術(shù)副總裁何曉冬同樣從一開始意識到,“大模型要有價值的話,得落在產(chǎn)業(yè)上,而且最好是產(chǎn)業(yè)價值大的領(lǐng)域,這樣才能真正成為一個長期可持續(xù)的事兒,否則就可能會成為曇花一現(xiàn)的東西?!?/p>
新的變量
就在國內(nèi)創(chuàng)業(yè)者們苦苦為AI大模型探索時,扎克伯格的一記大招給這個本就瞬息萬變的領(lǐng)域帶來了新的變量。
北京時間7月19日凌晨,Meta發(fā)布了開源大模型Llama 2,再次引爆了AI圈:Llama 2不僅性能不輸GPT-3,而且免費、開源,還可商用。Llama 2是Meta今年3月初發(fā)布的Llama模型的后續(xù)版本。
隨后的微軟Inspire合作伙伴大會上,微軟CEO薩提亞·納德拉宣布了Meta與微軟合作的消息,這項合作讓Llama 2可以運行在微軟的云服務Microsoft Azure上。與此同時,亞馬遜AWS云也加入與Meta的合作中。
Llama 2對大模型創(chuàng)業(yè)者的意義在于,就像安卓系統(tǒng)之于APP開發(fā)一樣,開發(fā)者不用重復造輪子了,直接用最低的成本獲得大模型的基礎(chǔ)設施使用,從而可以更加聚焦自身的產(chǎn)業(yè)場景。
這在某種程度上也意味著,對于大多數(shù)創(chuàng)業(yè)者而言,選擇聚焦產(chǎn)業(yè)垂直應用被證實確實是一條更具實用價值的道路。
不過,不同于通用大模型,產(chǎn)業(yè)大模型對行業(yè)參與者也提出了不同的門檻和要求:一方面,產(chǎn)業(yè)大模型要求開發(fā)者具備一定技術(shù)積累和實力;另一方面,產(chǎn)業(yè)大模型也要求操盤者具備豐富的產(chǎn)業(yè)應用實踐場景。
梁建章告訴《中國企業(yè)家》:“通用大模型最重要的指標可能是,多少的參數(shù)或者是用多少的GPU等等,但垂直大模型,大語言模型只是其中的一個組成部分,它還有和其他數(shù)據(jù)的結(jié)合,包括人工的校驗等等,這些是更重要的。最終指向是不是可以把客戶的這些提問、問答來檢驗效率提升了多少,準確性、可靠性提升了多少?!?/p>
“旅游最大問題就是可靠性,這確實比AI作詩、寫文章、寫小說可能更復雜,也是一項長期的工作,凡是可以把這個提升到80%、90%,95%,甚至99%的事情,都是值得有必要做的。”梁建章最后表示。
相關(guān)稿件