大廠需要證明,他們投入的數(shù)十億元甚至數(shù)百億資金并沒有打水漂。
文|《中國企業(yè)家》記者 閆俊文?
與張一鳴熬夜讀論文、王興收購初創(chuàng)公司不同,劉強(qiáng)東帶領(lǐng)京東高管捕捉大模型的方式是在真實(shí)場景中不斷嘗試產(chǎn)品和服務(wù)。
劉強(qiáng)東在2017年就說過,AI既是一種技術(shù),也是一種思考方式,他甚至?xí)诚脒^,京東未來將實(shí)現(xiàn)無人辦公場景。
技術(shù)大變革期,也是公司興衰交替的關(guān)鍵期。他不可能無視大模型這種顛覆性技術(shù)所產(chǎn)生的影響,京東將如何參與這場游戲呢?
面對這場底層沖擊,各家均有不同的應(yīng)對方式,對于京東來說,它的實(shí)體業(yè)務(wù)基因更濃厚,自1998年創(chuàng)立,已從中關(guān)村的一張柜臺(tái)發(fā)展到如今旗下5家上市公司,還有3家正在尋求上市——京東工業(yè)、京東產(chǎn)發(fā)和京東科技,員工人數(shù)擴(kuò)張至超56萬,業(yè)務(wù)場景比阿里巴巴、騰訊與字節(jié)跳動(dòng)都要復(fù)雜和多元,覆蓋物流、零售、金融、健康、工業(yè)等等。
產(chǎn)業(yè)場景多元以及天然的to B場景,讓京東對大模型服務(wù)產(chǎn)業(yè)的渴求更強(qiáng)烈,天然成為了大模型落地產(chǎn)業(yè)最好的“練兵場”。
在京東之前,騰訊、百度以及阿里巴巴都發(fā)布了行業(yè)大模型方案,但一位SaaS行業(yè)人士感慨,只聽到雷聲,不見下雨,暗示這些互聯(lián)網(wǎng)巨頭不會(huì)輕而易舉攻下行業(yè)山頭。
京東的雷聲和雨點(diǎn)在哪里?
全集團(tuán)共建
大模型正在變成京東公共環(huán)境的一部分。它以視頻與海報(bào)的形式,出現(xiàn)在總部電梯間電視里、辦公走廊的墻上。
2023年2月份,京東對外宣布將發(fā)布服務(wù)產(chǎn)業(yè)的大模型。很快,大模型在京東集團(tuán)內(nèi)部也被提升到了更高的優(yōu)先級(jí),并很快成立了大模型項(xiàng)目組,至少已向劉強(qiáng)東匯報(bào)過5次。
何曉冬博士是京東探索研究院院長及京東科技智能服務(wù)與產(chǎn)品部總裁,也是京東自研“言犀大模型”的核心科學(xué)家。他說,以零售為例,人們購物的行為是事件驅(qū)動(dòng),以“我要買什么”開始,但大模型技術(shù)加入后,可能以“我要干什么”開始,這意味著,購物行為包括了小紅書的種草、抖音的內(nèi)容以及京東的貨架,混合了多種形態(tài)。
內(nèi)容以及交互的變革不斷驅(qū)動(dòng)新產(chǎn)品以及巨頭公司的興起。從雅虎的衰落到谷歌的崛起,從淘寶再到抖音的崛起,王座權(quán)力的轉(zhuǎn)移總是伴隨著這條鐵律。如今,大模型為代表的AI則重寫這條鐵律。
大模型訓(xùn)練需要大量的產(chǎn)業(yè)數(shù)據(jù)做預(yù)訓(xùn)練,這些數(shù)據(jù)分布在京東零售、健康、物流、金融等各個(gè)產(chǎn)業(yè)線。于是,集團(tuán)協(xié)調(diào),各個(gè)BG(事業(yè)群)和BU(事業(yè)部)都參與大模型項(xiàng)目,最后,大模型項(xiàng)目組的人數(shù)達(dá)到了100人左右。
“他們把零售、物流、健康等業(yè)務(wù)數(shù)據(jù)帶進(jìn)來,也會(huì)把大模型的功能帶回去用?!焙螘远f。
這構(gòu)成了京東言犀大模型30%的訓(xùn)練數(shù)據(jù)來源——京東圍繞著數(shù)智供應(yīng)鏈積累下的高質(zhì)量原生數(shù)據(jù),而剩下70%來源于通用數(shù)據(jù)。何曉冬形容這個(gè)過程就像對大模型進(jìn)行高等教育——學(xué)習(xí)了通用知識(shí)后開始在大學(xué)學(xué)習(xí)專業(yè)知識(shí)。
行業(yè)數(shù)據(jù)進(jìn)來了,對數(shù)據(jù)還要做脫敏、分類以及加權(quán)處理,比如經(jīng)營、營銷、特有知識(shí)的數(shù)據(jù);針對不同行業(yè),不同數(shù)據(jù)的加權(quán)系數(shù)是不一樣的,比如金融領(lǐng)域,業(yè)務(wù)數(shù)據(jù)權(quán)重會(huì)多一些,要幫助員工更好地把控風(fēng)險(xiǎn);零售領(lǐng)域,又分倉儲(chǔ)、商城、社區(qū)團(tuán)購、到家、超市等業(yè)務(wù)單元,不同類型數(shù)據(jù)對細(xì)分的業(yè)務(wù)場景的重要性也是不同的。
何曉冬強(qiáng)調(diào),要做行業(yè)大模型,企業(yè)必須在這個(gè)行業(yè)做到足夠的頭部以及沉浸數(shù)年以上,才能吃透這個(gè)行業(yè),了解行業(yè)發(fā)展的痛點(diǎn)。
在基礎(chǔ)設(shè)施上,京東云此前就建立了一個(gè)1000多張(A100)顯卡的機(jī)房,這是他們在2021年購入的,集成了英偉達(dá)最先進(jìn)的計(jì)算和連接設(shè)備,保障大模型的訓(xùn)練和迭代。
京東也在同步采用大模型改造內(nèi)部流程,他們發(fā)起了名為“效能提升”的項(xiàng)目,讓程序員運(yùn)用大模型產(chǎn)品工具,提升敲代碼、寫注釋以及測試案例的效率。綜合評估下來,業(yè)績平均估計(jì)提升20%以上。
在產(chǎn)品層面,除了智能客服,京東開始內(nèi)部測試言犀大模型在諸多業(yè)務(wù)場景中的應(yīng)用。比如產(chǎn)品搜索與推薦上,電商將很快從“萬事皆搜索”進(jìn)入到“萬事皆服務(wù)” 的時(shí)代。
以搜索“帳篷”為例,未來,搜索結(jié)果里不僅僅看到帳篷這個(gè)產(chǎn)品,更能看到露營上下游配套的產(chǎn)品和服務(wù),比如上游的旅行地推薦,下游的配套“燒烤”“鞋帽”等產(chǎn)品,加入了類似小紅書或者攜程的功能。它還可以自動(dòng)生成一些文案,用戶露營完之后,可以發(fā)送至朋友圈。
還有金融營銷,通過自動(dòng)化營銷助手“AI增長營銷平臺(tái)”提升營銷活動(dòng)方案生產(chǎn)效率。這種全新的交互模式,讓人機(jī)交互次數(shù)從2000次降低至少于50次,操作效率可提升超過40倍。
何曉冬認(rèn)為,通過人機(jī)多輪溝通,機(jī)器能更好地理解用戶的意圖,將意圖轉(zhuǎn)化為需求。傳統(tǒng)互聯(lián)網(wǎng)領(lǐng)域里有“注意力經(jīng)濟(jì)學(xué)”理論,它主要靠設(shè)計(jì)、折扣、廣告等客觀條件來吸引用戶,但在“意圖理解”的場景下,通過多輪對話,用戶自己就會(huì)沉浸其中,并產(chǎn)生消費(fèi)以及內(nèi)容。
這是一個(gè)比當(dāng)下垂類APP更龐大復(fù)雜的形態(tài)。如果搜索時(shí)代是信息聚合與匹配,那么大模型的時(shí)代則進(jìn)入了內(nèi)容精準(zhǔn)生成,用戶隨時(shí)隨地 “Ask Me Anything(隨便問)”。
打磨毛刺
7月,京東推出言犀大模型之后,并沒有急于推向市場,尋求落地,他們的時(shí)間路線圖是今年下半年內(nèi)部錘煉,并針對重點(diǎn)場景和客戶進(jìn)行打磨,2024年初對外開放大模型能力。
何曉冬將言犀大模型錘煉的過程稱之為“打磨毛刺”。他以健康問診為例解釋,京東計(jì)劃在8月正式上線健康行業(yè)大模型。現(xiàn)在內(nèi)部更多是Beta(測試)版本,比如會(huì)遇到如何保護(hù)病人自尊心的問題,這涉及到溝通的語速、方式,小概率情況下,會(huì)測出產(chǎn)品說話不合適的現(xiàn)象。
“技術(shù)和產(chǎn)品之間其實(shí)是有鴻溝的,產(chǎn)品一定是用戶角度,技術(shù)是創(chuàng)新角度?!焙螘远f。技術(shù)體系的人一定要往前走一步,主動(dòng)貼近產(chǎn)品體系的人。
他預(yù)測,現(xiàn)在已經(jīng)到了大模型技術(shù)要通過產(chǎn)品來證明自己價(jià)值的階段。AI技術(shù)有點(diǎn)像云業(yè)務(wù)一樣,它是提高生產(chǎn)力的,最后必然為各種各樣的行業(yè)服務(wù),因此一定是往行業(yè)走。
大模型與行業(yè)結(jié)合越深,其產(chǎn)生的價(jià)值也就越大。目前ChatGPT也在摸索對外的商業(yè)化,包括通過API(應(yīng)用程序編程接口)訂閱服務(wù)等,就如谷歌在互聯(lián)網(wǎng)時(shí)代基于流量的廣告模式。
API價(jià)值偏低,它的技術(shù)理解門檻也比較高,需要企業(yè)專人負(fù)責(zé)調(diào)用。而對于大模型開發(fā)企業(yè)來說,很容易陷入API價(jià)格戰(zhàn),變成一門負(fù)向的業(yè)務(wù)。
由此而論,大模型時(shí)代,API接口未必是主流的商業(yè)化路徑,原因在于,它與行業(yè)連接太淺,對產(chǎn)業(yè)的技術(shù)要求也太高,賣產(chǎn)品和私有化部署大模型或許才是正路。據(jù)悉,已有人開始叫賣大模型,1000萬元就能買到一個(gè)完整數(shù)據(jù)、算法、算力的大模型。
在上海,也有一些“云買手”嘗試用大模型為客戶服務(wù)。以往,他們通過人工服務(wù)數(shù)十個(gè)客戶,人均年盈利在二三十萬元之間,這就到了天花板。但用上大模型之后,他們?nèi)司?wù)的客戶量翻了10倍,釋放了大量的生產(chǎn)力以及利潤空間。
與業(yè)內(nèi)資深人士的看法類似,何曉冬也認(rèn)為生成式人工智能是一個(gè)完全不同于移動(dòng)互聯(lián)網(wǎng)時(shí)代的物種。相較于移動(dòng)互聯(lián)網(wǎng)時(shí)期,京東的探索要更前置,更貼合業(yè)務(wù),更不能回避競爭。
事實(shí)上,此次大模型之爭,大公司競爭的中心點(diǎn)不在資本、地推或者補(bǔ)貼策略,而是各自的研究院或者實(shí)驗(yàn)室以及落地場景。
不管是京東還是阿里巴巴、騰訊,他們都有自己的研究院或者人工智能實(shí)驗(yàn)室,比如2017年成立的阿里達(dá)摩院,2012年成立的騰訊優(yōu)圖實(shí)驗(yàn)室,2014年成立的百度研究院,2017年成立的京東人工智能研究院和2020年成立的京東探索研究院。
當(dāng)前技術(shù)大咖們走到了價(jià)值創(chuàng)造階段,他們需要驗(yàn)證,大公司投入的數(shù)十億元甚至數(shù)百億資金不是泡影。
騰訊成立了專門的技術(shù)委員會(huì)協(xié)調(diào)各大實(shí)驗(yàn)室。騰訊對于研發(fā)的態(tài)度是,不會(huì)取消所有冒險(xiǎn)研究,始終會(huì)保留一支小分隊(duì)探索前沿,留下火種。
何曉冬說,他給了京東探索研究院三個(gè)任務(wù),第一,要在重要的競爭激烈的領(lǐng)域做到前沿,不回避競爭,愿意挑戰(zhàn)和競爭;第二,對重要業(yè)務(wù)和產(chǎn)品要形成支撐,對公司有價(jià)值;第三,要有足夠的前瞻性。
創(chuàng)始人與一號(hào)項(xiàng)目
從2月高舉大旗到6月病退,王慧文的軌跡似乎預(yù)示著此次大模型創(chuàng)業(yè)熱暫告一段落,他創(chuàng)立的光年之外最終被美團(tuán)收購。坐到牌桌上的,只剩下大公司。
巨頭公司爭斗往往表面悄無聲息,但碰撞在一起的剎那,所產(chǎn)生的能量也是驚人的,甚至?xí)品硞€(gè)旁觀者, BAT時(shí)代曾發(fā)生的邊界大戰(zhàn),就如同今日的一個(gè)序章。
外部環(huán)境急劇變化,既有宏觀層面的挑戰(zhàn),也有AI浪潮的興起,這些正在讓大公司的CEO或者創(chuàng)始人重回一線。
張勇將于今年9月卸任阿里巴巴集團(tuán)董事會(huì)主席兼CEO職務(wù),專職擔(dān)任阿里云智能集團(tuán)董事長兼CEO,他希望在那里再造一個(gè)阿里巴巴。李彥宏、周鴻祎等紛紛出場,為自家大模型產(chǎn)品代言和推介。
京東集團(tuán)新任CEO許冉說:“當(dāng)產(chǎn)業(yè)效率和產(chǎn)業(yè)的邊界拓展得到質(zhì)的提升后,大模型才有更重要的實(shí)際價(jià)值和意義,將不亞于又一次工業(yè)革命?!痹诖饲罢匍_的2023京東全球科技探索者大會(huì)上,她提出了京東對于大模型價(jià)值的公式,大模型的價(jià)值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方。
創(chuàng)始人與CEO的關(guān)注,既能讓項(xiàng)目在公司內(nèi)部獲得大量資源支持,但也會(huì)帶來壓力,那就是盡快產(chǎn)生營收、利潤回報(bào)。
何曉冬坦言,京東言犀大模型的當(dāng)下還是一個(gè)成本中心,但集團(tuán)對大模型項(xiàng)目還沒有盈利要求;具體到自己負(fù)責(zé)的智能服務(wù)板塊,則已經(jīng)實(shí)現(xiàn)了盈利,這也是大模型產(chǎn)業(yè)化應(yīng)用價(jià)值的縮影。
如果說,AI是一條河,那么各家公司的產(chǎn)品方案有的是架橋,有的是鋪路,有的是造船,各有不同。誰最終越過科學(xué)研究到實(shí)際產(chǎn)品轉(zhuǎn)化鴻溝的這片“達(dá)爾文之?!?#xff0c;只能留給時(shí)間來驗(yàn)證。
相關(guān)稿件