“中國(guó)創(chuàng)業(yè)者在移動(dòng)互聯(lián)網(wǎng)時(shí)代是最會(huì)做應(yīng)用的。”
文|《中國(guó)企業(yè)家》記者 趙東山
“國(guó)內(nèi)好的大模型應(yīng)用目前還是太少了,2023年大家都使勁做大模型,反倒在應(yīng)用方面沒(méi)有大的突破?!边@是網(wǎng)易有道CEO周楓投身大模型一年后最大的感受。
在他看來(lái),2024年大模型應(yīng)用即將迎來(lái)爆發(fā),“咱們中國(guó)創(chuàng)業(yè)者在移動(dòng)互聯(lián)網(wǎng)時(shí)代可是最會(huì)做應(yīng)用的”。2023年,周楓去美國(guó)轉(zhuǎn)了一圈,他發(fā)現(xiàn)那邊的創(chuàng)業(yè)活力非常強(qiáng),大家都在各個(gè)層級(jí)上創(chuàng)新,他意識(shí)到國(guó)內(nèi)需要再次加速,尤其在應(yīng)用層。
過(guò)去一年,不同于百川智能創(chuàng)始人王小川、智譜CEO張鵬等清華大學(xué)校友研發(fā)超大規(guī)模大模型,周楓帶領(lǐng)團(tuán)隊(duì)研發(fā)出“子曰”教育大模型之后,就快速投入到大模型原生應(yīng)用的開(kāi)發(fā)中,業(yè)務(wù)被逼著進(jìn)入一種快速迭代的狀態(tài),周楓參與業(yè)務(wù)會(huì)議的頻率從月會(huì)變成了周會(huì),他形容當(dāng)時(shí)的團(tuán)隊(duì)狀態(tài)是“應(yīng)用團(tuán)隊(duì)和模型團(tuán)隊(duì)互相逼”。
截至目前,基于“子曰”教育大模型,有道已推出10多款學(xué)習(xí)類(lèi)AI原生應(yīng)用和功能,成為國(guó)內(nèi)開(kāi)發(fā)AI原生應(yīng)用最多的大模型企業(yè)之一。而基于大模型對(duì)原有業(yè)務(wù)的重構(gòu),有道的業(yè)績(jī)變化也真實(shí)地體現(xiàn)在公司的經(jīng)營(yíng)數(shù)據(jù)中。
根據(jù)有道2023年第三季度的財(cái)報(bào),網(wǎng)易有道該季凈收入15.4億元,毛利率上升至55.9%,達(dá)到近兩年新高;季度經(jīng)營(yíng)虧損同比收窄73.7%,總運(yùn)營(yíng)費(fèi)用也同比下降,經(jīng)營(yíng)效率進(jìn)一步提升。
在具體產(chǎn)品和業(yè)務(wù)上,受益于大模型的助力,AI Box的升級(jí)以及AI寫(xiě)作功能的推出,帶動(dòng)有道詞典及有道翻譯第三季度會(huì)員費(fèi)同比增長(zhǎng)160%以上,在線營(yíng)銷(xiāo)服務(wù)凈收入較2022年同期增長(zhǎng)113.5%。
“搭載了子曰大模型的產(chǎn)品,比同期發(fā)布的未搭載大模型應(yīng)用的產(chǎn)品,在用戶(hù)使用頻率上要高出50%以上。”周楓告訴《中國(guó)企業(yè)家》。
從2006年網(wǎng)易有道成立,周楓相繼做了有道搜索、有道詞典、有道云筆記、有道精品課、有道詞典筆等業(yè)務(wù),業(yè)務(wù)范圍覆蓋K12教育、成人教育、素質(zhì)教育、智能硬件等領(lǐng)域,這讓大模型的應(yīng)用落地有了眾多的場(chǎng)景。
雖然有道并非大模型企業(yè)中規(guī)模最大的一家,但周楓采取的“小快靈”AI應(yīng)用開(kāi)發(fā)路線,很顯然已率先在商業(yè)模式上奏效。當(dāng)外界在追問(wèn)大模型到底給企業(yè)帶來(lái)哪些增量時(shí),有道已經(jīng)在各業(yè)務(wù)的用戶(hù)反饋中得到了答案。
“做企業(yè)最重要的是挑什么仗去打?!敝軛髡f(shuō)道,“如果你告訴團(tuán)隊(duì)去打根本不可能贏的仗,那不是害大家嗎?”
把重心轉(zhuǎn)移到應(yīng)用上
時(shí)間回到2022年11月底,ChatGPT發(fā)布之后,周楓試用后感到非常震撼。他跟算法團(tuán)隊(duì)來(lái)來(lái)回回地用,測(cè)試它的能力底線,在公司內(nèi)部評(píng)測(cè)模型不同能力的細(xì)節(jié)。為了了解更多技術(shù)細(xì)節(jié),周楓把從GPT-2開(kāi)始的所有語(yǔ)言模型相關(guān)的論文全部讀了一遍。
2023年1月,有道內(nèi)部召開(kāi)年度戰(zhàn)略會(huì),這是公司每年的傳統(tǒng),周楓把總監(jiān)以上的團(tuán)隊(duì)集中在一起連續(xù)開(kāi)三天會(huì)。不同于往年,2023年周楓讓有道首席科學(xué)家段亦濤講了一個(gè)多小時(shí)GPT相關(guān)的技術(shù),讓大家做了充分的討論。
最終的結(jié)論是,大模型是一個(gè)革命性的技術(shù),如果有道不迅速入局,革新和顛覆自己,就連起家的詞典和翻譯業(yè)務(wù)就也別干了。當(dāng)時(shí),周楓和團(tuán)隊(duì)一直在思考,ChatGPT、大模型跟有道到底有沒(méi)有關(guān)系?有道到底要做什么?有沒(méi)有合作方可以調(diào)用?
“我們從第一天開(kāi)始就決定要做一批應(yīng)用,而不是說(shuō)我要訓(xùn)個(gè)模型出來(lái),然后看怎么辦?我不是這個(gè)想法,只是當(dāng)時(shí)找了一圈都沒(méi)有可調(diào)用的大模型,只能自己訓(xùn)練。我覺(jué)得你把大模型弄出來(lái),卻搞不明白用來(lái)干什么的話,自己做大模型的意義就不大了?!敝軛鞲嬖V《中國(guó)企業(yè)家》。
其實(shí),當(dāng)時(shí)美國(guó)可汗學(xué)院等教育公司已經(jīng)開(kāi)始嘗試接入GPT-3.5,做一些教育服務(wù)嘗試,但國(guó)內(nèi)還沒(méi)有能力綜合又非常成熟的可以接入的模型,周楓必須得自己做。
很快,周楓就和團(tuán)隊(duì)達(dá)成兩個(gè)共識(shí):第一,有道團(tuán)隊(duì)一定要自己做大模型,如果自己不做是很難完全摸清楚門(mén)道的,公司的動(dòng)作就會(huì)變得很慢,做什么都落在別人后面,成為一個(gè)跟隨者;第二,做開(kāi)源大模型肯定打不過(guò)專(zhuān)門(mén)做超大規(guī)模大模型的公司,必須把重心轉(zhuǎn)移到應(yīng)用上。
作為資深技術(shù)從業(yè)者,周楓過(guò)去20年見(jiàn)證了好幾輪技術(shù)變革浪潮,歷史經(jīng)驗(yàn)告訴他,每一次大的浪潮里,機(jī)會(huì)不僅僅在于基礎(chǔ)技術(shù)。就像互聯(lián)網(wǎng)發(fā)展之初,做服務(wù)器和路由器的公司最賺錢(qián),但大家很快就發(fā)現(xiàn)互聯(lián)網(wǎng)的精髓不在路由器,而是在互聯(lián)網(wǎng)應(yīng)用上。
他認(rèn)為,如果中國(guó)的創(chuàng)業(yè)者眼睛全盯著要去做大模型,就會(huì)像移動(dòng)互聯(lián)網(wǎng)時(shí)代那樣,整天盯著怎么做手機(jī)而忽視了微信、淘寶、抖音等應(yīng)用的機(jī)會(huì)。
不做1000億參數(shù)以上大模型
截至目前,有道大模型團(tuán)隊(duì)超過(guò)100人,且大多數(shù)都是從原來(lái)的團(tuán)隊(duì)轉(zhuǎn)過(guò)來(lái),他們中很多都有人工智能領(lǐng)域的相關(guān)研發(fā)經(jīng)驗(yàn)。
除了人才外,有道在AI方面也有深厚的積累。早在2008年,有道成為國(guó)內(nèi)第一家提供統(tǒng)計(jì)機(jī)器翻譯模型的公司;2017年,有道從機(jī)器翻譯引擎升級(jí)成神經(jīng)網(wǎng)絡(luò)翻譯引擎,隨后又升級(jí)到現(xiàn)在主流的Transformer技術(shù)。因此,在做大模型的時(shí)候,有道團(tuán)隊(duì)過(guò)往很多積累都可以用上。
但即便有技術(shù)積累和人才優(yōu)勢(shì),周楓給團(tuán)隊(duì)設(shè)定的邊界是:堅(jiān)決不會(huì)做1000億參數(shù)以上的模型。
在周楓看來(lái),大模型目前可分為三個(gè)層級(jí)——1000億參數(shù)以上的超大模型、100億參數(shù)~1000億參數(shù)的中間模型和100億參數(shù)以下的小模型。每個(gè)層級(jí)都定位不同的實(shí)用場(chǎng)景,其中超大模型提供最佳質(zhì)量,具備較強(qiáng)數(shù)理推理能力;中間的模型具備知識(shí)的能力,且因?yàn)槌杀据^低,但效果不錯(cuò),可以廣泛應(yīng)用;而小模型則是放到設(shè)備里,具備語(yǔ)言能力和情緒能力。
“我們基本上相對(duì)早期的時(shí)候就琢磨明白這件事兒了,超大規(guī)模的模型應(yīng)該留給專(zhuān)門(mén)以大模型為全部工作的公司去做,一方面太貴了,另一方面市場(chǎng)也不需要重復(fù)建設(shè)?!敝軛鞲嬖V《中國(guó)企業(yè)家》。
在他看來(lái),有道作為教育科技企業(yè),核心的差異應(yīng)該來(lái)自于中間和底下兩個(gè)模型。而這其中,要求開(kāi)發(fā)者對(duì)不同層級(jí)的模型能力有深刻的理解,且能將產(chǎn)品需求和能力模型匹配。
在結(jié)合過(guò)往業(yè)務(wù)尋找落地場(chǎng)景應(yīng)用的過(guò)程中,周楓確立了兩個(gè)原則:第一,解決用戶(hù)在教育場(chǎng)景的需要;第二,能快速變現(xiàn),有足夠的商業(yè)空間。而虛擬人口語(yǔ)教練Hi Echo、AI家庭教師小P老師等應(yīng)用和功能,都是他認(rèn)為既能滿(mǎn)足用戶(hù)學(xué)習(xí)需求,又能實(shí)現(xiàn)商業(yè)化變現(xiàn)。
教育缺的是辦法
2019年10月,有道在美股上市時(shí),周楓就曾拿用AI技術(shù)批改作文這一場(chǎng)景舉例?!暗?dāng)時(shí)的確效果一般?!敝軛鞲嬖V《中國(guó)企業(yè)家》。
2023年,借助AI大模型,有道再次推出AI作文指導(dǎo),目前已經(jīng)批改了幾十萬(wàn)篇作文。周楓發(fā)現(xiàn)用戶(hù)需求沒(méi)變,但當(dāng)需求能被很好地解決的時(shí)候,產(chǎn)品使用量或者活躍度就會(huì)快速上升,滿(mǎn)意度也明顯提升。
2023年一年,周楓深刻地意識(shí)到,其實(shí)教育從來(lái)都不缺用戶(hù)需求,缺的都是辦法。除了AI作文批改被使用頻次變高之外,他發(fā)現(xiàn)有道硬件詞典筆中,以前用戶(hù)都是掃一個(gè)詞,而現(xiàn)在則是掃一行句子,而有道的業(yè)務(wù)正是在這些細(xì)微的變化中被重構(gòu)。
在周楓看來(lái),教育科技是個(gè)巨大的市場(chǎng),很多剛性需求下的細(xì)分場(chǎng)景都是巨大的業(yè)務(wù)盤(pán)。而大模型提供一個(gè)很大的機(jī)會(huì),讓用戶(hù)以相對(duì)廉價(jià)的方式能買(mǎi)到不錯(cuò)的教育服務(wù)。
2022年全國(guó)教育經(jīng)費(fèi)執(zhí)行情況統(tǒng)計(jì)公告顯示:2022年全國(guó)教育經(jīng)費(fèi)總投入為61329.14億元,首次超過(guò)6萬(wàn)億元,比上年增長(zhǎng)5.97%。
除了直接面向C端用戶(hù)外,2023年有道與杭州拱墅區(qū)智慧教育達(dá)成了合作,有道團(tuán)隊(duì)直接把應(yīng)用內(nèi)置到智慧教育系統(tǒng)中,這里的學(xué)生每天在學(xué)校就可以練15分鐘口語(yǔ)。
研發(fā)和推廣大模型應(yīng)用這一年,周楓也總結(jié)了一些經(jīng)驗(yàn):
第一,即便大模型已經(jīng)在媒體上變成一個(gè)熱詞,但其實(shí)大部分中國(guó)人還沒(méi)有用過(guò)大模型產(chǎn)品,所以當(dāng)開(kāi)發(fā)者產(chǎn)品做得非常精致,完成度非常高時(shí),用戶(hù)的接受度也非常高。
第二,英語(yǔ)口語(yǔ)類(lèi)產(chǎn)品,虛擬人非常有用。在此之前,有道曾開(kāi)發(fā)出一版無(wú)虛擬人的口語(yǔ)教練產(chǎn)品,但發(fā)現(xiàn)效果一般,最終有道決定聯(lián)合網(wǎng)易游戲團(tuán)隊(duì)在產(chǎn)品中加入虛擬人形象。
第三,交互式的追問(wèn),以及基于語(yǔ)音和聊天的學(xué)習(xí)產(chǎn)品形態(tài),用戶(hù)非常需要,他們天然就喜歡這樣的產(chǎn)品形式。
大模型是個(gè)10年的事兒
除了是一名教育科技創(chuàng)業(yè)者外,周楓還是兩個(gè)孩子的父親。在ChatGPT和大模型火了之后,他現(xiàn)在逢家長(zhǎng)就問(wèn),你孩子學(xué)編程沒(méi)有,學(xué)計(jì)算機(jī)沒(méi)有?
在周楓看來(lái),如果小學(xué)二三四年級(jí)的學(xué)生,逐漸開(kāi)始能接受計(jì)算機(jī)時(shí),真的應(yīng)該去體驗(yàn)一下編程?!斑^(guò)去50年,社會(huì)所有行業(yè)中間給人類(lèi)社會(huì)發(fā)展帶來(lái)最大震撼的,基本就是信息產(chǎn)業(yè),它不斷帶來(lái)驚喜,每10年都有一個(gè)巨大變化。”周楓表示。
與此同時(shí),他也開(kāi)始培養(yǎng)孩子的創(chuàng)造力和提問(wèn)的軟能力,他認(rèn)為在未來(lái)這對(duì)每個(gè)孩子來(lái)說(shuō)都是越來(lái)越重要的。他也正逐漸將這樣的育兒觀念帶入到有道的產(chǎn)品中,比如堅(jiān)決杜絕孩子們用AI工具作為抄作業(yè)的手段,保護(hù)孩子自主學(xué)習(xí)的精神。
在周楓看來(lái),大模型是個(gè)長(zhǎng)達(dá)10年的事兒,就像移動(dòng)互聯(lián)網(wǎng)是10年的事兒一樣?!半m然2007年就已經(jīng)出現(xiàn)iPhone,但直到2016年才出現(xiàn)抖音?!敝軛鲝?qiáng)調(diào)。
他認(rèn)為,2024年大模型相關(guān)領(lǐng)域?qū)?huì)有三大機(jī)會(huì)點(diǎn):第一,超大模型肯定會(huì)成為一個(gè)國(guó)內(nèi)大模型廠商爭(zhēng)奪的焦點(diǎn);第二,國(guó)內(nèi)將會(huì)涌現(xiàn)一大批大模型原生應(yīng)用;第三,端側(cè)將會(huì)得到廣泛應(yīng)用。
相關(guān)稿件