九九九中文无码A∨|亚洲国产成人最新精品|国产AV无码精品色午夜|国产精品久久久久三级无码|日韩欧美一区国产二区在线|欧美另类精品一区二区三区|精品一区二区三区毛片视频网|中文字幕日韩精品一区二区三区

中國企業(yè)報(bào)集團(tuán)主管主辦

中國企業(yè)信息交流平臺(tái)

微博 微信

小米大模型:不搞軍備競賽

2023-11-09 14:50 來源:《中國企業(yè)家》雜志 次閱讀
 
小米大模型:不搞軍備競賽

輕量級(jí)的模型亦有其存在的市場(chǎng)空間。

  文|《中國企業(yè)家》記者 趙東山

  2022年11月底,基于GPT-3.5的ChatGPT剛出來的時(shí)候,小米集團(tuán)AI實(shí)驗(yàn)室主任、自然語言處理(NLP)首席科學(xué)家王斌給ChatGPT拋出一個(gè)問題:證明一下勾股定理。

  最終,ChatGPT給出了一個(gè)基于數(shù)學(xué)歸納法的證明過程。王斌發(fā)現(xiàn),雖然這個(gè)證明過程是錯(cuò)誤的,但是整個(gè)證明的邏輯看上去似乎非常合理。后來才意識(shí)到這是大模型的“幻覺”現(xiàn)象,但從某個(gè)角度上看ChatGPT的這個(gè)證明思路非常新奇。

  不斷使用后,ChatGPT的強(qiáng)大能力和奇思妙想超乎王斌的想象。身為一名AI從業(yè)者,他感到一個(gè)新的智能時(shí)代即將來臨,而自己無法再置身事外。2023年4月,由王斌牽頭負(fù)責(zé),小米技術(shù)委員會(huì)AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人欒劍帶隊(duì),在小米內(nèi)部正式成立了一支自研大模型團(tuán)隊(duì)。而在這之前的數(shù)月,小米就開始做自研的相關(guān)準(zhǔn)備工作。

  小米集團(tuán)創(chuàng)始人、董事長兼CEO雷軍親自推動(dòng)了自研大模型團(tuán)隊(duì)的建立,并全程高度參與了小米大模型的自研,他會(huì)親自查看團(tuán)隊(duì)的周報(bào)、月報(bào)甚至日?qǐng)?bào),關(guān)注大模型進(jìn)展。至于投入,雷軍也表示:“全力支持,投入不設(shè)上限。”

  經(jīng)過半年多時(shí)間的努力,小米目前已訓(xùn)練出13億和60億參數(shù)規(guī)模的語言大模型,并在集團(tuán)內(nèi)開源賦能各業(yè)務(wù)。它們?cè)谛∶着炫萇S系統(tǒng)和人工智能助手小愛同學(xué)的部分場(chǎng)景已經(jīng)得到應(yīng)用,更大參數(shù)規(guī)模的大模型也在緊鑼密鼓地開發(fā)中。

  不同于百度的文心一言、科大訊飛星火等通用大模型,小米自研大模型更強(qiáng)調(diào)跟產(chǎn)品的結(jié)合和場(chǎng)景的驅(qū)動(dòng)。

  “我們不會(huì)純從技術(shù)角度考慮,也不會(huì)以比賽為目標(biāo)。我們不搞軍備競賽,我們做大模型的出發(fā)點(diǎn)并不是成為中國的OpenAI。我們一開始就考慮大模型跟公司的場(chǎng)景怎么結(jié)合。”王斌告訴《中國企業(yè)家》。

  小米內(nèi)部認(rèn)為,輕量級(jí)模型亦有其存在的市場(chǎng)空間,且在某些特定任務(wù)上相比千億大模型亦能具備一定的優(yōu)勢(shì)。這是端側(cè)大模型的特殊要求,也是一家智能設(shè)備廠商入局大模型的必經(jīng)之路。

  與市面上大多數(shù)自研大模型的公司一樣,小米同樣選擇了從小參數(shù)到大參數(shù)的漸進(jìn)式開發(fā)過程。通過小參數(shù)模型摸清底層的邏輯,蹚好路上要經(jīng)歷的坑,再加大投入追求更大參數(shù)模型的訓(xùn)練。

  小米為什么要自研大模型?小米如何自研大模型的?又如何將大模型放到智能手機(jī)等設(shè)備里?小米用大模型來做什么?大模型對(duì)小米全球6億多MIUI月活用戶來說意味著什么?跟未來的人車家全生態(tài)又有哪些關(guān)聯(lián)?近日,王斌接受了《中國企業(yè)家》的專訪,對(duì)此進(jìn)行了一一解答。

  以下為小米集團(tuán)AI實(shí)驗(yàn)室主任、自然語言處理(NLP)首席科學(xué)家王斌自述(在不改變?cè)庀伦隽藙h減):

  態(tài)度:不搞軍備競賽

  基于GPT-3.5的ChatGPT是2022年11月30日發(fā)布的,其實(shí)第二天小米內(nèi)部就有好多人注冊(cè)了賬號(hào)在用,我們當(dāng)時(shí)就覺得這肯定是一個(gè)跨時(shí)代的事件,做過多年AI的我們都深刻感受到,ChatGPT的很多結(jié)果超出了我們的預(yù)期。

  在用的過程中我們也不斷總結(jié)。后來我們覺得這不只是做AI的人關(guān)注的事情,可能對(duì)所有的行業(yè)、部門都會(huì)產(chǎn)生影響。大模型一定是未來的趨勢(shì),它會(huì)極大地改變我們的產(chǎn)品和業(yè)務(wù)。

  當(dāng)時(shí)我們就做了一些內(nèi)部布道的工作,向全公司發(fā)起推廣,在總經(jīng)理例會(huì)上以及各種場(chǎng)合去宣傳,呼吁大家都要用大模型,甚至在公司內(nèi)部也建立了大模型的機(jī)器人,把ChatGPT接過來,我們?cè)诠緝?nèi)部還整理了很多文檔,指導(dǎo)大家怎么使用。

  我們內(nèi)部還成立了一個(gè)討論組,共享一些使用經(jīng)驗(yàn),猜一猜這個(gè)技術(shù)可能在哪個(gè)地方帶來顛覆。但當(dāng)時(shí)還僅限于一個(gè)技術(shù)層面的探討,剛開始還沒有決定要做。等到春節(jié)左右,有人覺得至少要?jiǎng)邮秩プ隽?#xff0c;這個(gè)風(fēng)暴來了,我們做技術(shù)的肯定不能置身事外,如果不入局就會(huì)在競爭當(dāng)中處于不利的位置,于是我們也開始做一些準(zhǔn)備工作。

  等當(dāng)面跟雷總(雷軍)匯報(bào)時(shí),他馬上拍板說,“你們趕緊做。”所以,我們大模型團(tuán)隊(duì)成立正式官宣是4月份,但實(shí)際上早就已經(jīng)開始籌備了,隨后我們就全力擁抱深入其中去做相關(guān)的研發(fā)。

  當(dāng)真正決定自研的時(shí)候,我們是從這幾個(gè)方面考慮的。

  第一,小米是一個(gè)應(yīng)用場(chǎng)景非常多的公司,在這些場(chǎng)景里怎么通過大模型,提高產(chǎn)品體驗(yàn),提高公司內(nèi)部的運(yùn)營效率,完善從感知到認(rèn)知再到?jīng)Q策的智能體驗(yàn),是我們考慮的事情。小米跟做通用大模型的公司定位不太一樣,他們是做完給別人用,但我們更多要考慮小米的場(chǎng)景。從小愛同學(xué)到未來的汽車再到操作系統(tǒng)和機(jī)器人,都是能和大模型結(jié)合的重要場(chǎng)景。

  第二,正是因?yàn)樾∶子袌?chǎng)景的驅(qū)動(dòng),所以我們?cè)谧龃竽P偷臅r(shí)候不會(huì)純技術(shù)考量,也不是要去比賽,或做個(gè)中國的OpenAI,我們不搞軍備競賽,這不是我們做大模型的出發(fā)點(diǎn),我們一開始就得考慮大模型跟公司的場(chǎng)景怎么結(jié)合。

  第三,小米是一家技術(shù)立業(yè)的公司,公司的技術(shù)研發(fā)投入很大,有很多自己的技術(shù)創(chuàng)新,同時(shí)也對(duì)業(yè)界出現(xiàn)的新技術(shù)保持高度敏感。對(duì)于有希望的新技術(shù),你至少要跟上,再想辦法和場(chǎng)景高度融合,做出自己的優(yōu)勢(shì)和特色。

  雷總對(duì)大模型業(yè)務(wù)參與非常多,我們團(tuán)隊(duì)有幾個(gè)專門討論大模型的群聊,雷總就在群里。有信息及時(shí)在群里共享,有問題直接在群里解釋匯報(bào)。我們的周報(bào)、月報(bào)甚至日?qǐng)?bào)他也會(huì)直接看。他對(duì)技術(shù)的敏感度非常高,也非??春么竽P?#xff0c;所以他時(shí)刻都在關(guān)注我們的進(jìn)展,這也使我們有些壓力。但關(guān)于投入,雷總大力支持,不設(shè)上限。

  落地:從小到大逐步迭代

  確定好自己的定位,我們的路線比較清楚:一邊研發(fā)探索,一邊結(jié)合小米的場(chǎng)景。我們確信,不是要用一個(gè)大模型覆蓋所有業(yè)務(wù)場(chǎng)景,所以跟業(yè)內(nèi)很多公司一樣,我們采取了從小到大漸進(jìn)式開發(fā)的過程。

  我們的第一個(gè)模型是13億的小規(guī)模模型。一開始選擇參數(shù)規(guī)模比較小的模型,是因?yàn)橄氡苊獯蟮姆稿e(cuò),因?yàn)樵酱竽P偷挠?xùn)練,其成本也越高。我們選擇先用小規(guī)模模型做一些蹚坑的工作,把其中經(jīng)歷的一些問題都解決了,再做大參數(shù)規(guī)模的模型。其實(shí)訓(xùn)練更大的模型通常都會(huì)遇到一些新的問題,但是至少一些老的問題能夠先解決,這是一個(gè)比較務(wù)實(shí)的做法。

  自研大模型首要的挑戰(zhàn),就是如何快速找到對(duì)的人,又組合成緊密的團(tuán)隊(duì),大家分工明確地共同為一個(gè)目標(biāo)努力。

  小米對(duì)人工智能的投入比較早,在2016年AlphaGo出來之后,雷總就開始大力投入AI,最開始是視覺團(tuán)隊(duì),后來逐漸拓展到AI的各個(gè)領(lǐng)域。整個(gè)公司我們有3000多人在做AI相關(guān)的研發(fā)工作,我們團(tuán)隊(duì)也有非常豐富的AI工程化經(jīng)驗(yàn)。

  我們AI實(shí)驗(yàn)室之前有一個(gè)人機(jī)對(duì)話團(tuán)隊(duì),做過28億的對(duì)話模型,雖然它是只用于對(duì)話的專用模型,但內(nèi)部測(cè)試的效果非常不錯(cuò)。另外,我們還有非常專業(yè)的數(shù)據(jù)處理團(tuán)隊(duì)和AI訓(xùn)練優(yōu)化團(tuán)隊(duì)。我們就直接把這些有基礎(chǔ)的人,抽調(diào)過來直接組成了一支新的團(tuán)隊(duì),直接上手就開始做自研大模型了。

  小米AI實(shí)驗(yàn)室在視覺、聲學(xué)語音、NLP、知識(shí)圖譜、機(jī)器學(xué)習(xí)等方向,都有技術(shù)積累,從算法預(yù)研到工程落地具備很強(qiáng)的閉環(huán)能力。比如,手機(jī)、汽車、音箱、可穿戴等很多智能硬件上的很多AI算法,我們從頭到尾都做過,所以這支抽調(diào)而成的團(tuán)隊(duì)同時(shí)具備算法、數(shù)據(jù)、工程、產(chǎn)品、測(cè)試等大模型建設(shè)需要的能力,冷啟動(dòng)時(shí)間非常短,很快就能進(jìn)入快車道。

  具體地,我們?cè)诮M建隊(duì)伍的時(shí)候,NLP團(tuán)隊(duì)是最直接相關(guān)的,原來的對(duì)話大模型也出自該團(tuán)隊(duì)。我們還把知識(shí)圖譜構(gòu)建的團(tuán)隊(duì)抽調(diào)一部分過來完成大模型的數(shù)據(jù)工作,他們對(duì)數(shù)據(jù)的敏感性,對(duì)數(shù)據(jù)的理解,對(duì)數(shù)據(jù)的工具和算法的掌握,都非常強(qiáng);大模型的工程組,我們是從機(jī)器學(xué)習(xí)的架構(gòu)團(tuán)隊(duì)調(diào)過來的,此前他們專門做系統(tǒng)優(yōu)化的工作,比如怎么有效調(diào)用GPU,怎么去做分布式機(jī)器學(xué)習(xí)訓(xùn)練,經(jīng)驗(yàn)都非常豐富。

  13億的模型訓(xùn)練完了之后,我們會(huì)跟開源開放的模型做一些對(duì)比,雖然跟千億的模型相比還是有各方面的差距,但是經(jīng)過微調(diào)后在某些任務(wù)上還是有一些優(yōu)勢(shì)的。我也多次表達(dá)過13億的模型有它自己的生存的空間,我們更關(guān)注和場(chǎng)景的適配。目前這個(gè)模型已經(jīng)在小愛同學(xué)中上線了。實(shí)際的數(shù)據(jù)表明,在特定場(chǎng)景下,13億的模型不僅效率上優(yōu)于更大的模型,效果上也毫不遜色。

  截至目前,小米已經(jīng)有13億、60億兩個(gè)參數(shù)規(guī)模的大模型在集團(tuán)內(nèi)開源。這幾個(gè)模型隨著輸入數(shù)據(jù)的不斷更新,也都在不斷迭代。我們還有更大的模型正在緊鑼密鼓地開發(fā)中,希望能給用戶帶來更好的體驗(yàn)。

  挑戰(zhàn):如何把大模型放到設(shè)備里?

  小米的設(shè)備非常多,我們希望把很多功能能做到汽車、手機(jī)、智能音箱或其他設(shè)備上??偠灾?#xff0c;我們一直以來都有強(qiáng)烈的端側(cè)需求,大模型來了也不例外。當(dāng)然,把大模型做到端側(cè)挑戰(zhàn)還是非常大的。

  第一,這里似乎有個(gè)悖論。模型太大了端側(cè)根本就放不進(jìn)去跑不起來,但是模型太小了可能效果又不行。這就很考驗(yàn)團(tuán)隊(duì)對(duì)模型的理解,包括怎么對(duì)大模型做量化、蒸餾、壓縮,還要保證模型的效果,還要滿足硬件的各種約束,甚至包括硬件產(chǎn)品的理解,都要求有很強(qiáng)的認(rèn)知能力。

  第二,對(duì)于硬件端包括芯片端,也提出新的要求和挑戰(zhàn)。一方面,現(xiàn)有的硬件框架下可能對(duì)大模型的支持并不完善。另一方面,需求的驅(qū)動(dòng)要求我們?cè)诂F(xiàn)有條件下就要將大模型在端側(cè)跑通。這里面的挑戰(zhàn)非常大,需要一個(gè)綜合的解決方案。

  端側(cè)大模型確實(shí)有不少好處。一個(gè)最顯而易見的好處是可以充分保護(hù)用戶的隱私,用戶和大模型的交互數(shù)據(jù)不會(huì)上傳。再比如說,一種最極端的情況就是在沒有網(wǎng)絡(luò)的情況下,端側(cè)大模型帶來的用戶體驗(yàn)差異會(huì)非常明顯,云上的大模型沒網(wǎng)是無法工作的,但端側(cè)就可以。與此同時(shí),一部分應(yīng)用如果通過云側(cè)要傳輸?shù)臄?shù)據(jù)量比較大,在實(shí)時(shí)性上可能就不如在端側(cè)強(qiáng),端側(cè)響應(yīng)可能會(huì)更及時(shí)。此外,如果云側(cè)的需求量特別大之后,要維持成本肯定需要用戶付費(fèi),這也是很常見的商業(yè)模式。但是如果集成到端上,用戶的成本可能就沒有那么高,用戶也就更愿意用。

  雖然大模型端側(cè)落地的挑戰(zhàn)很大,但是好在我們?cè)诙藗?cè)落地方面有長時(shí)間的積累。比如我們視覺團(tuán)隊(duì)做過很多手機(jī)拍照的算法,都是要求在端側(cè)實(shí)現(xiàn)的。手機(jī)拍照現(xiàn)在分辨率越來越高,要對(duì)圖像進(jìn)行處理,處理效率要高,用戶感覺不到卡頓,而且還不能發(fā)熱,這些都是一系列的嚴(yán)格條件,我們有長期的技術(shù)落地經(jīng)驗(yàn)。

  此外,在語音和語言處理上,小米也有一些端側(cè)的經(jīng)驗(yàn),比如原來在比較小的設(shè)備上實(shí)現(xiàn)了全離線的機(jī)器翻譯,參數(shù)也達(dá)到億級(jí)了,后來離線的機(jī)器翻譯模型也被放到小米旗艦機(jī)上。

  目前,小米和芯片公司也在合作,共同推動(dòng)端側(cè)大模型的落地。

  未來:多模態(tài)

  經(jīng)歷過語言大模型的開發(fā),我們其實(shí)已經(jīng)把底層的坑都蹚過了,我們有能力去做更大參數(shù)的模型,但具體要不要做千億或者萬億的大模型,更多還是從投入產(chǎn)出比的角度去考慮,也看跟場(chǎng)景的結(jié)合還有沒有需求,如果我們已經(jīng)把很多場(chǎng)景處理得非常好,我們就不需要投更大的成本去做,我們不以軍備競賽為目標(biāo),這個(gè)不是我們的目標(biāo)。

  人車家全生態(tài)是小米全新升級(jí)的未來戰(zhàn)略,未來的智能生活中包含很多的場(chǎng)景,大模型可能越來越會(huì)成為一個(gè)基礎(chǔ)設(shè)施的東西,來支撐上面的智能服務(wù)。大模型對(duì)上下文的理解,對(duì)情景的理解都更深了,不管它在手機(jī)上還是其他設(shè)備上,都能夠隨時(shí)隨地了解你所在的場(chǎng)景,給用戶提供下一步的可能性。

  小米的優(yōu)勢(shì)是多設(shè)備場(chǎng)景的綜合感知,因此小米大模型輸入的不只是文字,而是它感知到的環(huán)境和場(chǎng)景。我相信未來的多模態(tài)大模型肯定不只是視覺的,聲音的,還會(huì)有其他模態(tài),這也正好符合小米人車家萬物互聯(lián)的場(chǎng)景,我們輸入了更多的信息,也會(huì)幫用戶更好地理解這個(gè)環(huán)境,做后面的事情,比如對(duì)機(jī)器人的控制,對(duì)車的控制,甚至是分布式聯(lián)動(dòng),去滿足用戶的想象。

  大模型也成為一個(gè)數(shù)據(jù)接收中心,它接收的信息遠(yuǎn)比現(xiàn)有的學(xué)術(shù)界的研究還要多,當(dāng)然這個(gè)信息融合還有難度,但是小米可以在各種設(shè)備去輸出,它們之間都是相通的。小米澎湃OS已經(jīng)把互聯(lián)互通做好了,我們能夠借用多種設(shè)備的聯(lián)動(dòng),協(xié)同感知,協(xié)同決策,做一些更有意思的事情,幫用戶生活體驗(yàn)更好,更方便。

  大模型火了,安全隱私問題也成為大家關(guān)注的話題。小米剛成立不久,就成立了安全隱私委員會(huì),因?yàn)樾∶资且粋€(gè)手機(jī)設(shè)備廠商,對(duì)安全隱私非常關(guān)注,小米所有的項(xiàng)目都要經(jīng)過隱私委員會(huì)的審批才能夠立項(xiàng),在訓(xùn)練和應(yīng)用大模型的過程中,我們會(huì)嚴(yán)格按照安全隱私保護(hù)的相關(guān)法律法規(guī)來進(jìn)行處理。

  關(guān)于未來,小米內(nèi)部相信大模型肯定會(huì)不斷向前發(fā)展,在多模態(tài)模型還沒有出來之前,我們就立項(xiàng)了多模態(tài)大模型,在今年年初還通過北京市自然科學(xué)基金-小米創(chuàng)新聯(lián)合基金設(shè)立了《面向圖文理解和生成的多模態(tài)大模型構(gòu)建與評(píng)價(jià)》的課題,我們相信這一定是未來重要的發(fā)展方向。

  當(dāng)然,基于大模型,目前還沒有出現(xiàn)殺手級(jí)的應(yīng)用,這需要一個(gè)嘗試、探索的過程,接下來一定會(huì)出現(xiàn)一系列的應(yīng)用讓大模型落地。此外,端云結(jié)合的框架也一定是未來的趨勢(shì)。小米愿意置身其中,并積極探索。

點(diǎn)贊()
上一條:凡泰極客亮相香港金融科技周,投身大灣區(qū)數(shù)字化建設(shè)2023-11-09
下一條:天影視通集團(tuán)子公司東莞天影開業(yè),打造全國工廠戰(zhàn)略布局新篇章!2023-11-09

相關(guān)稿件

大模型,冷靜! 2023-07-25
大廠競逐AI大模型 虛火過旺還是星辰大海? 2023-04-14
國內(nèi)企業(yè)競速“垂直大模型”新賽道 2023-07-27
京東集團(tuán)CEO許冉:大模型在京東內(nèi)部已經(jīng)取得明確的實(shí)踐效果 2023-07-13
AI大模型助力金融高質(zhì)量發(fā)展!馬上消費(fèi)“天鏡大模型”問世 2023-08-30
國務(wù)院國有資產(chǎn)管理委員會(huì) 中國企業(yè)聯(lián)合會(huì) 中國企業(yè)報(bào) 中國社會(huì)經(jīng)濟(jì)網(wǎng) 中國國際電子商務(wù)網(wǎng) 新浪財(cái)經(jīng) 鳳凰財(cái)經(jīng) 中國報(bào)告基地 企業(yè)社會(huì)責(zé)任中國網(wǎng) 杭州網(wǎng) 中國產(chǎn)經(jīng)新聞網(wǎng) 環(huán)球企業(yè)家 華北新聞網(wǎng) 和諧中國網(wǎng) 天機(jī)網(wǎng) 中貿(mào)網(wǎng) 湖南經(jīng)濟(jì)新聞網(wǎng) 翼牛網(wǎng) 東莞二手房 中國經(jīng)濟(jì)網(wǎng) 中國企業(yè)網(wǎng)黃金展位頻道 硅谷網(wǎng) 東方經(jīng)濟(jì)網(wǎng) 華訊財(cái)經(jīng) 網(wǎng)站目錄 全景網(wǎng) 中南網(wǎng) 美通社 大佳網(wǎng) 火爆網(wǎng) 跨考研招網(wǎng) 當(dāng)代金融家雜志 借貸撮合網(wǎng) 大公財(cái)經(jīng) 誠搜網(wǎng) 中國鋼鐵現(xiàn)貨網(wǎng) 證券之星 融易在線 2014世界杯 中華魂網(wǎng) 納稅人俱樂部 慧業(yè)網(wǎng) 商界網(wǎng) 品牌家 中國國資報(bào)道 金融界 中國農(nóng)業(yè)新聞網(wǎng) 中國招商聯(lián)盟 和訊股票 經(jīng)濟(jì)網(wǎng) 中國數(shù)據(jù)分析行業(yè)網(wǎng) 中國報(bào)道網(wǎng) 九州新聞網(wǎng) 投資界 北京科技創(chuàng)新企業(yè)誠信聯(lián)盟網(wǎng) 中國白銀網(wǎng) 炣燃科技 中企媒資網(wǎng) 中國石油化工集團(tuán) 中國保利集團(tuán)公司 東風(fēng)汽車公司 中國化工集團(tuán)公司 中國電信集團(tuán)公司 華為技術(shù)有限公司 廈門銀鷺食品有限公司 中國恒天集團(tuán)有限公司 濱州東方地毯集團(tuán)有限公司 大唐電信科技股份有限公司 中國誠通控股集團(tuán)有限公司 喜來健醫(yī)療器械有限公司 中國能源建設(shè)股份有限公司 內(nèi)蒙古伊利實(shí)業(yè)集團(tuán)股份有限公司 中國移動(dòng)通信集團(tuán)公司 中國化工集團(tuán)公司 貴州茅臺(tái)酒股份有限公司