人形機(jī)器人打開“具身智能”藍(lán)圖: 2024-06-13 13:35 來源：經(jīng)濟(jì)參考報(bào) 次閱讀; 分享：

從搬運(yùn)重物到端茶倒水，從進(jìn)廠打工到做飯疊衣……當(dāng)大模型為機(jī)器人注入“靈魂”，人形機(jī)器人“進(jìn)化”加速。業(yè)內(nèi)人士指出，人形機(jī)器人工業(yè)場景的落地最快今年或明年就能在部分試點(diǎn)實(shí)現(xiàn)，“入戶”則將在10年左右。

　　變化——邁入“人形時(shí)代”

　　近期，國產(chǎn)人形機(jī)器人領(lǐng)域動(dòng)作頻頻：全球首例純電驅(qū)全尺寸人形機(jī)器人“天工”首次在北京人形機(jī)器人創(chuàng)新中心實(shí)現(xiàn)“擬人奔跑”、瞄準(zhǔn)老年人陪護(hù)市場的人形機(jī)器人Unitree G1問世、工業(yè)版人形機(jī)器人Walker S進(jìn)入蔚來總裝車間“實(shí)訓(xùn)”當(dāng)起“見習(xí)廠工”……

　　不止中國，站上風(fēng)口的人形機(jī)器人，正在席卷全球一二級市場。從創(chuàng)業(yè)公司到科技巨頭，從軟件平臺到硬件開發(fā)，都在競相入場。當(dāng)英偉達(dá)、特斯拉、微軟紛紛以實(shí)際行動(dòng)表示“看漲”后，高盛重新調(diào)整了對2035年人形機(jī)器人全球市場規(guī)模的預(yù)期：從60億美元上調(diào)至380億美元。

　　“一條千億元規(guī)模的賽道，三個(gè)因素缺一不可：市場需求的驅(qū)動(dòng)、產(chǎn)業(yè)鏈條的完備、核心技術(shù)的突破?！眱?yōu)必選副總裁、研究院執(zhí)行院長焦繼超說，“機(jī)器人+大模型”落地提速的今天，技術(shù)、資本、市場實(shí)現(xiàn)具身智能的熱情，掀起廣闊的想象空間。

　　老齡化社會(huì)、少子化社會(huì)的疊加，以及勞動(dòng)力的相對短缺，激發(fā)了社會(huì)對人形機(jī)器人的切實(shí)需求?！爸圃鞓I(yè)（如汽車組裝、零部件排序）及特殊作業(yè)（如高空作業(yè)、危險(xiǎn)任務(wù)）方面，人形機(jī)器人能完成高風(fēng)險(xiǎn)、重復(fù)性的臟活、苦活、累活，降低相關(guān)崗位的傷病率、死亡率，提升職業(yè)滿意度，因此市場對人形機(jī)器人的到來充滿期待?！北本┐髮W(xué)計(jì)算機(jī)學(xué)院博士生導(dǎo)師、北大-銀河通用具身智能聯(lián)合實(shí)驗(yàn)室主任王鶴說。

　　記者來到北京人形機(jī)器人創(chuàng)新中心，迎面遇見一位身材頎長的機(jī)器人正在爬樓梯。這個(gè)名為“天工”的人形機(jī)器人不僅擁有聰明的腦、靈巧的手，絲滑的動(dòng)作間還透著些許“柔美”，就連外形都與人類貼近：身高1.63米、體重43公斤。當(dāng)工程師向“她”發(fā)出指令，只見“天工”上半身略向前傾，手臂配合腿部移動(dòng)加大擺動(dòng)，竟邁開小步跑了起來。

　　深耕機(jī)器人20余年的北京人形機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍相信，通用機(jī)器人的未來形態(tài)一定是“人形”。

　　過去傳統(tǒng)的僅從事單一操作的專用機(jī)器人，如焊接機(jī)器人、打磨機(jī)器人，本質(zhì)上是一個(gè)自動(dòng)化設(shè)備，僅需執(zhí)行人提前寫好的固定程序，因此形態(tài)上只需要一條腿或一只臂。

　　“而大模型為機(jī)器人注入‘靈魂’后，機(jī)器人獲得了前所未有的感知、理解、推理、決策能力，能完成復(fù)雜環(huán)境的多元任務(wù)。一方面，人類社會(huì)的基礎(chǔ)設(shè)施、場景構(gòu)建、工具設(shè)計(jì)，均是基于人類的物理特性進(jìn)行開發(fā)，‘人形’可降低適配成本、快速適應(yīng)環(huán)境；另一方面，未來通用機(jī)器人的終極目標(biāo)是走入人類生活、服務(wù)人類，‘人形’是與人交互最自然、體驗(yàn)最優(yōu)的形態(tài)?！毙苡衍娬f。

　　進(jìn)化——實(shí)現(xiàn)“知行合一”

　　這屆“人形機(jī)器人”妙在何處？

　　相較于過去一只機(jī)械臂，已“實(shí)訓(xùn)”下車間的國產(chǎn)人形機(jī)器人Walker S用絲滑行動(dòng)給出答案：“她”的一雙敏捷手對準(zhǔn)車頭精準(zhǔn)貼上車標(biāo)，一雙靈巧腳帶動(dòng)軀干協(xié)調(diào)地自動(dòng)走位到每個(gè)座椅進(jìn)行安全帶的拉伸檢測，一雙“慧眼”還能對準(zhǔn)車門、車身表面進(jìn)行缺陷檢測。

　　“這屆人形機(jī)器人的飛躍性突破是‘知行合一’。表現(xiàn)為‘聰明腦’指揮‘敏捷手’‘靈巧腳’，使機(jī)器人行動(dòng)起來更加自主、靈活，且能在學(xué)習(xí)中不斷進(jìn)化。”科大訊飛機(jī)器人首席科學(xué)家季超說。

　　何來“聰明腦”“敏捷手”“靈巧腳”？

　　“一方面，大模型的迭代使‘大腦’更加聰明；另一方面，人形機(jī)器人軟硬件能力的提升，使運(yùn)動(dòng)更加靈活。兩股力量牽引人形機(jī)器人的進(jìn)化。”季超說。

　　看上去，大模型有了“身體”，機(jī)器人也有了“大腦”。往里看，其實(shí)是大模型的感知推理能力，融入了機(jī)器人的具身能力。

　　這些類人的能力又是如何實(shí)現(xiàn)的？

　　“源自三個(gè)部分：感知、規(guī)劃、執(zhí)行?！蓖斛Q說，從技術(shù)實(shí)現(xiàn)角度，如果拿人來類比，不僅需要人類智慧的核心大腦，也關(guān)系到負(fù)責(zé)運(yùn)動(dòng)控制的小腦。

　　人形機(jī)器人的“大腦”負(fù)責(zé)感知、理解、規(guī)劃?！爱?dāng)我們對機(jī)器人說‘我渴了’，機(jī)器人首先會(huì)理解并拆解意圖，然后分步驟進(jìn)行規(guī)劃設(shè)計(jì)：比如，第一步尋找水在哪里，第二步思考如何打開冰箱門、從冰箱中取出水、關(guān)上冰箱門，第三步遞送到我們面前。這每一步，包括理解語義、任務(wù)規(guī)劃，都在‘大腦’中進(jìn)行?！蓖斛Q舉例說。

　　人形機(jī)器人“小腦”的使命則是運(yùn)動(dòng)控制、任務(wù)執(zhí)行。王鶴進(jìn)一步解釋，“例如，如何找到冰箱位置、避開路障走過去，用多大的力去伸手拉門、冰箱門開到多大，以及行走的每一步如何調(diào)動(dòng)四肢與軀干、實(shí)現(xiàn)手眼腳協(xié)調(diào)運(yùn)動(dòng)，‘小腦’實(shí)現(xiàn)的任務(wù)是當(dāng)前研發(fā)的難點(diǎn)。”

　　“技術(shù)路線上，今天的人形機(jī)器人已經(jīng)越來越接近人類思考、決策、執(zhí)行的過程?！毙苡衍娬f，過去的認(rèn)知是通過語音交互、視覺識別，以自然語言理解的方式或傳統(tǒng)的人工智能方式實(shí)現(xiàn)，現(xiàn)在則使用VLA（視覺語言動(dòng)作）這樣的多模態(tài)大模型來完成“大腦”功能。過去的運(yùn)動(dòng)控制是通過模型優(yōu)化的方式，而現(xiàn)在人形機(jī)器人的跑、跳則更多是基于強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)來實(shí)現(xiàn)“小腦”與“軀干”的功能。

　　大模型的迭代為機(jī)器人帶來的革命性變化在于，它不僅應(yīng)用于“大腦”的理解、推理、規(guī)劃之中，也將融入到“小腦”“軀干”參與的感知與執(zhí)行過程。

　　人形機(jī)器人擁有更加強(qiáng)大的泛化能力后，將更好地與物理世界交互，進(jìn)一步降低部署成本、應(yīng)用門檻，這也是具身智能前進(jìn)的方向?！熬呱碇悄軓?qiáng)調(diào)智能體與物理世界的交互與反饋，服務(wù)于現(xiàn)實(shí)場景，解決人類的實(shí)際訴求?！苯估^超說。

　　演化——“入戶”十年可期

　　人形機(jī)器人以“洪荒之力”模仿并復(fù)刻人類智能，但它終究不是人類。

　　莫拉維克悖論指出，人類獨(dú)有的高階智慧對機(jī)器而言只需要極少的運(yùn)算，如推理，而人類無意識的技能與直覺卻需要機(jī)器耗費(fèi)極大的運(yùn)算能力，如接住拋物。

　　“眼下，人形機(jī)器人的能力瓶頸并非在于‘大腦’的感知、理解、判斷，而恰恰是缺乏類似人類‘小腦’的泛化執(zhí)行能力?！蓖斛Q說，這一瓶頸導(dǎo)致的問題就是人形機(jī)器人“干活”不夠快、不夠敏捷。

　　這一瓶頸的根源是高質(zhì)量數(shù)據(jù)的匱乏?！皺C(jī)器人‘大腦’所需數(shù)據(jù)可從互聯(lián)網(wǎng)的文本、圖像中獲得，而‘小腦’所需的數(shù)據(jù)少之又少。有限的來源之一是國外部分企業(yè)采取的人工遙控機(jī)器訓(xùn)練的方式，采集到的數(shù)據(jù)既難、又貴、且慢。”王鶴說。

　　高精度模擬真實(shí)世界的物理場景、于仿真環(huán)境里合成的數(shù)據(jù)不失為一種有效的解決方案。比如，合成靈巧手模擬真實(shí)世界抓取物體進(jìn)行訓(xùn)練采集到的數(shù)據(jù)，然后在真實(shí)環(huán)境里測試、泛化，能破解機(jī)器人“小腦”所需的數(shù)據(jù)“投喂”問題。

　　還有專家指出，實(shí)時(shí)性、推理速度也是當(dāng)前具身智能面臨的另一瓶頸。目前，基于大模型的機(jī)器人控制在線決策至少需50毫秒，一般延遲為1至5秒，無法滿足工業(yè)場景3至10毫秒的需要。

　　“人形機(jī)器人是一塊難啃的硬骨頭，它的突破一定需要時(shí)間的積累和技術(shù)的沉淀。大規(guī)模量產(chǎn)、商業(yè)化也都是挑戰(zhàn)?！倍辔皇茉L者表示，盡管人形機(jī)器人的成長速度肉眼可見，但距離產(chǎn)業(yè)爆發(fā)的“iPhone時(shí)刻”還有距離。

　　“可以確定的是，人形機(jī)器人率先在工業(yè)場景落地，接下來是應(yīng)用于商業(yè)場景，最后是進(jìn)入千家萬戶。其中，工業(yè)場景的落地最快今年或明年就能在部分試點(diǎn)實(shí)現(xiàn)，人形機(jī)器人‘入戶’在10年左右實(shí)現(xiàn)?！毙苡衍娬f。

　　焦繼超給出一組數(shù)據(jù)：目前，中國是全球申請人形機(jī)器人技術(shù)專利最多的國家，共計(jì)6618件?！斑@將為我國人形機(jī)器人產(chǎn)業(yè)穩(wěn)步向好發(fā)展夯實(shí)基礎(chǔ)?！?/p>

　　“什么時(shí)候我們能做到‘類腦模型’，把所有模態(tài)數(shù)據(jù)一股腦放入數(shù)據(jù)集中，還能響應(yīng)足夠敏捷，聽得懂語義、解析得了意圖，也就真正實(shí)現(xiàn)了具身智能，這也是我們將著力解決的問題?！蓖斛Q說。（記者張漫子北京報(bào)道）

點(diǎn)贊()

上一條：AI助力，完全自動(dòng)駕駛還有多遠(yuǎn)2024-06-11

下一條：人形機(jī)器人打開“具身智能”藍(lán)圖2024-06-13

相關(guān)稿件: 上海加快人形機(jī)器人產(chǎn)業(yè)落地 2024-01-16; 人形機(jī)器人何時(shí)走入百姓家？產(chǎn)業(yè)仍需爬坡過坎 2024-04-26; 上市公司積極布局人形機(jī)器人賽道 2024-04-15; 北京經(jīng)開區(qū)加速布局人形機(jī)器人未來產(chǎn)業(yè) 2024-01-15; 北京人形機(jī)器人研發(fā)迎來關(guān)鍵突破 2024-04-28

九九九中文无码A∨|亚洲国产成人最新精品|国产AV无码精品色午夜|国产精品久久久久三级无码|日韩欧美一区国产二区在线|欧美另类精品一区二区三区|精品一区二区三区毛片视频网|中文字幕日韩精品一区二区三区

人形機(jī)器人打開“具身智能”藍(lán)圖