剛剛,一位機(jī)器人戴著畢業(yè)帽走出清華

2023-07-31 12:57:03來(lái)源:引領(lǐng)外匯網(wǎng)

剛剛,一位機(jī)器人戴著畢業(yè)帽走出清華,體重28kg,身高1.2m,加上雙手,

體重28kg,身高1.2m,加上雙手,全身上下34個(gè)自由度

編者按:本文來(lái)自微信公眾號(hào) 量子位(ID:QbitAI),作者:衡宇,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載


(相關(guān)資料圖)

這年頭,人形機(jī)器人都有清華的學(xué)士帽戴!

這位走出清華二校門(mén)的機(jī)器人,簡(jiǎn)直要把門(mén)口參加暑期研習(xí)營(yíng)的小孩們饞哭了。

不僅擁有清華紫學(xué)士帽,在剛剛結(jié)束的WAIC“具身通用人工智能”論壇上,這個(gè)名叫小星的人形機(jī)器人,還和圖靈獎(jiǎng)得主、中國(guó)科學(xué)院院士姚期智合影貼貼。

是誰(shuí)羨慕了?我不說(shuō)。

小星這“人”,出自清華大學(xué)交叉信息研究院(IIIS)陳建宇團(tuán)隊(duì),整機(jī)結(jié)構(gòu)、電機(jī)、減速器、驅(qū)動(dòng)器、步態(tài)算法等機(jī)器人軟硬件將通通自研。

陳建宇,31歲的清華叉院助理教授,28歲時(shí),就已經(jīng)以叉院博導(dǎo)的身份走在從教之路上。

博士畢業(yè)于UC伯克利,本科就讀于清華大學(xué)精密儀器系,研究領(lǐng)域包括機(jī)器人學(xué)、強(qiáng)化學(xué)習(xí)、自動(dòng)駕駛等。

人形機(jī)器人小星

一起來(lái)認(rèn)識(shí)一下,這位青年博導(dǎo)“教”出來(lái)的人形機(jī)器人——

體重28kg,身高1.2m,加上雙手后,全身上下具有34個(gè)自由度。

在行走方面,小星在不同類(lèi)型的地面上都可以穩(wěn)步前進(jìn),比如落滿(mǎn)枯葉的林間小道:

或者是公園花壇旁的水泥上坡路:

腳下的地皮換成草坪,也不妨礙它踏步前進(jìn):

總之就走得還挺穩(wěn)的,速度也還不錯(cuò)。

與此同時(shí),它還能利用雙手提供一些服務(wù)功能,遞個(gè)燒烤、端杯咖啡什么的:

在液壓驅(qū)動(dòng)和電機(jī)驅(qū)動(dòng)二者之間,小星采用了成本優(yōu)勢(shì)更高的后者。

為了研發(fā)高性能、低成本的人形機(jī)器人,團(tuán)隊(duì)堅(jiān)持最新一代的準(zhǔn)直驅(qū)力控方案,用高扭矩密度電機(jī)搭配低減速比減速器,用電流環(huán)直接力控搭配動(dòng)態(tài)雙足行走算法。

這種方案對(duì)電機(jī)扭矩要求極高,因此團(tuán)隊(duì)也一直在探究新的電機(jī)設(shè)計(jì)方案。

目前所研制的電機(jī)扭矩密度已達(dá)到了30Nm/kg,是TQ電機(jī)(目前工業(yè)界最強(qiáng))的兩倍以上。

如此一來(lái),無(wú)論是行走還是擺臂動(dòng)作,小星都能保持在一個(gè)比較靈活的狀態(tài)。

不過(guò),陳建宇也坦然表示,目前小星機(jī)器人硬件上搭載的算法智能性還不夠高,小星的現(xiàn)階段表現(xiàn),還沒(méi)有發(fā)揮硬件可以支持的極限。

因此,團(tuán)隊(duì)的另一項(xiàng)主要工作就是推進(jìn)前沿的機(jī)器人智能算法,目前走的是動(dòng)力學(xué)模型+優(yōu)化控制和物理仿真+強(qiáng)化學(xué)習(xí)這兩條機(jī)器人領(lǐng)域最前沿的路徑。

相比于傳統(tǒng)的機(jī)器人算法,二者都更為通用,并且可以更多地利用動(dòng)力學(xué)來(lái)提高性能。

這兩大方法也是陳建宇博士期間的主攻研究方向。

2017年,陳建宇提出了一系列實(shí)時(shí)軌跡優(yōu)化算法并成功應(yīng)用于無(wú)人車(chē)上。

從2018年起,陳建宇的研究重點(diǎn)轉(zhuǎn)向了更為前瞻的方法——深度強(qiáng)化學(xué)習(xí)算法。在這一階段,他做出了領(lǐng)域內(nèi)較早的幾個(gè)基于自學(xué)習(xí)方法的復(fù)雜道路環(huán)境自動(dòng)駕駛工作。

“從數(shù)學(xué)上來(lái)說(shuō),無(wú)人車(chē)也是一類(lèi)機(jī)器人,我們研究的算法對(duì)于無(wú)人車(chē)和機(jī)器人來(lái)說(shuō)都是通用的。” 陳建宇表示,在無(wú)人車(chē)時(shí)期關(guān)于強(qiáng)化學(xué)習(xí)的經(jīng)驗(yàn),不少都可以遷移到人形機(jī)器人的研究上,“當(dāng)然,無(wú)人車(chē)和人形機(jī)器人的關(guān)注點(diǎn)不全相同,比如無(wú)人車(chē)在底層控制方面相對(duì)簡(jiǎn)單,而對(duì)上層的決策規(guī)劃和交互等關(guān)注較多”。

通過(guò)強(qiáng)化學(xué)習(xí)結(jié)合人體運(yùn)動(dòng)數(shù)據(jù),小星在高精度物理仿真中學(xué)會(huì)了高度擬人的步態(tài)行走:

還能挖掘出硬件的極限性能,達(dá)到4m/s的奔跑速度:

除了靈活的雙腿,小星的雙手也很靈巧。

通過(guò)大規(guī)模并行仿真強(qiáng)化學(xué)習(xí)訓(xùn)練,小星學(xué)會(huì)操控其二十多個(gè)自由度的雙臂靈巧手來(lái)完成各類(lèi)任務(wù)。

此外,為了協(xié)調(diào)小星手腳之間的協(xié)同工作,團(tuán)隊(duì)還提出了一種分布式技能學(xué)習(xí)算法。

“我想,人形機(jī)器人是所有機(jī)器人學(xué)家的夢(mèng)想!”從本科起,陳建宇就開(kāi)始關(guān)注雙足步態(tài)算法,他的本科畢業(yè)設(shè)計(jì),做的就是雙足機(jī)器人落腳點(diǎn)規(guī)劃。

2020年畢業(yè)回國(guó),在探索過(guò)無(wú)人車(chē)、機(jī)械臂、機(jī)器狗后,于2021年底開(kāi)始構(gòu)思籌劃研發(fā)自己的人形機(jī)器人。

籌備了半年,想通了技術(shù)路徑,也就是去年春夏之交,陳建宇開(kāi)啟了自己的新目標(biāo):

打造人形通用機(jī)器人,以及搭載在上面的“通用智能”。

具身通用人工智能

目前人形機(jī)器人存在的技術(shù)難題是什么?陳建宇總結(jié)了最受關(guān)注的三個(gè)方面:

首先,由于人形機(jī)器人具備高度集成性和復(fù)雜性,硬件本體構(gòu)建具有較高挑戰(zhàn)性;

其次是運(yùn)動(dòng)小腦的構(gòu)建,如何控制雙腿行走和操控雙臂完成各種任務(wù),還未被很好解決;

最后是人形機(jī)器人的“大腦”,如何將目前只有語(yǔ)言功能的大模型拓展到物理世界,并讓其進(jìn)行行為決策,是實(shí)現(xiàn)具身通用智能體至關(guān)重要的一環(huán)。

——這就引出近期最火的技術(shù)話(huà)題之一,具身智能。

5月的ITF World 2023半導(dǎo)體大會(huì)上,黃仁勛在演講中明確表態(tài),下一波AI浪潮就是具身智能(Embodied Intelligence)。

所謂具身智能,就是能夠理解、推理并與物理世界互動(dòng)的智能系統(tǒng),可以理解為有身體,并支持物理交互的AI智能體。

而具身智能的終極目標(biāo),就是具身通用人工智能。以ChatGPT為代表的通用人工智能雖然帶來(lái)了極大的轟動(dòng),但其只有語(yǔ)言與文本處理的能力。未來(lái)我們一定需要更加有用的具身的通用人工智能。

7月WAIC的具身通用人工智能論壇,邀請(qǐng)了包括姚期智先生、Sergey Levine、Anca Dragan、Koushil Sreenath、Jiajun Wu等國(guó)內(nèi)外知名大咖學(xué)者一起探討具身AGI的未來(lái),內(nèi)容涵蓋決策控制、感知認(rèn)知、本體構(gòu)建、算力支持、大模型理論等。

小星也在論壇上進(jìn)行了現(xiàn)場(chǎng)首秀,獲得了大量關(guān)注。

國(guó)際上,一些團(tuán)隊(duì)已在這個(gè)方向上有了初步的成果:

今年年初,谷歌推出5620億參數(shù)的多模態(tài)具身視覺(jué)語(yǔ)言模型PaLM-E,可以執(zhí)行各種復(fù)雜的機(jī)器人指令而無(wú)需重新訓(xùn)練。

哪怕受到干擾,也能完成“幫忙從抽屜里拿薯片”的指令。

李飛飛團(tuán)隊(duì)也新近發(fā)布了具身智能最新成果,大模型接入機(jī)器人,把復(fù)雜指令轉(zhuǎn)化成具體行動(dòng)規(guī)劃,無(wú)需額外數(shù)據(jù)和訓(xùn)練。

人類(lèi)可以很隨意地用自然語(yǔ)言給機(jī)器人下達(dá)指令,如“打開(kāi)上面的抽屜,小心花瓶!”

陳建宇團(tuán)隊(duì)也在推進(jìn)這方面的研究工作。

并且做出了世界上第一篇大模型結(jié)合人形機(jī)器人的學(xué)術(shù)工作。

他們用大模型來(lái)指導(dǎo)小星的上層任務(wù)規(guī)劃,用強(qiáng)化學(xué)習(xí)來(lái)獲取小星的底層控制器。

與此同時(shí),還提出了一套新的框架來(lái)解決上層規(guī)劃和下層執(zhí)行之間的對(duì)齊問(wèn)題,以確保下層控制能很好地執(zhí)行上層規(guī)劃的任務(wù)。

“我們發(fā)現(xiàn),一些簡(jiǎn)單的操作場(chǎng)景,接入13B的開(kāi)源模型就比較夠用了?!标惤ㄓ罘窒砹藢?shí)驗(yàn)過(guò)程中的發(fā)現(xiàn),“作為定位家庭服務(wù)的機(jī)器人,對(duì)數(shù)理邏輯、推演等功能的要求并不太高。”

緊接著,量子位又把“大模型幻覺(jué)在具身智能身上的解決思路”這個(gè)問(wèn)題拋給了陳建宇。

比起網(wǎng)絡(luò)世界里的胡說(shuō)八道,現(xiàn)實(shí)世界人形機(jī)器人受到帶有幻覺(jué)的指令,似乎是一件更為嚴(yán)肅、需要正視的事情。

思考片刻后,陳建宇給出了他的答案,那就是可能需要兩手解決方案,一方面是大模型產(chǎn)品本身對(duì)幻覺(jué)的控制,另一方面,在底層的控制也要加強(qiáng)。

關(guān)鍵詞:

責(zé)任編輯:hnmd004