中國自動化學(xué)會專家咨詢工作委員會指定宣傳媒體
新聞詳情
gkongbbs

從成都大運(yùn)會閉幕式,看人形機(jī)器人的技術(shù)躍遷

http://casecurityhq.com 2023-08-10 09:27 來源:雷峰網(wǎng)

在剛剛結(jié)束的成都大運(yùn)會閉幕式上,人形機(jī)器人“天團(tuán)”吸引了全球目光。

在第三篇章《夢想·致未來》中,優(yōu)必選自主研發(fā)的人形機(jī)器人Walker X騎著平衡車快速行進(jìn)、急速轉(zhuǎn)圈、高速動作,與舞蹈演員“斗舞”拉開序幕,并觸發(fā)本次閉幕式的重頭戲。

Walker X騎著平衡車環(huán)繞舞臺,用手指逐一點(diǎn)亮15塊移動屏幕,與宋代著名繪畫藝術(shù)珍品《蜀川勝概圖》進(jìn)行互動。隨后4臺熊貓機(jī)器人優(yōu)悠上場,手拿風(fēng)車和自拍桿,與樂隊(duì)和50多名演員合作。在這個節(jié)目中,人形機(jī)器人不再是配角,而是成為最矚目的主角。

這是世界性綜合運(yùn)動會首次在閉幕式采用大型人形機(jī)器人,5臺人形機(jī)器人完成這一系列復(fù)雜動作的背后,有哪些技術(shù)難題,又隱藏著哪些核心技術(shù)?

01

人形機(jī)器人騎平衡車登上大運(yùn)會閉幕式,有哪些技術(shù)難點(diǎn)?

在大運(yùn)會閉幕式的舞臺上,優(yōu)必選4臺熊貓機(jī)器人優(yōu)悠和1臺大型人形機(jī)器人Walker X需要在非常復(fù)雜的環(huán)境中與多名演員進(jìn)行互動,并自主控制自拍桿、平衡車等設(shè)備,全面呈現(xiàn)了豐富的人機(jī)交互技術(shù)、高難度的平衡控制技術(shù)、穩(wěn)定的步態(tài)控制技術(shù)、復(fù)雜的路徑規(guī)劃技術(shù)、多傳感器融合的定位技術(shù)等多項(xiàng)人形機(jī)器人核心技術(shù)。

這次優(yōu)必選為大運(yùn)會項(xiàng)目專門研發(fā)了機(jī)器人平衡車,實(shí)現(xiàn)了人形機(jī)器人控制平衡車。

人形機(jī)器人騎平衡車,主要分四步:感知、規(guī)劃、控制和執(zhí)行(動作展示)。這個看似簡單的流程,實(shí)際非常復(fù)雜。大運(yùn)會閉幕式的開放式舞臺,更加劇了這個流程的復(fù)雜度。

人在騎平衡車時,首先要通過眼睛等感知器官獲知自己所處的位置和周邊的環(huán)境情況,例如自己應(yīng)該按著哪一條路線前進(jìn)。這些信息會經(jīng)由大腦的中樞神經(jīng)系統(tǒng)進(jìn)行處理,進(jìn)而下發(fā)動作指令至某個活動執(zhí)行單元,例如手、腳等,完成具體的動作指令。與此同時,人的身體會基于各種信息進(jìn)行實(shí)時調(diào)整力度,比如讓自己的重心稍稍前傾,最終實(shí)現(xiàn)動態(tài)平衡。

與人類似,機(jī)器人在執(zhí)行任務(wù)時,第一步便是利用攝像頭、激光雷達(dá)等傳感器識別周圍環(huán)境,以及IMU(慣性測量單元,用于加速度、角速度和姿態(tài)等信息)、輪式里程計(jì)(測量平衡車的車輪轉(zhuǎn)動的距離,來計(jì)算出機(jī)器人的位移),再加上UWB(超寬帶)技術(shù)來實(shí)現(xiàn)無線定位,讓機(jī)器人知道“自己在哪兒”,從而為其在舞臺等復(fù)雜環(huán)境實(shí)現(xiàn)大場景、遠(yuǎn)距離的精確行走提供導(dǎo)航信息。

這些多傳感器的融合,本質(zhì)上是為了克服單一傳感器的局限,提高機(jī)器人在復(fù)雜環(huán)境中的定位精度和魯棒性,再配合相應(yīng)的路徑規(guī)劃算法,實(shí)現(xiàn)平衡車在舞臺上精確穩(wěn)定的導(dǎo)航和定位。

好比人的多個感官系統(tǒng),如果只憑借觸覺,難免造成盲人摸象,很難形成對事物的整體感知。

要將這些不同傳感器采集到的非結(jié)構(gòu)化數(shù)據(jù)融合在一起并不容易,尤其還要實(shí)現(xiàn)毫秒級計(jì)算與響應(yīng),除了要配備強(qiáng)大算力的芯片以外,對于多數(shù)據(jù)融合的算法要求也極高。而這些復(fù)雜信息數(shù)據(jù)的處理和計(jì)算,只完成了第一步。

接著,當(dāng)機(jī)器人感知到自身位置之后,便要開始規(guī)劃上下場路徑。

在舞臺現(xiàn)場,每臺熊貓機(jī)器人優(yōu)悠要行走20米,并在1分鐘之內(nèi)完成上下場,以及切換隊(duì)形。這個過程中比較大的難點(diǎn)在于,隊(duì)形很難保持一致,并且要求機(jī)器人在執(zhí)行動作時不能互相干擾。

為了克服這個難點(diǎn),優(yōu)必選開發(fā)出了基于時序的路徑規(guī)劃技術(shù),實(shí)現(xiàn)在有限空間內(nèi)讓多臺機(jī)器人安全、互不干擾地行走。同時,優(yōu)必選將離線規(guī)劃的運(yùn)動里程計(jì)與在線反饋定位信息的差值實(shí)時引入步態(tài)調(diào)整中,通過修正行走步長和轉(zhuǎn)向步長的方式,實(shí)現(xiàn)機(jī)器人上下場軌跡的精確控制,避免機(jī)器人出現(xiàn)“拖拉拽”帶來的碰撞問題。

感知、規(guī)劃之后,便是控制與執(zhí)行。控制是機(jī)器人在理解語義任務(wù)之后形成的動作,而執(zhí)行則是具體動作帶來的結(jié)果展示。比如,機(jī)器人跳舞,實(shí)際上是機(jī)器人控制各個執(zhí)行單元的效果展示。

由于四臺熊貓機(jī)器人表演的舞臺區(qū)域由升降臺和一塊塊木板拼接而成,表演時,舞臺會升高1.5m,而且舞臺間隙存在高低落差,這對于機(jī)器人步態(tài)的穩(wěn)定性和復(fù)雜環(huán)境的適應(yīng)性要求極高。讓機(jī)器人走得穩(wěn),也一直是困擾人形機(jī)器人的最大難點(diǎn)之一。

優(yōu)必選大型機(jī)器人采用了六維力、IMU、位置、視覺等多種傳感器數(shù)據(jù),估計(jì)機(jī)器人自身運(yùn)動狀態(tài)和環(huán)境信息,并針對復(fù)雜地形研發(fā)特定的行走算法,同時通過平衡控制器實(shí)時在線調(diào)整,來解決機(jī)器人在不平整地形下行走的穩(wěn)定性問題。

閉幕式現(xiàn)場,機(jī)器人除了與人斗舞,還能與小朋友互動,接過風(fēng)車、拍照留念等等,為此優(yōu)必選專門設(shè)計(jì)了擬人化程度更高的機(jī)器人動作,讓人形機(jī)器人的頭部、腰部、手臂動作顯得自然流暢。

此外,Walker X在平衡車上進(jìn)行表演,要求人形機(jī)器人進(jìn)行快速運(yùn)動以跟上音樂節(jié)拍。優(yōu)必選通過持續(xù)的算法優(yōu)化來尋找最優(yōu)模型,通過關(guān)節(jié)空間內(nèi)的最優(yōu)路徑規(guī)劃,將人形機(jī)器人舞臺動作呈現(xiàn)的速度提升了一倍之多。

02

人形機(jī)器人走進(jìn)生活還有多遠(yuǎn)?

作為機(jī)器人的最終形態(tài),一個能說會道、像人一樣走路工作的人形機(jī)器人,是人們對機(jī)器人的終極理想。

優(yōu)必選CTO熊友軍此前在2023世界人工智能大會演講中提到,“人形機(jī)器人的iPhone時刻已經(jīng)開啟,人形機(jī)器人將在人類科技史上留下濃墨重彩的一筆。”

熊友軍認(rèn)為,從工業(yè)革命以來,每一個時代都有它的標(biāo)志性產(chǎn)品,第四次工業(yè)革命是智能化的改革,其標(biāo)志性產(chǎn)品就是人形機(jī)器人。人形機(jī)器人是一個多任務(wù)、通用型的機(jī)器人平臺,更能適應(yīng)人類的生存環(huán)境,更易使用人類的生產(chǎn)工具,更易與人進(jìn)行情感交流,人形機(jī)器人將賦能各行各業(yè),最終走入家庭。生成式人工智能與人形機(jī)器人技術(shù)融合后,有望大大提高人形機(jī)器人產(chǎn)品迭代速度和提升交互體驗(yàn),使人形機(jī)器人變得更加智能,從而加速走入家庭的進(jìn)程。

業(yè)內(nèi)一般將人形機(jī)器人技術(shù)領(lǐng)域的難點(diǎn)歸為兩方面,一是算法,二是機(jī)械結(jié)構(gòu)。

前文曾提到,人形機(jī)器人采用多類傳感器(視覺、觸覺、力傳感、編碼器等等),這些傳感器感知數(shù)據(jù)的融合,以及規(guī)劃控制算法,需要不斷地測試模型、調(diào)優(yōu),是一個巨量工程。

在算法做到精準(zhǔn)極致的前提下,人形機(jī)器人的機(jī)械結(jié)構(gòu)亦相當(dāng)重要,其涉及的零部件,如舵機(jī)、伺服器、線束等數(shù)量繁雜,對結(jié)構(gòu)設(shè)計(jì)的緊密性、靈活性要求很高。

例如,人形機(jī)器人的“腿”,哪怕只是一條線束發(fā)生纏繞,機(jī)器人就很可能直接喪失行走能力。

即便算法和機(jī)械結(jié)構(gòu)的問題解決了,還有一個至關(guān)重要的問題:如何保證人形機(jī)器人的魯棒性,即穩(wěn)定性。

機(jī)器人的魯棒性,可以簡單類比為芯片的良率,一款芯片能不能成熟的商用,在于其良率的高低,良率越高,進(jìn)入市場的概率越大,反之良率低的芯片,量產(chǎn)規(guī)模小且很難推向市場。機(jī)器人的魯棒性越強(qiáng),意味著其執(zhí)行任務(wù)的能力越穩(wěn)定,就越具備落地的可能,反之亦然。

不過,這些難題并沒有影響人們對人形機(jī)器人的關(guān)注與熱情。作為中國人形機(jī)器人的先行者,優(yōu)必選大型人形機(jī)器人Walker 已經(jīng)更新到第四代,并在央視春晚、深圳經(jīng)濟(jì)特區(qū)成立40周年晚會、迪拜世博會中國館等多個重要場景,展示中國人形機(jī)器人技術(shù)實(shí)力。

近兩年,特斯拉、小米、三星等國際巨頭先后宣布入局人形機(jī)器人,特斯拉CEO馬斯克甚至表示,未來的人形機(jī)器人需求有望達(dá)到100億臺。對于人形機(jī)器人市場的樂觀情緒,從中可見一斑。

現(xiàn)階段的人形機(jī)器人在技術(shù)上還有很大的提升空間,但伴隨著技術(shù)的「涌現(xiàn)」,人形機(jī)器人或許將在不久之后迎來一次技術(shù)躍遷。

畢竟,在ChatGPT未問世之前,人們也將AI戲謔為人工智障。但如今,通用型人工智能的希望已可以窺見曙光。AI大模型這類底層技術(shù)的變革,也將給人工智能行業(yè),包括機(jī)器人在內(nèi)的諸多細(xì)分賽道,帶來強(qiáng)大的推動力。

具體到人形機(jī)器人,以O(shè)penAI為代表的大模型、Meta的SAM模型等,讓機(jī)器人在視覺識別物體、理解場景語義等方面更具智能,尤其在人機(jī)交互領(lǐng)域,其智能化程度將得到大幅提升。

技術(shù)反哺到產(chǎn)業(yè),當(dāng)人形機(jī)器人愈發(fā)智能,具備落地到生活場景的可能性時,整個產(chǎn)業(yè)鏈也將隨之變化。市場需求從下往上反饋至廠商,倒逼供應(yīng)鏈升級完善,以及相關(guān)技術(shù)的優(yōu)化提升;相關(guān)零部件的成本也將下探,從而自上而下推動人形機(jī)器人更廣泛的商業(yè)化落地。

在落地應(yīng)用方面,優(yōu)必選人形機(jī)器人聚焦于教育、智能制造、商用服務(wù)等領(lǐng)域,先后在沙特NEOM新未來城、中國科學(xué)技術(shù)館、AI教育培訓(xùn)基地等場景應(yīng)用落地,在智慧化的工廠,優(yōu)必選正在嘗試用人形機(jī)器人進(jìn)行智能分揀、老化測試等工作。

要真正讓人形機(jī)器人走入家庭,仍有一些技術(shù)難點(diǎn)需要克服。在熊友軍看來,人形機(jī)器人的量產(chǎn)將會分三步走:第一步是在結(jié)構(gòu)化、可控環(huán)境中的小批量試用和進(jìn)化,完成一些簡單任務(wù);第二步是在非結(jié)構(gòu)化、可控環(huán)境中訓(xùn)練和進(jìn)化,進(jìn)一步提升運(yùn)動、感知和決策能力;待與之適配的人工智能技術(shù)逐步成熟、制造工藝趨于穩(wěn)定、成本也大幅降低后,人形機(jī)器人大規(guī)模量產(chǎn)就水到渠成了。

03

結(jié)語

大運(yùn)會閉幕現(xiàn)場,Walker X和熊貓機(jī)器人優(yōu)悠表演結(jié)束之后,迎來了大運(yùn)會會旗的交接儀式。萬眾矚目下,大運(yùn)會被主辦方交接給號稱“世界制造業(yè)標(biāo)桿”的德國,下一屆東道主德國開始show time。這意味著由中國制造的人形機(jī)器人開啟“德國時間”。

作為老牌的工業(yè)大國,德國的制造業(yè)水平首屈一指,中國則是新興的工業(yè)大國,其供應(yīng)鏈和制造業(yè)水平也不遑多讓。

人形機(jī)器人是現(xiàn)代工業(yè)制造的一顆明珠,其代表著制造業(yè)、先進(jìn)科技的技術(shù)水平。在這個全世界目光聚焦的時刻,中國原創(chuàng)人形機(jī)器人為“智慧大運(yùn)”劃下完美句號,也向世界展示了中國人形機(jī)器人的發(fā)展水平、技術(shù)實(shí)力和產(chǎn)業(yè)能力。

版權(quán)所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved