Jaunākie sasniegumi cilvēkveidīgo robotu jomā

11 jūn. 2025
Simulācijās iegūtās prasmes var pārnest uz reālo pasauli, izmantojot Sim2Real sistēmas

PĒTĪJUMS PAR LOĢISTIKU
Autori Džejs Hvangs, PhD, Diens Vangs, PhD, un Veibins Liangs, PhD

Foto: Unitree

Cilvēkveidīgie roboti, par kuru galējo formu cilvēce jau sen ir sapņojusi, drīzumā kļūs par realitāti. Sabiedrības interese ir strauji pieaugusi, un pasaules tehnoloģiju giganti izrāda aizvien lielāku entuziasmu. Tomēr nozare joprojām atrodas prototipa stadijā.

Iedvesmojoties no cilvēka anatomijas, cilvēkveidīgo robotu trīs vissvarīgākie elementi ir smadzenes, kas paredzētas uzdevumu un kustību plānošanai, smadzenītes, kas paredzētas līdzsvaram un vienmērīgām kustībām, un ķermenis, kas paredzēts uzdevumu atpazīšanai un izpildei. Šo robotu galvenie izaicinājumi ir kritienu novēršana un intelekta pilnveidošana, lai tie varētu veikt vispārīgus uzdevumus.

Šo izaicinājumu novēršanai īpaši būtisks ir mākslīgais intelekts. Jaunās mākslīgā intelekta metodes (piemēram, pastiprināta un imitācijas mācīšanās, apjomīgi valodas modeļi) sniedz plašas iespējas cilvēkveidīgajiem robotiem. Pateicoties smadzenītēm, roboti var iemācīties noturēt līdzsvaru, novērst traucējumus, izpildīt sarežģītas kustības virtuālajā pasaulē un pēc tam pārnest šīs prasmes uz reālo pasauli. Ar mākslīgo intelektu uzlabotas smadzenītes liecina par ievērojamu progresu robotu stabilitātes un pielāgošanās spējas uzlabošanā, kas agrāk bija milzīgs šķērslis. Lai gan smadzenītes ir īpaši svarīgas, cilvēkveidīgajiem robotiem smadzenes ir vēl svarīgākas. Tuvākajā laikā pastiprināšanas un imitācijas mācīšanās ir īpaši daudzsološa apmācītām lietojumprogrammām. Visaptveroša liela modeļa risinājums ir pievilcīgs, taču tā praktiska īstenošana tuvākajā nākotnē joprojām ir sarežģīta. Cilvēka teleoperācija (kad cilvēks–operators attālināti vada robotu) ir praktiska pieeja mācību datu vākšanai. Tas var būt alternatīvs risinājums, ja robotizētā intelekta spējas vidējā termiņā izrādās nepietiekamas.

Pirms mākslīgā intelekta ieviešanas šajā jomā androidi bieži apgāzās

Runājot par uzņēmumiem, kas izstrādā cilvēkveidīgos robotus, un to jaunākajiem sasniegumiem, Unitree dominē attiecībā uz ķermeni un smadzenītēm. Uzņēmums galvenokārt izstrādā četrkājainus robotus, taču tas ir sekmīgi pārgājis uz divkājainiem robotiem. Tā cilvēkveidīgais robots demonstrēja izcilas kustību spējas. No otras puses, Google DeepMind ir pavirzījies uz priekšu robotizētu smadzeņu izstrādē. Uzņēmums pēta dažādas ģeneratīvā mākslīgā intelekta metodes, kas pārsniedz tradicionālos lielos modeļus, un tā pētījumi ir balstīti uz vienkāršotu cilvēkveidīgo robotu.

Trīs svarīgākie elementi, kas ir nepieciešami cilvēkveidīgajiem robotiem, ir smadzenes, smadzenītes un ķermenis (ieskaitot acis, ausis, ādu, muskuļus un kaulus). Galvenās problēmas, kas saistītas ar šiem trim elementiem, ir relatīvi neatkarīgas un var tikt uzlabotas paralēli.

Cilvēkveidīgaiem robotiem vēl ir nepieciešama lielāka stabilitāte pirms to plašas izmantošanas (Foto: Unitree)
Foto: Unitree

Smadzenītes

Tāpat kā cilvēkam, arī cilvēkveidīgā robota smadzenītēm ir būtiska loma locītavu kustību koordinēšanā, lai saglabātu līdzsvaru un nodrošinātu vienmērīgu kustību. Šiem robotiem stabila staigāšana pagātnē bija ievērojams šķērslis. Pirms mākslīgā intelekta ieviešanas šajā jomā androidi viegli apgāzās, tāpēc bija nepieciešams izmantot drošības troses, lai aizsargātu trauslās mašīnas.

Daži dalībnieki ir ieviesuši samērā progresīvas vadības metodes, piemēram, visa ķermeņa vadību un modeļa prognozējamo vadību, demonstrācijās parādot iespaidīgus rezultātus. Tomēr cilvēkveidīgie roboti nav kvalificēti, lai efektīvi tiktu galā ar neparedzamām vides izmaiņām. Šīs mašīnas ir jāturpina optimizēt konkrētām kustībām vai uzdevumiem, un smadzenītes šajā jomā ir pastāvīgs izaicinājums.

Par laimi, mākslīgais intelekts (t.i., pastiprināta mācīšanās) apvienojumā ar jaudīgām simulācijas metodēm šodien var mainīt spēles noteikumus. Pastiprināta mācīšanās ir izmēģinājumu un kļūdu process: roboti var iemācīties uzvedību, atkārtoti mijiedarbojoties ar apkārtējo vidi. Inženieri ieprogrammē šīm mašīnām “ko darīt”, nevis “kā darīt”, un tad tās pašas atradīs veidus, kā izpildīt uzdevumus.

3D redze, izmantojot LiDAR vai dziļuma kameras, veiklas rokas un spēka/taktilā uztveršana ir īpaši svarīgi, lai nodrošinātu cilvēkveidīgo robotu veiktspēju

Šo kustību precizēšanai ir nepieciešams atbalsts no simulācijas, kas ir virtuāla vide, kurā roboti apgūst kustību un uzdevumus. Virtuālajā simulācijā apgūtās kustības, prasmes un zināšanas vēlāk var pārnest uz reālo pasauli, izmantojot simulācijas-realitātes (Sim2Real) sistēmas. Sākotnējos posmos neveiksmes ir neizbēgamas, taču galu galā var atrast ceļu uz panākumiem.

Lai gan nākotne izskatās daudzsološa, simulācijas vidēs un Sim2Real pastāv tehniski šķēršļi. Šīs sarežģītās un detalizētās platformas cenšas precīzi atdarināt fiziskos procesus, tostarp cietvielu dinamiku, sadursmes, berzi un deformāciju, lai radītu reālistisku virtuālo pasauli.

Boston Dynamics panāca ievērojamu kritienu biežuma samazinājumu — līdz vienai reizei uz 50 km  — savam četrkājainajam robotam. Šis skaitlis ir daudz lielāks divkājainajām mašīnām. Tāpēc, neraugoties uz šajā jomā gūtajiem panākumiem, pirms plašas ieviešanas rūpniecībā ir jāturpina pilnveidot cilvēkveidīgo robotu stabilitāte un uzticamība.

Tesla Optimus Gen-2 cilvēkveidīgais robots no Tesla (publicēts ar CC BY 3.0 universālo licenci)
Tesla Optimus Gen-2 cilvēkveidīgais robots no Tesla
Publicēts saskaņā ar CC BY 3.0 universālo licenci

Smadzenes

Pētnieki joprojām pēta, kā padarīt robotus pietiekami gudrus, lai veiktu vispārējus uzdevumus. Nozare cenšas risināt īstermiņa problēmas, izmantojot pastiprināto un imitācijas mācīšanos. Tā plāno ieviest vairākus lielus modeļus un integrētu visaptverošu lielu modeli ilgākā termiņā.

Papildus robotu kustību spēju uzlabošanai, pastiprināto mācīšanos var izmantot, lai apmācītu konkrētu uzdevumu veikšanai. Tomēr, ja to izmantosim, lai aptvertu visas vispārīgās darbības, apmācības laiks būs pārāk ilgs. Praktiskāka pieeja ietver imitācijas mācīšanās integrēšanu, kad cilvēks demonstrē uzdevumus, izmantojot teleoperāciju, un robots uzskata cilvēka uzvedību par optimizētu risinājumu.

Google DeepMind komanda ierosināja izmantot vairākus lielus modeļus, lai veiktu uztveres, plānošanas un aktivācijas funkcijas. Komanda ieviesa arī integrētu redzes, valodas un darbības modeli — Robotic Transformer 2 (RT-2) –, kas nodrošina visas trīs galvenās funkcijas. Tas parādīja, ka RT-2 spēj veikt vispārējus uzdevumus, kas prasa spriest, saprast simbolus un atpazīt cilvēkus. Piemēram, uzdevums “ielikt zemeni pareizajā traukā” prasa, lai robots ne tikai saprastu, kas ir zemene un bļoda, bet arī noteiktu, ka zemene ir jāgrupē kopā ar līdzīgiem augļiem.

Ķermenis

Mēs uzskatām, ka papildus tādām svarīgām daļām kā motors un reduktors, cilvēkveidīgo robotu veiktspējas nodrošināšanai īpaši svarīgi ir vēl šādi elementi: 3D redze, izmantojot LiDAR vai dziļuma kameras, veiklas rokas un spēka/taktilā uztveršana. Mēs sagaidām, ka šie elementi būs neaizstājami, lai nodrošinātu uzlaboto cilvēkveidīgo robotu optimālu funkcionalitāti.

Jaunās tendences un izaicinājumi cilvēkveidīgo robotu jomā

Galvenie cilvēkveidīgo robotu moduļi Tehnoloģiju tendences Galvenie izaicinājumi
Smadzenes
Uzdevumu un kustību plānošana
  • Pašreizējais: pastiprināta mācīšanās + imitācijas mācīšanās
  • Nākotne: vairāki lieli modeļi
  • Ilgtermiņa nākotne: integrēts visaptverošs liels modelis
  • Apmācībai nepieciešamo datu kopu trūkums
  • Nav kvalificēts vispārējiem uzdevumiem
  • Nepārbaudīta uzticamība
Smadzenītes
Locītavu kustību koordinācija
  • Pagātne: visa ķermeņa vadība + modeļa prediktīva kontrole
  • Pašreizējais: pastiprināta mācīšanās + Sim2Real*
  • Droša pārnese no simulācijas uz reālo pasauli
  • Pielāgošanās vispārējai videi
Ķermenis
Vides uztvere + kustību izpilde
  • Augstas jaudas blīvuma elektromotors
  • Elastīgas robotizētas rokas
  • Taktila/spēka uztveršana
  • Zemākas izmaksas
  • Uzlabota aparatūras veiktspēja (piemēram, liels jaudas blīvums, augsta dinamika, mazāks svars utt.)

 

Avots: Chinese Academy of Sciences, Beijing Humanoid Robot Innovation Center, Tsinghua University, Bernstein analysis (Ķīnas Zinātņu akadēmija, Pekinas Cilvēkveidīgo robotu inovāciju centrs, Tsinghua Universitāte, Bernsteina analīze)
*Sim2Real, i.e., simulation to reality, refers to transferring motion, skills, or knowledge from a virtual simulation to the real world (Sim2Real jeb simulācija realitātē attiecas uz kustības, prasmju vai zināšanu pārnešanu no virtuālas simulācijas uz reālo pasauli.).

Ietekme uz nozari

Pašreizējā “robotu renesanses” laikmetā mākslīgais intelekts parasti tiek integrēts ar redzes funkciju, lai veiktu uzdevumus, kas saistīti ar atrašanās vietas noteikšanu, identifikāciju un pārbaudi. Tomēr industriālajiem robotiem joprojām trūkst uzlabota intelekta. Jaunās mākslīgā intelekta tehnoloģijas (pastiprinājuma un imitācijas mācīšanās, lieli valodas modeļi u.c.) var radīt apvērsumu šajā jomā.

Zinātnieki ir pierādījuši mākslīgā intelekta un rūpniecisko robotu apvienošanas iespējamību tādos aspektos kā rūpniecisko robotu kustības trajektoriju un izpildes laika optimizācija, pašģenerējošas stratēģijas sarežģītu scenāriju risināšanai un robotu programmēšanas procesu vienkāršošana. Ņemot vērā industriālo robotu ekosistēmas pieaugošo briedumu, mēs sagaidām, ka tuvākajā nākotnē mākslīgais intelekts veicinās turpmāku šo mašīnu ieviešanu.

 


 

PĒTĪJUMA AUTORI:

Džejs Hvangs, Ph.D, Diens Vangs, Ph.D un Veibins Liangs, Ph.D, Sanford C. Bernstein (Hong Kong) Limited, kas ir daļa no Société Générale Group, pētniecības analītiķi.

 


 

Sākotnējā publikācija:

Huang, Jay, Wang, Dien, Liang, Weibin. 2024. “Global Automation: The Humanoid Primer”. Bernstein Société Générale Group.

Lūdzu, ņemiet vērā, ka šis raksts ir sagatavots tikai institucionālajiem un profesionālajiem investoriem un nav paredzēts mazumtirdzniecības vai privātajiem investoriem. Lūdzu, apmeklējiet www.bernsteinresearch.com, lai uzzinātu svarīgu informāciju.