Il mini robot del MIT stabilisce un nuovo record di velocità grazie all'esperienza

Il nuovo mini robot Ceetah del MIT è in grado di imparare per esperienza grazie ad una semplice rete neurale capace di effettuare valutazioni di nuove situazioni. In pratica gli scienziati dicono al robot cosa fare e lasciano che capisca da solo come farlo.

Avatar di Alessandro Crea

a cura di Alessandro Crea

Il mini robot Ceetah del MIT ha superato il proprio record di velocità, raggiungendo 14,04 km/h grazie a un nuovo sistema di apprendimento per rinforzo senza modello che consente al robot di capire da solo il modo migliore per correre e gli consente di adattarsi a diversi terreni, senza fare affidamento sull'analisi umana.

Il mini ghepardo non è il robot quadrupede più veloce in circolazione. Nel 2012, il suo fratello più grande Cheetah ha raggiunto una velocità massima di 45,5 km/h, ma il mini ghepardo sviluppato dall'Improbable AI Lab del MIT e dall'Institute of AI and Fundamental Interactions (IAIFI) della National Science Foundation è molto più agile ed è in grado di imparare.

Normalmente, il modo in cui un robot si muove è controllato da un sistema che utilizza dati basati su un'analisi di come si muovono gli arti meccanici per creare modelli che fungono da guide. Tuttavia, questi modelli sono spesso inefficienti e inadeguati perché non è possibile anticipare ogni contingenza.

Quando un robot funziona alla massima velocità, funziona ai limiti del suo hardware, il che lo rende molto difficile da modellare, quindi il robot ha difficoltà ad adattarsi rapidamente ai cambiamenti improvvisi nel suo ambiente. Per ovviare a questo problema, invece di robot progettati analiticamente, come Spot di Boston Dynamics, che si basano su dati che analizzano la fisica del movimento e configurano manualmente l'hardware e il software del robot, il team del MIT ha optato per un robot che impara per esperienza.

Il robot impara per tentativi ed errori senza un essere umano che interferisca e decida per lui. Se il robot ha abbastanza esperienza di diversi terreni, può migliorare automaticamente il suo comportamento. E questa esperienza non ha nemmeno bisogno di essere fatta nel mondo reale. Secondo il team, utilizzando simulazioni, il Mini-Ghepardo può accumulare 100 giorni di esperienza in tre ore stando fermo.

"Abbiamo sviluppato un approccio con cui il comportamento del robot migliora dall'esperienza simulata, e il nostro approccio consente anche di implementare con successo quei comportamenti appresi nel mondo reale", ha dichiarato il dottorando del MIT Gabriel Margolis e il postdoc IAIFI Ge Yang. "L'intuizione alla base del motivo per cui le abilità di corsa del robot funzionano bene nel mondo reale è: di tutti gli ambienti che vede in questo simulatore, alcuni insegneranno al robot le abilità che sono utili nel mondo reale. Quando opera nel mondo reale, il nostro controller identifica ed esegue le competenze pertinenti in tempo reale".

Con un tale sistema, i ricercatori sostengono che è possibile scalare la tecnologia, cosa che il paradigma tradizionale non può fare prontamente. "Un modo più pratico per costruire un robot con molte abilità diverse è dire al robot cosa fare e lasciare che capisca il come", hanno aggiunto Margolis e Yang. "Il nostro sistema ne è un esempio. Nel nostro laboratorio, abbiamo iniziato ad applicare questo paradigma ad altri sistemi robotici, comprese le mani che possono raccogliere e manipolare molti oggetti diversi".