El Laboratorio de Biomimética del MIT acaba de batir el récord de velocidad de un mini guepardo (o chita) robótico: no llega a la velocidad de Usain Bolt, pero probablemente es más rápido de lo que tú puedas correr. Pero este robot no puede ver, y los investigadores del MIT no lo entrenaron para caminar o correr. Más bien, se enseñó a sí mismo, y en sólo tres horas.
"Tradicionalmente, el proceso que la gente ha estado utilizando [para entrenar a los robots] requiere que se estudie el sistema real y se diseñen manualmente los modelos... este proceso es bueno, está bien establecido, pero no es muy escalable", me dijo recientemente el profesor del MIT Pulkit Agrawal en un podcast de TechFirst. "Pero estamos eliminando al humano del diseño de los comportamientos específicos".
Entrenar un robot de la forma tradicional lleva unos 100 días de esfuerzo intensivo, dice Agrawal. Eso es tiempo humano dedicado por los informáticos e ingenieros a diseñar comportamientos y a completar varios meses de aprendizaje por ensayo y error.
Reducirlo a tres horas implica el uso extensivo de simuladores con tecnología de NVIDIA y otros socios, pero también significa cambiar la metodología. Y eso significa pasar de decirle al robot lo que tiene que hacer a dejarlo (relativamente) libre para que cometa errores.
"Si elimino a un diseñador humano... tengo que pagar un coste", dice Agrawal. "Y ese coste es que estamos haciendo un aprendizaje por ensayo y error, pero entonces requiere muchos más datos... ahora, si se hiciera esto en el mundo real, sería muy caro porque requeriría 100 días de experiencia en el mundo real. Y si el robot se cae, eso no es muy bueno. Así que lo que ofrece el simulador es una especie de patio de recreo seguro, en el que no pasa nada porque el robot se caiga y vuelva, pero además el simulador puede funcionar mucho más rápido que el tiempo real".
La simulación y la libertad para cometer errores sin consecuencias marcan la diferencia.
Los anteriores sistemas de control de funcionamiento para robots, como los de Boston Dynamics y el Cheetah 3 del MIT, se diseñaban de forma analítica. Eso significa confiar en los ingenieros para analizar la física de la locomoción, formular abstracciones e implementar una jerarquía de controladores para hacer que el robot se equilibre y corra, dice el MIT. En el mundo real, eso significa ensayo y error, analizar los errores, adaptar los modelos de software y volver a intentarlo... todo ello mientras se intenta evitar que el hardware del robot se haga pedazos cada vez que se cae.
Así que la simulación funciona, y el autoaprendizaje también, pero hay un paso más crítico. Y es adaptar las habilidades simuladas al mundo real, que siempre será diferente a la simulación. (Por muy buena que sea la simulación, no es exacta ni completamente equivalente a la realidad).
"Desarrollamos un enfoque por el cual el comportamiento del robot mejora a partir de la experiencia simulada, y nuestro enfoque permite críticamente también el despliegue exitoso de esos comportamientos aprendidos en el mundo real", dice el MIT. "La intuición que explica por qué las habilidades de carrera del robot funcionan bien en el mundo real es: de todos los entornos que ve en este simulador, algunos le enseñarán al robot habilidades que son útiles en el mundo real. Cuando opera en el mundo real, nuestro controlador identifica y ejecuta las habilidades relevantes en tiempo real."
El resultado es conseguir que el Mini Cheetah corra más o menos a la velocidad que podríamos alcanzar tú o yo: unos cuatro metros por segundo, o nueve millas por hora.
El resultado es conseguir que el Mini Cheetah corra más o menos a la velocidad que podríamos alcanzar tú o yo: unos cuatro metros por segundo, o nueve millas por hora.
Puede que no parezca muy rápido, pero es un récord para este robot en particular. Después de todo, sólo mide unos 30 centímetros de alto y pesa unos 9 kilos. El estudiante de posgrado del MIT, Gabriel Margolis, dice que si se aumenta el tamaño, se aumenta la velocidad. Es decir, si quieren batir a Usain Bolt y no sólo a la abuelita en su silla de ruedas, pueden hacerlo.
(Nota: Boston Dynamics hizo correr a un robot tan rápido como Usain Bolt en 2012. Sin embargo, el robot estaba en una cinta de correr, recibía energía externa y tenía un sistema de apoyo).
Pero también hay otra parte sorprendente: este robot es ciego.
"Todos los comportamientos que hemos mostrado se han logrado, esencialmente, a ciegas", dice Margolis. "Lo que hace el robot es sentir el entorno a través de... no tiene sensores táctiles, tampoco, en sus pies, sino que simplemente siente el entorno a través del movimiento de sus articulaciones".
En los seres vivos, eso se conoce como propiocepción o cinestesia: la capacidad de saber dónde están tus extremidades y qué hacen sin verlas. (Una vez tuve que utilizar este sentido, hace años, al vadear un arroyo de montaña a principios de la primavera. Mis pies perdieron la sensibilidad en el agua fría y tuve que hundirlos en el lecho del arroyo para comprobar dónde podía encontrar un punto de apoyo sólido).
Esto le da a la chita la sensación de la superficie sobre la que está: si es nieve o hielo o cemento o hierba o grava, y la chita adapta su método y velocidad de locomoción en consecuencia.
"Estamos interesados en añadir más sensores, pero todos los comportamientos que hemos demostrado se han conseguido sin ellos", afirma Margolis. "El uso de la visión tiene algunas ventajas, pero también tiene muchos inconvenientes. Uno de ellos es que la simulación puede ser mucho más lenta. Así que es posible que no se consiga esa enorme velocidad de la misma manera".
Una pregunta válida es: ¿por qué construir con patas?
Después de todo, el desplazamiento con ruedas es mucho más rápido, más eficiente, más fácil de aprender o programar y requiere mucho menos equilibrio. La respuesta está en lo que se quiere que puedan hacer los robots, en última instancia.
"Pueden ir a muchos sitios que los robots con ruedas no pueden", dice Margolis. "Podemos tener vehículos de respuesta a emergencias que entren en una casa y salven a alguien. Podemos tener servicios de entrega que suban algo por las escaleras a tu porche o incluso a tu casa".
La buena noticia para quienes quieran beneficiarse de la investigación del MIT sobre robots con patas es que está disponible de forma gratuita. El código está disponible como proyecto de código abierto, dice Agrawal, así que cualquiera puede descargarlo, jugar con él, replicar los resultados y construir sobre él.
"Y lo bueno es que estamos haciendo esta investigación en una plataforma de bajo coste en la que, incluso si construyes tu propio cuadrúpedo, puedes implementar nuestro sistema en él porque no utilizamos ningún equipo especializado o caro para hacerlo", dice Agrawal. "Así que, en cierto modo, nuestra investigación es muy democrática".