Cuál es la empresa en la que invirtió Jeff Bezos y ya vale US$ 1.500 millones
La compañía creó un modelo fundacional para lo que describe como un "cerebro de propósito general" que puede encajarse en una gran variedad de robots.

Los robots, ya sean humanoides bípedos que realizan tareas básicas en fábricas o "perros robot" militares de cuatro patas destinados al combate, necesitan cerebros. Históricamente, éstos fueron altamente especializados y diseñados para un propósito específico. Pero una startup de robótica con sede en Pittsburgh afirma que creó una inteligencia única lista para usar que puede enchufarse a distintos robots para permitirles realizar funciones básicas.

Fundada en mayo de 2023 por Abhinav Gupta y Deepak Pathak, dos antiguos profesores de la Universidad Carnegie Mellon, Skild AI creó un modelo fundacional para lo que describe como un "cerebro de propósito general" que puede encajarse en una gran variedad de robots, permitiéndoles hacer cosas como subir pendientes pronunciadas, pasar por encima de objetos que obstruyan su camino e identificar y recoger objetos.

La empresa anunció el martes que recaudó 300 millones de dólares con una valoración de 1.500 millones en una ronda de financiación de serie A liderada por Lightspeed Ventures, Softbank, Coatue y el fundador de Amazon, Jeff Bezos, con la participación de CRV, Felicis Ventures, Menlo Ventures, Amazon, Sequoia Capital, General Catalyst, SV Angel y CMU.

Raviraj Jain, el socio de Lightspeed que también dirigió la ronda de capital semilla de la empresa en julio de 2023, declaró a Forbes que quedó muy impresionado con los modelos de Skild AI cuando los vio por primera vez sometidos a pruebas de presión el pasado mes de abril. Los robots que los utilizaban eran capaces de realizar tareas en entornos que nunca antes habían visto y que no habían sido diseñados para demostraciones. "Los robots de entonces fueron capaces de subir escaleras, y creo que es una auténtica locura lo bien que pudieron hacerlo porque se trata de un problema de estabilidad muy complejo", afirmó.

Aún más impresionante: los robots que utilizaron los modelos de IA de Skild también demostraron "capacidades emergentes", es decir, habilidades totalmente nuevas que no se les habían enseñado. A menudo son sencillas, como recuperar un objeto que se les escapa de las manos o girar un objeto. Pero demuestran la capacidad del modelo para realizar tareas imprevistas, una tendencia que se da en sistemas artificiales avanzados como los grandes modelos lingüísticos.

Skild lo consiguió entrenando su modelo en una base de datos masiva de texto, imágenes y video, una base que, según afirma, es 1.000 veces mayor que las utilizadas por sus rivales. Para crear esta base de datos masiva, los cofundadores, ambos antiguos investigadores de IA en Meta, combinaron una mezcla de técnicas de recopilación de datos, que han desarrollado y probado a lo largo de años de investigación.

Una de ellas consistió en contratar a humanos para que manejaran robots a distancia y recopilaran datos sobre esas acciones. Otra fue hacer que el robot realizara tareas aleatorias, registrar los resultados y aprender por ensayo y error. El modelo de IA también se entrenó con millones de vídeos públicos.

Como estudiante de doctorado en la UC Berkeley, Pathak desarrolló una forma de inculcar "curiosidad artificial" a los robots recompensando al sistema por producir resultados que se producen cuando no puede predecir los resultados de sus acciones. "Cuanto más incierto es el agente sobre la predicción del efecto de sus acciones, más curiosidad siente por explorar", explicó. La técnica incentivó a la IA a recorrer más escenarios y recopilar más datos.

Su investigación sobre el aprendizaje impulsado por la curiosidad se publicó en 2017 y fue citada más de 4000 veces, dijo. Pathak también ideó una forma de que los robots utilizaran la información escrita de grandes modelos lingüísticos como el GPT (de cómo abrir una lata de leche, por ejemplo) y la convirtieran en acciones.

"En 2022 descubrimos una forma de reunir todas estas cosas en un único sistema coherente", dijo Pathak. “La noción de aprendizaje a partir de videos, aprendizaje a partir de la curiosidad, aprendizaje a partir de datos reales pero combinado con el conocimiento de la simulación”, agregó.

El modelo fundamental de Skild AI, entrenado con 1.000 veces más datos que sus rivales, se puede incorporar a una variedad de robots, lo que les permite hacer cosas como escalar pendientes pronunciadas, caminar sobre objetos que obstruyen su camino e identificar y recoger elementos.

El modelo fundacional de Skild AI, entrenado con 1000 veces más datos que sus rivales, puede introducirse en una gran variedad de robots, permitiéndoles hacer cosas como subir pendientes pronunciadas, pasar por encima de objetos que obstruyan su camino e identificar y recoger objetos.

Skild AI se enfrenta a la dura competencia de una serie de empresas de robótica que surgieron con miles de millones de dólares en financiación de riesgo gracias al auge de la IA. El gigante de la industria OpenAI reactivó recientemente su equipo de robótica para suministrar modelos a las empresas de robótica, según informó Forbes en primer lugar. También hay empresas como la de robótica humanoide Figure AI, dirigida por el multimillonario director ejecutivo Brett Adcock, y Covariant, una spin off de OpenAI que está construyendo ChatGPT para robots y ha recaudado más de 200 millones de dólares para ello.

El cofundador Gupta afirma que el acceso de Skild AI a grandes cantidades de datos la separa de otras en el espacio, pero declinó revelar exactamente con cuántos datos se entrena su modelo.

Ken Goldberg, profesor de robótica y automatización de la UC Berkeley está de acuerdo en que los datos son la clave para escalar la robótica, pero los robots requieren un tipo específico de datos que no están ampliamente disponibles en Internet. Además, el uso de datos obtenidos en simulación no siempre se traslada al mundo real.

"La idea que entusiasma ahora mismo a la robótica es que podemos hacer algo análogo a los grandes modelos lingüísticos y a los grandes modelos lingüísticos de visión, en los que ambos tienen acceso a datos a escala de Internet en los que hay miles de millones de ejemplos", afirma. No es una tarea sencilla para la robótica, pero Skild AI pretende abordar la cuestión combinando todas sus técnicas de recopilación de datos con más información extraída de simulaciones.

Pathak y Gupta vislumbran un futuro para su empresa similar al de OpenAI, en el que puedan construirse diferentes casos de uso y productos sobre el modelo fundacional de Skild ajustándolo con precisión. "Así es exactamente como pretendemos perturbar la industria de la robótica", afirmó Gupta, añadiendo que con el tiempo quieren lograr una inteligencia general artificial (un sistema hipotético de IA que pueda rivalizar o superar las capacidades humanas) para los robots, pero con la que las personas puedan interactuar en el mundo físico.

"Se acerca un momento GPT-3 en el mundo de la robótica", afirmó Stephanie Zhan, socia de Sequoia Capital e inversora en Skild AI. “Desencadenará un cambio monumental que traerá al mundo físico avances similares a los que hemos visto en el mundo de la inteligencia digital”, cerró.

 

*Con información de Forbes US