Poco antes de Navidad de 2023, el pequeño equipo de Cognition enfrentaba dificultades para configurar un servidor de datos particularmente complejo para Devin, el asistente de codificación en desarrollo de la startup de inteligencia artificial con sede en San Francisco. Tras pasar horas revisando manuales de instalación y probando comandos sin éxito, estaban agotados y frustrados. Fue entonces cuando decidieron probar cómo se desempeñaría Devin en esta tarea.
Cuando la IA comenzó a trabajar, dejó perplejos a sus creadores. "Ejecutó los comandos más parecidos a brujería, como magia negra", recordó Walden Yan, cofundador y jefe de producto, de 21 años. Al principio, parecía que Devin no lograría mejores resultados que ellos. Pero, de repente, una luz en la terminal del servidor, que había estado en rojo durante horas, se volvió verde. El servidor de datos finalmente estaba en funcionamiento.
Devin había eliminado un archivo defectuoso del sistema que el equipo no había notado, algo que luego comprendieron. "Ese fue el momento en que me di cuenta de cuánto va a cambiar la ingeniería de software", comentó Yan.
Esta fue la primera tarea importante que Devin completó, y representó la prueba de concepto para la visión de Cognition: que la inteligencia artificial pueda encargarse de las tareas repetitivas en la programación. Ahora, casi un año después, Devin se ocupa de trabajos básicos de ingeniería, como identificar y corregir errores, actualizar fragmentos de código y migrarlos entre plataformas. Con una simple indicación, como "limpiar esta base de código", la IA genera un plan de acción y lo ejecuta. La mayoría de las veces, funciona.
Es un enfoque distinto al de otros actores más conocidos y de mayor tamaño en el campo, aún en crecimiento, como Github (que Microsoft compró por 7.500 millones de dólares en 2018) y Codeium, valuada en 1.300 millones de dólares, ambas plataformas que ofrecen asistentes digitales que ayudan a escribir código mediante sugerencias impulsadas por inteligencia artificial.
Sin embargo, Devin es un agente de IA autónomo que, en teoría, escribe el código por sí mismo, sin intervención humana, y puede completar proyectos enteros que típicamente estarían asignados a desarrolladores. El nombre Devin deriva de "dev", una abreviatura del término en inglés. "Vimos una oportunidad real", explica Scott Wu, cofundador y CEO de Cognition, de 28 años, "de pasar de la finalización de texto a la finalización de tareas", agrega.
El código generado por IA ya empieza a transformar la industria. En octubre, el CEO de Google, Sundar Pichai, dijo que más de una cuarta parte del nuevo código de la compañía lo escribe inteligencia artificial. En Github, que alcanzó una tasa anual de ingresos de 2.000 millones de dólares en 2024, su herramienta de completado de código representó el 40 % del crecimiento de ingresos este año, según informó el CEO de Microsoft, Satya Nadella, en julio. Brendan Burke, analista de Pitchbook, señaló que la codificación impulsada por IA ya es el caso de uso más financiado dentro de la inteligencia artificial generativa, con startups enfocadas en esta área que recaudaron más de 1.000 millones de dólares solo en la primera mitad de 2024.
"La ingeniería de software en el mundo real es un verdadero desorden".
Scott Wu, CEO de Cognition.
Los ingresos reales recién comenzaron a crecer: la firma de investigación IDC estima que superarán los 4.000 millones de dólares recién en 2029. Varias startups de codificación con IA ya superaron los 10 millones de dólares en ingresos anuales proyectados; Cognition no compartió cifras, pero su presidente, Russell Kaplan, aseguró que firmaron contratos con docenas de clientes, con acuerdos anuales que oscilan entre seis y siete cifras.
Sin embargo, la oportunidad es lo suficientemente atractiva como para que gigantes como Anthropic, Amazon e IBM lancen sus propias herramientas de codificación, junto con startups como Poolside (valuada en 3.000 millones de dólares) y Anysphere (400 millones de dólares). La capacidad de escribir código ya se convirtió en una "necesidad básica" para los modelos de IA, según la analista de IDC, Ritu Jyoti, quien destacó que el líder en el sector sigue siendo ChatGPT de OpenAI. Pero las IA que pueden codificar completamente de manera autónoma, como la que desarrolla Cognition, "generarán un cambio radical", remarcó.
Ese cambio puede no ser tan alentador para los 5 millones de estadounidenses que trabajan como programadores, con un salario medio de 130.000 dólares, ni para los 13 millones de desarrolladores en India y China. Sin embargo, Wu insiste en que no se avecinan pérdidas masivas de empleos y argumenta que el campo estuvo "limitado por la oferta".
Los programadores comunes pueden estar preocupados, pero los inversores están encantados. Founders Fund de Peter Thiel y Khosla Ventures apostaron por Wu y su equipo de 25 personas, invirtiendo 176 millones de dólares en Cognition durante una ronda de financiamiento Serie B en abril, lo que elevó su valuación a 2.000 millones de dólares tan solo seis meses después de su fundación. Esta inyección de capital llegó apenas tres meses después de que la startup cerrara una ronda Serie A por 21 millones de dólares en enero.
Entre los clientes de Cognition se encuentran Ramp, una empresa de gestión de gastos con ingresos anualizados de 300 millones de dólares en 2023, que utiliza Devin para escribir pruebas y limpiar código obsoleto; y MongoDB, una plataforma de datos con ingresos de 1.700 millones de dólares en el año fiscal 2024, donde Devin actualiza arquitecturas de código desactualizadas, ahorrando millones a sus clientes, según afirmó su director de producto, Sahir Azam. También los programadores de Nubank, una fintech con ingresos de 8.000 millones de dólares en 2023, usan la herramienta para tareas como la actualización de repositorios de código.
Aunque aún es temprano, el socio de Founders Fund, John Luttig, invirtió en Cognition en parte porque cree que la empresa tiene una ventaja tan grande que "alcanzarlos en agentes de codificación será muy difícil", dijo. Microsoft parece compartir esa visión, ya que firmó un acuerdo en mayo para ofrecer Devin a desarrolladores a través de su nube Azure. Durante la conferencia anual para desarrolladores de la compañía, el CTO, Kevin Scott, describió la herramienta como "extraordinaria".
Sin embargo, Silicon Valley está lleno de empresas que en su momento lideraron con ventaja sobre Amazon y Google, hasta que dejaron de hacerlo. Los defensores de Cognition apuestan a que, si alguien puede crear la máquina definitiva para codificar, son estos tres programadores de élite, con logros que lo demuestran. Los fundadores son medallistas de oro a nivel olímpico en competencias de programación y se conocieron en ese circuito competitivo. Wu fue un prodigio de las matemáticas en la escuela primaria y alcanzó el rango de "gran maestro legendario" (el más alto) en Codeforces, un sitio de redes para programadores que organiza competencias de programación. Eric Glyman, inversionista ángel de Cognition y CEO de Ramp, aseguró que Wu tiene "uno de los cinco coeficientes intelectuales más altos de las personas que conocí".
"Scott es claramente brillante, curioso y con una ambición sin límites", afirmó Sarah Guo, capitalista de riesgo que invirtió en Cognition en tres rondas de financiamiento a través de su firma, Conviction. Wu también figuró en la lista Forbes 30 Under 30 en 2019 por su empresa anterior, Lunchclub, que usa IA para organizar reuniones de networking. Un inversor de Cognition comentó a Forbes que Wu dejó Lunchclub en 2022 porque sus intereses cambiaron (Wu prefirió no comentar), y Lunchclub, que recaudó alrededor de 30 millones de dólares, sigue operando.
"Siempre existe una brecha entre las expectativas de lo que es posible y lo que funciona de manera confiable."
Varun Mohan, CEO de Codeium.
En marzo, Cognition lanzó a Devin generando gran expectación. En un video de demostración que acumuló 30 millones de vistas en X, la empresa afirmó que Devin había "aprobado con éxito entrevistas prácticas de ingeniería en empresas líderes de IA" y completado tareas de codificación complejas. Algunos ingenieros quedaron impresionados por las habilidades técnicas de Devin; otros temieron por sus empleos. Poco después del lanzamiento, resurgió un video de Wu en séptimo grado dominando una competencia de matemáticas, con comentarios en línea bromeando: "No es humano, es una IA" y "Devin es solo Scott respondiendo tus preguntas en una app de mensajería".
Luego, Carl Brown, un reconocido desarrollador independiente de Austin, Texas, cuestionó la autenticidad. En un video titulado "Desenmascarando a Devin", que superó las 500.000 vistas, acusó a Cognition de exagerar las capacidades de su ingeniero de IA. Su análisis reveló que Devin tardó mucho más que un humano en completar la tarea e introdujo errores en el proceso.
Experiencias como estas llevaron a algunos a cuestionar si Devin es simplemente más aire inflado en la burbuja del hype de la IA. Krish Manair, ingeniero de la empresa de etiquetado de datos Labelbox, probó las habilidades de Devin para crear aplicaciones web y comentó que, al pedirle diseñar una interfaz de usuario impactante, los resultados fueron monótonos. Varios fundadores rivales dijeron a Forbes que la compañía exageró las capacidades de Devin, haciéndolo parecer como si un ingeniero pudiera usarlo directamente para programar cualquier cosa. Argumentaron que sus capacidades actuales son mucho más limitadas y están orientadas a tareas predefinidas, como limpiar código existente.
En una demostración en vivo, Forbes le pidió a Devin crear una app para afinar guitarras. La herramienta generó la app en unos 10 minutos, pero no logró identificar correctamente las notas musicales reproducidas en la prueba, y los fundadores de Cognition no supieron explicar el motivo. "Siempre existe una brecha entre las expectativas de lo que es posible y lo que funciona de manera confiable", afirmó Varun Mohan, CEO de la startup rival Codeium.
Wu reconoció que Devin está lejos de ser perfecto. "La ingeniería de software en el mundo real es un verdadero desorden", comentó desde la sede de Founders Fund, con vista a la bahía de San Francisco. "Los humanos cometen errores en el código todo el tiempo", afirmó. Sin embargo, varios detractores admitieron estar impresionados con las habilidades de la herramienta. Según Wu, Devin mejoró significativamente en los siete meses desde su lanzamiento, en parte gracias al feedback de los primeros clientes empresariales, quienes aceptaron al agente como un proyecto en desarrollo. "No vemos la herramienta como algo que deba ser mágico", señaló Vitor Olivier, CTO de Nubank. "Somos cautelosamente optimistas", completó. En algunos casos, aseguró, los ingenieros que usaron Devin fueron ocho veces más rápidos en sus tareas.
Cognition sigue experimentando. A principios de este año, le dio a Devin la capacidad de lanzar IA subordinadas para ayudarlo. Sin embargo, al probar este nuevo modo "manager", descubrieron que los sub-Devin creaban sus propios subordinados, que a su vez generaban aún más, creando un vasto y eterno ciclo de burocracia artificial. "Al final tuvimos que cancelar la tarea porque no dejaban de delegar el trabajo", comentó Kaplan.
A pesar de esto, Kaplan señaló que la herramienta funciona mejor cuando varios Devins trabajan simultáneamente en diferentes proyectos, como un "ejército de ingenieros junior". Esta descripción probablemente incomode a algunas personas que se dedican a programar, y Wu admite que parte de la negatividad hacia Cognition proviene de la ansiedad sobre si la IA reemplazará los empleos en ingeniería de software. Devin, según Wu, podría permitir a las empresas abordar más proyectos, contratando humanos para realizar el trabajo más significativo.
"Realmente hay mucho miedo ahí afuera", afirmó. "La gente tiene muchas preguntas sobre lo que pasará en este nuevo paradigma", declaró.
*Con información de Forbes US.