A esta altura del año pasado, publicamos una lista con 10 predicciones sobre lo que sucedería en el mundo de la inteligencia artificial en 2024. Para ser transparentes, y con el 2024 llegando a su fin, volvamos a revisar esas predicciones para ver cómo se desarrollaron en la realidad. Hay mucho que aprender de estas retrospectivas sobre el estado actual de la inteligencia artificial.
Predicción 1: Nvidia aumentará drásticamente sus esfuerzos para convertirse en un proveedor de servicios en la nube.
Resultado: Correcto
Nvidia invirtió fuertemente para expandir su oferta de DGX Cloud en 2024, casi triplicando su gasto trimestral en servicios en la nube y dejando en claro que esta es una prioridad estratégica. Ahora presenta casos de éxito de varios clientes satisfechos con su oferta de nube enfocada en inteligencia artificial, desde Amgen hasta Deloitte y ServiceNow.
Por ahora, Nvidia ofrece su servicio en colaboración con los principales proveedores de la nube: Amazon Web Services, Google Cloud Platform, Microsoft Azure y Oracle Cloud Infrastructure. Pero no te equivoques: aunque hoy Nvidia y los proveedores de nube dependen mucho unos de otros, estas gigantes están cada vez más en rumbo de colisión competitiva.
Es probable que Nvidia busque eliminar intermediarios al ofrecer sus chips directamente a los clientes, en lugar de depender de los proveedores de nube como intermediarios. Mientras tanto, Amazon, Google y Microsoft están desarrollando sus propios chips de inteligencia artificial para reducir su dependencia con Nvidia y competir más directamente con ella.
Será fascinante ver cómo evoluciona esta relación de "amigos y enemigos" en los próximos años.
Predicción 2: Stability AI cerrará.
Resultado: Incorrecto
El 2024 comenzó complicado para Stability AI. El CEO y fundador Emad Mostaque fue desplazado en marzo. Varias figuras clave, incluido el investigador estrella Robin Rombach, dejaron la empresa en ese momento, lo que llevó a describirla como "totalmente vaciada" y "en caída libre". En abril, se realizaron despidos masivos.
Todo parecía indicar que esta predicción se cumpliría.
Sin embargo, la empresa no cerró. Durante el verano, contrató un nuevo CEO, consiguió una ronda de financiamiento y logró que sus proveedores de nube perdonaran cientos de millones de dólares en deudas. Incluso convencieron al legendario cineasta James Cameron de unirse a su directorio.
Aunque hoy Stability AI no es ni la sombra de lo que fue, sigue operando.
Predicción 3: Los términos "modelos de lenguaje grande" y "LLM" serán menos comunes.
Resultado: Incorrecto
Incluso Andrej Karpathy estuvo de acuerdo con nuestra postura. En un tuit reciente, escribió: "Es un poco triste y confuso que los 'Grandes Modelos de Lenguaje' tengan poco que ver con el lenguaje; es simplemente histórico. Son una tecnología de propósito muy general para el modelado estadístico de flujos de tokens. Un nombre mejor sería Transformadores Autorregresivos o algo así. No les importa si los tokens representan pequeños fragmentos de texto. También podrían ser pequeños parches de imagen, fragmentos de audio, opciones de acción, moléculas o lo que sea".
Coincidimos. Como argumentamos el año pasado, seguimos creyendo que "modelo de lenguaje grande" no es el término más adecuado para describir los modelos actuales de inteligencia artificial.
Sin embargo, la realidad es que los términos "modelo de lenguaje grande" y "LLM" no dejaron de ser ampliamente usados en 2024. Tal vez en 2025 la terminología se alinee mejor con la tecnología.
Predicción 4: Los modelos cerrados más avanzados continuarán superando por un margen significativo a los abiertos.
Resultado: Correcto
El lanzamiento de los modelos Llama 3 de Meta, de código abierto y última generación, este año, junto con los persistentes retrasos en la llegada de GPT-5 de OpenAI, podría haber llevado a pensar que la brecha de rendimiento entre los modelos cerrados y abiertos se está cerrando.
Entonces llegó o1. o1, el nuevo modelo de razonamiento de OpenAI, abrió un panorama completamente nuevo en la investigación de inteligencia artificial.
En su influyente ensayo de 2019, The Bitter Lesson, Rich Sutton destacó "el gran poder de los métodos de propósito general, métodos que continúan escalando con el aumento de la computación disponible, incluso cuando esta se vuelve muy grande". También argumentó que "los dos métodos que parecen escalar de manera arbitraria son la búsqueda y el aprendizaje".
Antes de o1, los modelos de vanguardia en IA dependían en gran medida del segundo método, dejando de lado el primero. o1 cambió esto. En lugar de mejorar la IA mediante la escala masiva del aprendizaje durante el entrenamiento, o1 introduce un nuevo paradigma: escalar masivamente la búsqueda durante la inferencia.
Debido a su novedad, el impacto total de o1 aún no se comprende ampliamente. Sin embargo, marcará profundamente la trayectoria de la inteligencia artificial en los próximos años.
Es cierto que ya han surgido alternativas de código abierto a o1 pocos meses después de su lanzamiento, incluidas algunas, como QwQ-32B-Preview de Alibaba, que parecen igualar a o1 en rendimiento.
Esto no es sorprendente y no cambia el hecho de que las innovaciones realmente disruptivas en IA siguen surgiendo de los laboratorios cerrados. Como escribimos el año pasado: "Como en muchos otros campos, alcanzar la frontera como seguidor rápido, después de que otro grupo la haya definido, es más fácil que establecer una nueva frontera antes de que alguien demuestre que es posible. Por ejemplo, fue considerablemente más arriesgado, desafiante y costoso para OpenAI construir GPT-4 utilizando una arquitectura de mezcla de expertos, cuando este enfoque nunca había sido probado a esta escala, que para Mistral seguir los pasos de OpenAI varios meses después con su propio modelo de mezcla de expertos".
Predicción 5: Varias empresas del Fortune 500 crearán un nuevo puesto en su C-suite: Chief AI Officer.
Resultado: Correcto
En 2024, organizaciones como Eli Lilly, Morgan Stanley, Qualtrics y Accenture Federal Services anunciaron la creación del rol de Chief AI Officer (o equivalente), designando líderes para supervisar sus esfuerzos en inteligencia artificial.
Dado que la estrategia en IA sigue siendo una prioridad para prácticamente todas las empresas, es probable que veamos a más compañías sumándose a esta tendencia en 2025.
Predicción 6: Una alternativa a la arquitectura transformer será adoptada de manera significativa.
Resultado: Correcto
El transformer sigue siendo la arquitectura dominante hoy en día, pero en 2024, como anticipamos, "una arquitectura desafiante rompió el molde y ganó adopción real, pasando de ser una mera novedad de investigación a una alternativa creíble en producción".
Esa alternativa es el modelo de espacio de estados (SSM).
Mamba, el modelo de espacio de estados más destacado, fue descargado cientos de miles de veces en Hugging Face desde su publicación hace aproximadamente un año. Inspiró variantes como Vision Mamba, Mixture-of-Experts Mamba y MambaByte. Por ejemplo, la startup israelí AI21 Labs construyó su modelo insignia, Jamba, sobre la arquitectura Mamba.
Además, Cartesia, una joven empresa surgida del laboratorio de Chris Ré en Stanford, creció significativamente este año gracias a sus modelos generativos de audio basados en SSM, que compiten con líderes de la industria como ElevenLabs y OpenAI debido a su eficiencia, menor latencia y capacidad para manejar entradas extensas.
(Otras arquitecturas desafiantes, como las redes neuronales líquidas, también progresaron este año, pero ninguna alcanzó la adopción práctica que lograron los modelos de espacio de estados).
Predicción 7: Las inversiones estratégicas de los proveedores de nube en startups de IA, y las implicaciones contables asociadas, serán desafiadas por los reguladores.
Resultado: Correcto
Las inversiones de los grandes proveedores de nube en startups de IA enfrentaron un fuerte escrutinio regulatorio este año.
La FTC está investigando las inversiones de Microsoft en OpenAI. En octubre, las autoridades del Reino Unido anunciaron que están analizando la inversión de 2 mil millones de dólares de Google en Anthropic.
Además, los reguladores cuestionaron las inversiones de Amazon en Anthropic y la participación más modesta de Microsoft en Mistral, aunque estas dos últimas ya fueron aprobadas.
Estos análisis regulatorios se centraron más en preocupaciones antimonopólicas que en posibles violaciones contables asociadas con "roundtripping".
Predicción 8: La relación entre Microsoft y OpenAI comenzará a deteriorarse.
Resultado: Correcto
A lo largo de 2024, surgieron noticias que evidencian la creciente tensión y desalineación entre Microsoft y OpenAI. (Un titular reciente del New York Times resumió esto casi como lo predijimos: "La estrecha relación entre Microsoft y OpenAI muestra signos de deterioro").
Ambas empresas compiten cada vez más por vender productos similares de IA a los mismos clientes empresariales. También establecieron acuerdos este año para trabajar con los competidores de la otra, alejándose de su alianza inicial. Microsoft firmó asociaciones con Anthropic, Mistral y Cohere; por su parte, OpenAI anunció una alianza clave con Apple este verano.
Otros conflictos que salieron a la luz en 2024 incluyen disputas por recursos computacionales y la controvertida designación de Mustafa Suleyman, cofundador de DeepMind, como nuevo jefe de IA de Microsoft.
Predicción 9: Parte del entusiasmo y comportamiento de manada que pasó del cripto a la IA en 2023 volverá al cripto en 2024.
Resultado: Incorrecto
El año pasado escribimos: "Las criptomonedas están fuera de moda ahora, pero no te equivoques, se avecina otra gran racha alcista. Por si no lo notaste, después de comenzar el año por debajo de 17.000 dólares, el precio del bitcoin aumentó drásticamente en los últimos meses, desde 25.000 dólares en septiembre hasta superar los 40.000 dólares en la actualidad. Es posible que se esté gestando un importante repunte del bitcoin y, si así fuera, habría mucha actividad y revuelo en torno a las criptomonedas".
Esto resultó acertado. El bitcoin tuvo un ascenso vertiginoso en los últimos meses, superando los 100 mil dólares por primera vez hace tres días. El financiamiento de riesgo volvió a las criptomonedas. Con la salida de Gary Gensler de la SEC y una administración favorable al cripto próxima a asumir, este auge apenas comienza.
Pero calificamos esta predicción como incorrecta porque, aunque el cripto resurgió, el entusiasmo por la IA no se moderó; solo se hizo más intenso.
Predicción 10: Al menos un tribunal de EE. UU. dictaminará que los modelos generativos entrenados con datos de internet violan derechos de autor. El tema comenzará a escalar hasta la Corte Suprema.
Resultado: Incorrecto
Actualmente hay casi tres docenas de demandas en los Estados Unidos sobre si los modelos generativos entrenados con datos de internet violan derechos de autor o si están protegidos por el principio de uso legítimo. Todas las grandes empresas de IA, desde OpenAI hasta Anthropic y Meta, están involucradas en estas litigaciones.
Pero todavía no hubo un fallo significativo en ninguno de estos casos.
Creer que esta predicción se cumpliría en 2024 fue demasiado optimista respecto a la rapidez con la que se mueven los tribunales en EE. UU.
Sin embargo, pronto habrá decisiones importantes. Se esperan fallos de juicio sumario en los próximos meses en dos casos clave, uno contra Nvidia y otro contra la startup legal de IA ROSS Intelligence. Para mediados de 2025, tendremos una mejor idea de hacia dónde se inclinan los tribunales en este tema crítico.
*Con información de Forbes US