OpenAI presentó Sora, su Game Changer para IA generativa de video, y sus competidores aceleran planes

OpenAI, el fabricante de ChatGPT, intensificó la carrera en inteligencia artificial generativa el jueves cuando presentó su herramienta de generación de texto a video, Sora, vista como un paso impresionante pero potencialmente peligroso en la floreciente economía de la inteligencia artificial en medio de preocupaciones sobre la difusión de desinformación.

Sora, desarrollado por OpenAI, respaldado por Microsoft , que también está detrás de los generadores de texto e imágenes ChatGPT y Dall-E, está siendo probado para determinar su seguridad y los expertos en inteligencia artificial dicen que es un avance significativo en las herramientas existentes.

“Que siga el juego”, respondió Cristóbal Valenzuela, cofundador y director ejecutivo de Runway, una empresa de videos de IA que lanzó una actualización Gen-2 de su modelo de video de IA hace apenas unos meses y que ya está disponible para que cualquiera la use.

Stability AI, otro líder en generación de imágenes de IA, presentó el modelo de video generativo Stable Video Diffusion en noviembre, pero dijo que era “exclusivamente para investigación” y que no estaba listo para “aplicaciones comerciales o del mundo real en esta etapa” (hay una lista de espera, sin embargo, aunque la compañía no ha dicho cuándo se lanzará).

Pika Labs, un actor nuevo pero competitivo en video de IA, lanzó su herramienta de video de IA generativa, Pika 1.0, en noviembre y a fines de diciembre anunció que “la lista de espera había terminado” y la puso a disposición de todos.

Google, que lanzó recientemente su modelo de inteligencia artificial de próxima generación Gemini 1.5, reveló clips de investigación y demostración de su modelo Lumiere, aunque no está claro cuándo planea hacer que la herramienta esté disponible públicamente y señaló la necesidad de herramientas sólidas para combatir los prejuicios y el contenido malicioso. para garantizar que su tecnología se pueda implementar de forma segura.

Meta, que cuenta con un conjunto de aplicaciones que incluyen Facebook, Instagram y WhatsApp, lanzó por primera vez una herramienta de generación de videos en 2022, llamada Make-A-Video, que producía contenido notablemente artificial, distorsionado y borroso pero, sin embargo, fue un logro significativo en ese momento.

Google gemini — Gemini la IA multimodal de Google no se sabe si estará a la altura de Sora

Meta adelantó un nuevo modelo de texto a video, Emu Video, a fines del año pasado y dijo que casi todas las personas que lo usaban lo calificaron por encima de Make-A-Video en términos de calidad y fidelidad al mensaje de texto, y aunque no brindó Como indicación de cuándo se lanzará la herramienta, el director ejecutivo Mark Zuckerberg dijo que Emu se integrará en Facebook e Instagram.

La startup de inteligencia artificial xAI de Elon Musk, que espera rivalice con líderes de la industria como DeepMind y OpenAI, no ha anunciado planes para un generador de texto a video, aunque es posible que esta capacidad pueda incorporarse a su chatbot de inteligencia artificial “rebelde”, Grok, en el futuro.

Amazon presentó un avance de un chatbot generativo de IA para trabajadores, Q, y un generador de imágenes de IA , aunque el gigante del comercio electrónico no ha revelado cuándo planea implementar las herramientas o si hay generadores de video más avanzados en camino.

¿Ya se puede usar Sora? No. Sora no está disponible para el público y OpenAI no ha indicado un cronograma de cuándo lo estará. La compañía dijo que "tomará varias medidas de seguridad importantes antes de que Sora esté disponible en los productos de OpenAI", y agregó que está trabajando con expertos en áreas que incluyen información errónea, contenido de odio y prejuicios para probar el modelo.

Mark Zuckerberg - CEO Meta — Mark Zuckerberg, CEO Meta apuesta por su modelo Llama2

La preocupación de OpenAI sobre cómo se pueden utilizar indebidamente sus herramientas de generación de vídeo tiene eco en prácticamente todas las empresas que trabajan en este campo. La capacidad de crear contenido realista y convincente puede ayudar a difundir información errónea peligrosa o material dañino, como contenido pornográfico falso con personas aparentemente reales, contenido abusivo y anuncios incendiarios de políticos y empresas.

En el pasado, muchas de las mayores empresas de redes sociales como Facebook y Twitter, ahora X, han sido acusadas de no hacer lo suficiente para abordar las enormes cantidades de información errónea y discursos de odio en sus plataformas. Y con los avances tecnológicos, los expertos advierten que los riesgos no han hecho más que aumentar. Los riesgos son especialmente graves durante un año electoral que ya es complicado y las empresas están bajo más escrutinio que nunca para erradicar la información errónea.

Los avances en los generadores de vídeo harán que sea más fácil fabricar contenido de vídeo falso, hacerlo más creíble y también hacerlo más difícil de detectar. Ya han surgido escenas e imágenes falsas de Hillary Clinton (que respaldaba de manera inverosímil a Ron DeSantis), el presidente Joe Biden (anunciando un reclutamiento militar) y el expresidente Donald Trump (fue arrestado y perseguido por la policía).

"Eres un mago sama", dijo el fundador y director ejecutivo de Stability, Emad Mostaque, en una publicación en X. El líder tecnológico estaba respondiendo a un video publicado por Altman (sama es el identificador X del CEO de OpenAI) de un video con temática de mago generado por Sora.

*Con Información de Forbes US