En Huggingface la comunidad de coders que trabajan con los modelos de inteligencia artificial open source no paraban de festejar. Finalmente Google, siguió a Meta y otros líderes de la industria y liberó Gemma. Es todo un cambio para una empresa que fue criticada recientemente por su tecnología de IA cerrada por otros actores del sector que defienden la colaboración abierta en la investigación de la IA.
Los modelos ligeros se basan en la investigación y la tecnología utilizadas para construir Gemini, el modelo lingüístico de marquesina de Google que compite con ChatGPT de OpenAI.
“Es fantástico ver a Google reforzar su compromiso con la IA de código abierto y estamos entusiasmados de apoyar plenamente el lanzamiento con una integración integral en Hugging Face”, señala Philip' Schmid, uno de los espacialistas de la plataforma.
Gemma viene en dos tamaños: parámetros 7B, para una implementación y desarrollo eficientes en GPU y TPU de tamaño de consumidor, y versiones 2B para CPU y aplicaciones en el dispositivo. Ambos vienen en variantes básicas y ajustadas a las instrucciones.
“Hemos colaborado con Google para garantizar la mejor integración en el ecosistema de Hugging Face. Puede encontrar los 4 modelos de acceso abierto (2 modelos básicos y 2 ajustados) en el Hub”, apunta Schimid.
Al tratarse de modelos que pueden ejecutarse directamente en notebook y computadoras de escritorio, se espera que desarrolladores e investigadores construyan aplicaciones, de forma similar a lo que realizan con el modelo LLaMA 2 de Meta.
El debut de Gemma como un tipo de modelo de IA más abierto es una especie de anomalía en la reciente estrategia de IA de Google, que generalmente se inclina hacia el acceso cerrado. Eso la transformó en un actor polarizador en el actual debate sobre la IA en la investigación abierta y cerrada.
A un lado del pasillo están empresas como Meta, Hugging Face y Mistral que abogan por el acceso de código abierto, en el que las empresas publican el código fuente de un modelo y lo hacen ampliamente disponible en nombre de la colaboración y el progreso científicos.
En el otro lado están empresas como Google y OpenAI (a pesar de su nombre) que abogan por un entorno cerrado y estrictamente controlado que, según argumentan, reduce los riesgos de seguridad y puede evitar más fácilmente los abusos.
Google no llegó a publicar Gemma como un sistema de código abierto, sino que se refirió a él como un "modelo abierto". Eso significa que los "pesos" del modelo, o parámetros preentrenados, están disponibles, pero no el código fuente real ni los datos de entrenamiento, dijo la portavoz de Google, Jane Park.
Otras empresas de IA, como Mistral, también tienen modelos de pesos abiertos.
Google dijo que el modelo Gemma estará disponible para "uso comercial responsable y distribución para todas las organizaciones, independientemente de su tamaño". ¿Significa esto que OpenAI podría crear una variante y publicarla? Cuando se le preguntó, Park respondió: "Se aplicarían los mismos términos".
Cuando Google publicó la semana pasada la versión más reciente de Gemini, llamada Gemini 1.5, la empresa sólo puso el software a disposición de los desarrolladores y los clientes de la nube de Google; por ahora está cerrado al público en general.
Gemma es diferente. Y eso puede sugerir una estrategia de ampliación para Google, cuyo enfoque cerrado provocó la ira de varios defensores del código abierto, entre los que destaca Meta. "Cada vez se están convirtiendo en menos abiertos", declaró a Forbes en noviembre el científico jefe de Meta, Yann LeCun. "Creo que va a retrasar el progreso en todo el campo".
Demis Hassabis, que dirige Google DeepMind, se opuso en el pasado a LeCun, acusándole de "alarmismo" en sus llamadas a la regulación de la IA. Hassabis también argumentó que un enfoque cerrado es adecuado porque las empresas necesitan gestionar los riesgos antes de que los sistemas se conviertan en peligrosos. Como parte del lanzamiento de Gemma el martes, Google también publicó una API con herramientas y guías para construir de forma segura con el modelo.
Entonces, ¿qué tan buenos son los modelos Gemma? “Gemma 7B es un modelo realmente potente, con un rendimiento comparable al de los mejores modelos en el peso 7B, incluido el Mistral 7B. Gemma 2B es un modelo interesante para su tamaño, pero no obtiene una puntuación tan alta en la clasificación como los modelos más capaces con un tamaño similar, como Phi 2. Esperamos recibir comentarios de la comunidad sobre su uso en el mundo real”, concluyen en Hugginface.
* Con información de Forbes US.