La IA ya ha demostrado su poder para revolucionar las industrias y acelerar la investigación científica. Uno de los campos de investigación de la IA que ha logrado avances asombrosos es el de los modelos fundacionales y la IA generativa, que permite a las computadoras generar contenidos originales a partir de los datos de entrada. Esta tecnología se ha utilizado para crear desde música y arte hasta noticias falsas.
OpenAI mostró recientemente las impresionantes capacidades de la inteligencia artificial ofreciendo acceso gratuito a ChatGPT, un modelo transformador generativo de última generación. La medida generó una gran atención mediática y entusiasmo entre los usuarios, poniendo de relieve el enorme potencial de la IA. Esta demostración se produjo sólo tres meses después del lanzamiento de ChatGPT al público.
Ante el impacto disruptivo del modelo GPT-3 de OpenAI, Google y Microsoft se vieron obligados a revelar los planes de integración de la IA en sus respectivos motores de búsqueda. La demostración de las capacidades prácticas y potentes de la IA por parte de OpenAI aumentará sin duda las expectativas del público y la demanda de productos de IA más avanzados en el futuro. El movimiento de OpenAI ha desencadenado una de las disrupciones más rápidas y significativas en un segmento de la industria que jamás se hayan presenciado.
Es universalmente reconocido que la vida humana es de vital importancia. En este artículo, arrojamos luz sobre el potencial de la IA para salvar vidas examinando sus aplicaciones prácticas en la creación de nuevos antibióticos y otras herramientas científicas de IA.
El uso innovador de los modelos fundacionales y la IA generativa tiene la capacidad de aumentar los ingresos, optimizar los procesos y agilizar la creación y acumulación de conocimientos, pero también tiene el potencial de salvar millones de vidas en todo el mundo.
Este debate pretende aumentar la visibilidad de la importancia del potencial de la IA para salvar vidas y destacar la necesidad de ampliar su desarrollo e implantación en estos ámbitos.
De simples algoritmos a avances revolucionarios
La inteligencia artificial (IA) tuvo unos comienzos bastante sencillos en la década de 1950. Se trataba de algoritmos sencillos y modelos matemáticos diseñados para tareas específicas. Mucho más tarde, en la década de 1990, la investigación en IA experimentó un gran cambio hacia los algoritmos de aprendizaje automático que permitían a los ordenadores mejorar su rendimiento analizando patrones en los datos y transfiriendo ese conocimiento a nuevas aplicaciones.
Este cambio dio lugar a numerosos avances en el campo, incluido el desarrollo de algoritmos de aprendizaje profundo que revolucionaron áreas como la visión por ordenador y el procesamiento del lenguaje natural (PLN). Estos avances han dado lugar a nuevos logros y han ampliado aún más el potencial de la IA.
En la actualidad, los investigadores de la IA siguen superando los límites mediante el desarrollo de nuevos algoritmos y modelos capaces de abordar tareas cada vez más complejas. La IA y el tamaño de los modelos siguen evolucionando a un ritmo sin precedentes, produciendo respuestas más parecidas a las humanas y ampliando la gama de tareas que puede realizar. Se siguen haciendo grandes avances y aplicaciones en áreas como el procesamiento del lenguaje natural (PLN), la visión por ordenador y la robótica.
A pesar de sus limitaciones y retos, la IA ha demostrado ser una fuerza transformadora en un amplio abanico de industrias y campos, como la sanidad, las finanzas, el transporte y la educación.
Investigación puntera en IA por un inventor maestro de IBM
IBM cuenta con uno de los programas de investigación sobre IA más grandes y mejor financiados del mundo y hace poco tuve la oportunidad de hablar de su programa con la Dra. Payel Das, miembro principal del personal de investigación y gerente de IBM Research, que es también un inventor maestro de IBM.
La Dra. Das ha sido profesora en el departamento de Física Aplicada y Matemáticas Aplicadas (APAM) de la Universidad de Columbia. Actualmente es miembro del consejo asesor de la AMS en la Universidad Stony Brook. Se licenció en el Presidency College de Calcuta (India) y obtuvo un máster en el Instituto Indio de Tecnología de Chennai (India). Se doctoró en biofísica teórica en la Universidad Rice de Houston, Texas. Además es coautora de más de 40 publicaciones revisadas por pares. También ha recibido premios del Centro Belfer de Harvard TAPP 2021 y del IEEE open source 2022. Tiene varios premios de IBM, entre ellos el Premio al Logro Técnico Sobresaliente de IBM (el mayor premio técnico de IBM), dos Premios de la División de Investigación de IBM, un Premio a la Eminencia y la Excelencia de IBM y dos Premios al Logro de Invenciones de IBM.
Como miembro del departamento de IA fiable y líder de IA generativa dentro de IBM Research, la Dr. Das se centra actualmente en el desarrollo de nuevos algoritmos, métodos y herramientas para desarrollar sistemas de IA generativa que se crean a partir de modelos fundacionales. Su equipo también está trabajando en el uso de datos sintéticos para que los modelos de IA sean más fiables y para garantizar la imparcialidad y la solidez en las aplicaciones posteriores de la IA.
El poder de los datos sintéticos y cómo hacen avanzar la IA
En nuestra era impulsada por los datos, los datos sintéticos se han convertido en una herramienta indispensable para probar y entrenar los modelos de IA. Esta información generada por ordenador es rentable de producir, viene con etiquetado automático y evita muchos de los retos éticos, logísticos y de privacidad asociados con el entrenamiento de modelos de aprendizaje profundo en datos del mundo real.
Los datos sintéticos son fundamentales para las aplicaciones empresariales, ya que ofrecen soluciones cuando los datos reales son escasos o inadecuados. Una de las principales ventajas de los datos sintéticos es su capacidad para ser generados en grandes cantidades, lo que los hace ideales para el entrenamiento de modelos de IA. Además, los datos sintéticos pueden diseñarse para abarcar una amplia gama de variaciones y ejemplos, lo que conduce a una mejor generalización y utilidad del modelo. Estos atributos convierten a los datos sintéticos en una herramienta indispensable para el avance de la IA y sus aplicaciones en el mundo real.
Es crucial que los datos sintéticos generados se adhieran a los controles definidos por el usuario para garantizar que sirven al propósito previsto y minimizar los riesgos potenciales. Los controles específicos necesarios varían en función de la aplicación prevista y el resultado deseado. Asegurarse de que los datos sintéticos se ajustan a estos controles es esencial para garantizar su eficacia y seguridad en las aplicaciones del mundo real.
Transformar el futuro con modelos de representación universales
Los primeros modelos de IA utilizaban redes neuronales de avance, que resultaban eficaces para modelar datos no secuenciales. Sin embargo, no estaban equipadas para manejar datos secuenciales. Para superar esta limitación, en la década de 1990 se desarrollaron las redes neuronales recurrentes (RNN), pero no fue hasta alrededor de 2010 cuando se generalizó su aplicación.
Este gran avance tecnológico amplió las capacidades de la IA para procesar datos secuenciales y allanó el camino para nuevos avances en este campo. Después, otro tipo de modelo de IA, llamado transformador, mejoró radicalmente las capacidades de la IA.
El transformador se presentó por primera vez en un documento de investigación de Google de 2017 que proponía un nuevo tipo de arquitectura de red neuronal. Los transformadores también incorporaban mecanismos de autoatención que permitían a los modelos centrarse en las partes relevantes de una entrada y realizar predicciones más precisas.
El mecanismo de autoatención es una característica definitoria que diferencia a los transformadores de otras arquitecturas codificador-decodificador. Este mecanismo resulta especialmente beneficioso en el procesamiento del lenguaje natural, ya que permite al modelo captar las relaciones entre las palabras de una frase y reconocer las dependencias a largo plazo.
El transformador lo consigue asignando pesos a cada elemento de la secuencia, en función de su relevancia para la tarea. De este modo, el modelo puede dar prioridad a las partes más cruciales de la entrada, lo que da lugar a predicciones o decisiones más conscientes del contexto e informadas. La integración de mecanismos de autoatención ha hecho avanzar enormemente las capacidades de los modelos de IA en el procesamiento del lenguaje natural.
Según la Dr. Das, en los últimos años se ha producido un alejamiento de las RNN como arquitectura principal para las tareas de procesamiento del lenguaje natural. Las RNN pueden ser difíciles de entrenar y pueden sufrir problemas de gradiente evanescente, lo que puede dificultar el aprendizaje de dependencias a largo plazo en los datos lingüísticos. Por el contrario, los transformadores han demostrado ser más eficaces a la hora de lograr resultados de vanguardia en diversas tareas de procesamiento del lenguaje natural.
Liberar el poder de los modelos fundacionales
Los modelos que se entrenan utilizando datos a gran escala y técnicas de autosupervisión pueden producir una representación universal que no es específica de ninguna tarea concreta. A continuación, esta representación puede utilizarse en varias otras aplicaciones con pocos o ningún ajuste adicional.
Estos modelos se denominan "modelos fundacionales", un término utilizado por la Universidad de Stanford en un trabajo de investigación de 2021. Muchos de los modelos fundacionales actuales adoptan la arquitectura de transformadores y han demostrado su versatilidad en una amplia gama de tareas de procesamiento del lenguaje natural (PLN). Esto se debe a su preentrenamiento en vastos conjuntos de datos, lo que da lugar a potentes modelos de aprendizaje automático listos para su despliegue. El uso de modelos fundacionales ha impactado y mejorado enormemente el campo de la PNL.
La Dr. Das y el equipo de investigación de IBM han participado en una gran cantidad de investigaciones sobre IA con modelos fundacionales e IA generativa.
La Dr. Das y el equipo de investigación de IBM han participado en una gran cantidad de investigaciones sobre IA con modelos fundacionales e IA generativa.
El gráfico anterior muestra cómo un modelo fundacional puede utilizarse para construir modelos para distintos campos utilizando texto como datos de entrada. Pueden utilizar o no una arquitectura de transformadores. En la parte izquierda del gráfico, se muestra un gran modelo lingüístico que mapea progresivamente letras a palabras a frases y finalmente a lenguaje.
Es crucial señalar que la arquitectura de transformadores es adaptable a una gran variedad de campos, siempre que los datos de entrada puedan expresarse en forma textual. Esta versatilidad convierte a la arquitectura de transformadores en una valiosa herramienta para crear modelos de aprendizaje automático en muchos dominios.
Superar los límites de la creatividad con la IA generativa
Los modelos generativos tienen la capacidad de crear imágenes, audio o texto nuevos y únicos para una gran variedad de aplicaciones. Estos modelos también han permitido que los sistemas de IA sean más eficaces a la hora de procesar datos complejos y han estrenado nuevas posibilidades para utilizar la IA en una amplia gama de aplicaciones.
Los modelos básicos sirven de base sólida para crear modelos generativos debido a su capacidad para manejar y aprender de grandes cantidades de datos. Ajustando los parámetros de estos modelos para que se centren en una tarea específica, como generar imágenes o texto, se pueden crear nuevos modelos generativos de IA que produzcan contenidos únicos dentro de campos específicos.
En la parte derecha del gráfico se muestra un modelo transformador de química, que conecta los átomos con las moléculas y con la química. El mismo concepto podría aplicarse para construir modelos de base para la biología u otros campos relacionados, representando las moléculas biológicas o químicas como texto.
A modo de ilustración, si el objetivo es desarrollar un modelo generativo de IA para el arte, primero se entrenaría un modelo fundacional preentrenado en una vasta colección de imágenes de arte. Una vez entrenado con éxito, podría utilizarse para producir piezas de arte novedosas y originales. Arriba se muestra una muestra de arte creada por un programa de IA llamado Dall.E2 en respuesta a una solicitud en la que se le pedía que generara un retrato pintado de un rostro humano, según la percepción de la IA.
Superar el reto de los datos pequeños en la IA generativa
"Cuando empezamos a trabajar en la IA generativa", dijo la Dr. Das, "se nos ocurrió que uno de nuestros problemas era el aprendizaje a partir de datos pequeños para cualquier aplicación específica de un dominio o de una industria".
A pesar de los retos que plantean los conjuntos de datos pequeños para los modelos generativos de IA, para cada uno de los dominios del gráfico anterior, existe una gran cantidad de datos sin etiquetar en las empresas. Estos datos brindan la oportunidad de entrenar modelos fundacionales personalizados, permitiendo la solución de problemas que antes se creían irresolubles. Esto se alinea con el enfoque de IBM Research de analizar las nuevas capacidades de la IA a través de la IA generativa y de ampliar los límites de la ciencia de la IA.
Los modelos de IA generativa requieren grandes cantidades de datos para aprender con precisión y generar nuevos datos similares. Cuando se trabaja con conjuntos de datos pequeños, el rendimiento y la utilidad de estos modelos pueden verse limitados. El Dr. Das reconoce este reto y entiende que técnicas como el aprendizaje por transferencia y el aumento de datos pueden ayudar a mejorar su rendimiento en estas situaciones.
Amplia investigación en IA generativa
IBM ha realizado importantes contribuciones en cada uno de los dominios representados en la imagen. Su trabajo es tan amplio que resulta difícil abarcar todos sus logros en un solo artículo.
Sintetizar antimicrobianos con IA generativa
La IA tiene el potencial de revolucionar diversos campos y acelerar el progreso científico. Como ejemplo, la Dra. Das y su equipo de investigación han aprovechado la IA para desarrollar antimicrobianos innovadores para luchar contra las bacterias letales resistentes a los antibióticos.
La lucha contra las superbacterias
Los antibióticos se utilizaron por primera vez para tratar infecciones graves en la década de 1940. Desde entonces, los antibióticos han salvado millones de vidas y han transformado la medicina moderna. Sin embargo, los CDC calculan que cada año se prescriben unos 47 millones de tratamientos con antibióticos para infecciones que no los necesitan.
El uso excesivo de antibióticos es un problema crítico porque contribuye al desarrollo de infecciones resistentes a los antibióticos causadas por bacterias comunes como la E. coli y el estafilococo, así como por bacterias más peligrosas y raras como el SARM. Estas infecciones resistentes son difíciles de tratar y pueden tener consecuencias graves como la sepsis, el mal funcionamiento de los órganos y la muerte.
Cuando los antibióticos tradicionales ya no son capaces de eliminar eficazmente las bacterias, resulta mucho más difícil o incluso imposible tratar y controlar las infecciones. Estas bacterias resistentes a los antibióticos -comúnmente denominadas superbacterias- pueden propagarse rápidamente y causar infecciones graves, sobre todo en hospitales y otros centros sanitarios. Las superbacterias también pueden encontrarse en el medio ambiente, en los alimentos y en las superficies, y además pueden transmitirse de persona a persona.
Se trata de un grave problema sanitario mundial. Las enfermedades resistentes a los medicamentos matan a 700.000 personas al año en todo el mundo; para 2050, se prevé que esa cifra aumente hasta los 10 millones de muertes anuales.
Cómo las bacterias burlan a los antibióticos
Las bacterias y los virus se transforman en superbacterias mediante la activación de estrategias de defensa innatas que hacen que los antibióticos resulten ineficaces. Estos mecanismos de defensa pueden implicar procesos físicos, químicos o biológicos que protegen a los gérmenes y les permiten escapar o contrarrestar el peligro para su existencia. Dichos procesos pueden producir enzimas que inactivan los antibióticos, alterar la pared celular bacteriana haciendo que el organismo responda menos a los fármacos o permitir que las bacterias obtengan información genética de otras bacterias que poseen inmunidad inherente a los antibióticos.
Agilizar el desarrollo de fármacos con la IA
El método convencional de creación de un nuevo fármaco antimicrobiano es una empresa larga y costosa, que suele llevar muchos años y una fuerte suma de dinero antes de que pueda estar disponible comercialmente. Pero los recientes avances en Inteligencia Artificial (IA) están revolucionando el proceso de descubrimiento y desarrollo de fármacos.
Al utilizar la capacidad de la IA para generar y evaluar numerosos posibles fármacos candidatos, los investigadores pueden señalar rápidamente las opciones más prometedoras y concentrar sus esfuerzos en ellas. Esto agiliza el proceso de desarrollo de fármacos, reduciendo el tiempo y los costes que conlleva y conduciendo a la producción de medicamentos antimicrobianos más eficaces a un ritmo más rápido.
En un esfuerzo de colaboración entre la Dra. Das y su equipo de IBM, así como otras organizaciones, llevaron a cabo un estudio para encontrar soluciones innovadoras al problema de la resistencia a los antimicrobianos. El estudio utilizó la IA para sintetizar y evaluar 20 diseños únicos de péptidos antimicrobianos, elegidos entre un conjunto de 90.000 secuencias.
El equipo probó estos diseños contra una amplia gama de bacterias gramnegativas y grampositivas, lo que condujo a la identificación de seis fármacos candidatos con éxito. La toxicidad de estos candidatos se evaluó además tanto en un modelo de ratón como en un tubo de ensayo.
Los modelos de IA se diseñaron específicamente para combatir la resistencia a los antibióticos, incorporando controles de eficacia de amplio espectro y baja toxicidad, y frenando la aparición de resistencias. Este enfoque pretendía crear soluciones eficaces que no sólo lucharan contra las bacterias resistentes, sino que también minimizaran el riesgo de efectos secundarios nocivos y evitaran que se desarrollara una mayor resistencia.
Éxito impulsado por la IA
La Dr. Das expresó su entusiasmo por el éxito del diseño, señalando que encarna muchas de las características buscadas que se esperan en la próxima generación de fármacos candidatos. La ilustración adjunta esboza el plan y la duración estimada del uso de la IA para acelerar el proceso de diseño de antimicrobianos, que puede lograrse en tan sólo un mes y medio, significativamente más rápido que el método convencional que lleva varios años.
Los investigadores de IBM han aprovechado el poder de la IA generativa para agilizar el desarrollo de nuevos fármacos antimicrobianos. Además, han utilizado la IA para crear herramientas valiosas, como MolFormer y MolGPT, para predecir las propiedades de las moléculas químicas, lo que desempeña un papel crucial en diversos campos, como el descubrimiento de fármacos y el diseño de materiales.
El uso de la IA para acelerar el descubrimiento de nuevos fármacos antimicrobianos ha demostrado ser un revulsivo, ya que ofrece ventajas evidentes como una mayor rapidez y una reducción de los gastos. Además, los modelos de IA ofrecen un enfoque más racionalizado al dirigir la atención de los investigadores hacia las pistas más prometedoras. Además, la IA generativa permite a los científicos diseñar compuestos farmacológicos innovadores que presentan características únicas y una eficacia elevada en comparación con los fármacos existentes.
Conclusión
La IA generativa ha captado la atención de diversas industrias, como la musical, la artística, la sanitaria y la farmacéutica, como uno de los avances más emocionantes de la IA en los últimos tiempos. A pesar de sus limitaciones y desafíos, la IA sigue demostrando su potencial para revolucionar distintos campos.
Con el reciente revuelo en torno al ensayo GPT-3 de OpenAI y los desarrollos posteriores de Google y Microsoft, es probable que no sólo veamos un aumento de los productos impulsados por la IA en el próximo año, sino que espero que se produzcan nuevas disrupciones. Algunas pueden ser triviales, pero la esperanza es que muchas presenten integraciones significativas de la IA que sean beneficiosas para los mercados.
Traducción: Nicola´s Della Vecchia.