Forbes Ecuador
Mujer conectada a MEG (Ilustración)
Innovacion

Cómo es Brain2Qwerty, el lector de mentes de Meta que traduce pensamientos en texto

Luis E. Romero

Share

Diseñada para facilitar la comunicación de personas con dificultades motoras o del habla, esta tecnología no invasiva utiliza inteligencia artificial para interpretar señales cerebrales mientras los usuarios escriben en un teclado.

19 Febrero de 2025 10.44

En un silencioso laboratorio de España, 35 voluntarios pasaron horas escribiendo oraciones mientras una máquina de media tonelada registraba su actividad cerebral. Este montaje en el Centro Vasco sobre Cognición, Cerebro y Lenguaje dio lugar a Brain2Qwerty, el proyecto de neurociencia más ambicioso de Meta hasta la fecha.

El invento es una interfaz cerebro-computadora (BCI, por sus siglas en inglés) no invasiva que decodifica oraciones a partir de la actividad neural registrada mediante electroencefalografía (EEG) o magnetoencefalografía (MEG). 

Detallado en la publicación de investigación de Meta, el sistema representa un avance en las tecnologías de comunicación asistida, particularmente para personas con dificultades en el habla o movilidad. Al traducir las señales cerebrales en texto mientras los usuarios escriben en un teclado QWERTY, Brain2Qwerty reduce la brecha entre los implantes neurales invasivos y las alternativas no invasivas.

La arquitectura: una red neuronal de tres etapas

La innovación de Brain2Qwerty radica en su arquitectura híbrida de aprendizaje profundo, que combina redes neuronales convolucionales (CNNs), modelos de transformadores y un módulo de lenguaje preentrenado. La capa de CNN extrae características espaciales y temporales de los datos brutos de EEG/MEG, identificando patrones vinculados a la actividad motora durante la escritura.

Luego, estas señales son procesadas por un módulo transformador que contextualiza las secuencias, prediciendo palabras o frases en lugar de caracteres aislados. Finalmente, un modelo de lenguaje refina la salida corrigiendo errores y alineando las predicciones con probabilidades lingüísticas, similar a un autocorrector cerebral (Meta AI, 2025).

Este enfoque de múltiples etapas se diferencia de los métodos BCI más antiguos, que dependían de estímulos externos o movimientos imaginados. En cambio, Brain2Qwerty aprovecha procesos motores naturales, reduciendo la carga cognitiva y permitiendo un uso más intuitivo.

chip cerebro neuronal
La innovación de Brain2Qwerty radica en su arquitectura híbrida de aprendizaje profundo, que combina redes neuronales convolucionales (CNNs), modelos de transformadores y un módulo de lenguaje preentrenado.

Los primeros ensayos con 35 participantes saludables, quienes escribieron oraciones memorizadas como "el procesador ejecuta la instrucción", demostraron que el sistema puede aprender firmas neuronales individuales para cada pulsación de tecla, incluso corrigiendo errores tipográficos en tiempo real, una señal de que captura tanto la intención motora como la cognitiva.

El plano lingüístico del cerebro: del pensamiento contextual al texto escrito

Los hallazgos de Brain2Qwerty arrojan luz sobre la naturaleza jerárquica de la producción del lenguaje en el cerebro. Los investigadores descubrieron una clara neurojerarquía: antes de producir cada palabra, el cerebro primero representa su contexto, luego carga su significado y, finalmente, representa sílabas y letras.

Esta secuencia de activaciones de arriba hacia abajo precede la producción de palabras, con representaciones contextuales emergiendo primero, seguidas por representaciones a nivel de palabra, sílaba y letra. Al encadenar estos elementos, el cerebro transforma los pensamientos en comunicación de manera fluida. Este proceso jerárquico se alinea con teorías lingüísticas de larga data y proporciona una visión sin precedentes sobre la dinámica neuronal de la producción del lenguaje.

Métricas de rendimiento y limitaciones

Si bien Brain2Qwerty marca un avance, su precisión depende de la tecnología de imagen utilizada. La decodificación basada en MEG logró un 32% de tasa de error por carácter (CER, por sus siglas en inglés) en promedio, con los mejores participantes alcanzando un 19% CER. Sin embargo, el EEG tuvo un rendimiento inferior, con un 67% CER debido a su menor resolución espacial. Para contexto, los transcriptores humanos profesionales tienen un promedio de 8% CER, mientras que los sistemas invasivos como Neuralink reportan tasas inferiores al 5%.

Estos resultados subrayan la superioridad del MEG, pero también destacan sus desafíos. La máquina actual de Meta, construida con MEG, cuesta 2 millones de dólares y pesa 500 kg, lo que la hace poco práctica para el uso diario.

Además, Brain2Qwerty procesa oraciones solo después de su finalización, en lugar de hacerlo en tiempo real, lo que limita su utilidad en aplicaciones prácticas como la conversación fluida. El estudio también excluyó a personas con discapacidades motoras, dejando abierta la cuestión de su adaptabilidad a pacientes con síndrome de enclaustramiento o enfermedades neurodegenerativas.

Ética, accesibilidad y el camino a seguir

Meta enfatiza que Brain2Qwerty solo decodifica pulsaciones de teclas intencionadas, y no pensamientos sin filtrar, una distinción crucial para la privacidad. Sin embargo, a medida que las BCI evolucionan, los marcos éticos deben abordar la seguridad de los datos y el consentimiento, especialmente si se considera su comercialización. Por ahora, el enfoque de Meta sigue centrado en la investigación, incluyendo el 'aprendizaje por transferencia' para adaptar modelos a nuevos usuarios y colaboraciones para integrar Brain2Qwerty con modelos de lenguaje de gran escala como GPT-4 o arquitecturas similares para la decodificación semántica.

Meta
 Por ahora, el enfoque de Meta sigue centrado en la investigación, incluyendo el 'aprendizaje por transferencia' para adaptar modelos a nuevos usuarios y colaboraciones para integrar Brain2Qwerty con modelos de lenguaje de gran escala como GPT-4 o arquitecturas similares para la decodificación semántica.

La miniaturización del hardware es otra prioridad. Prototipos portátiles de MEG podrían democratizar el acceso, mientras que configuraciones híbridas con EEG podrían equilibrar costo y precisión. A nivel clínico, combinar Brain2Qwerty con sistemas de seguimiento ocular o gestuales podría ofrecer soluciones multimodales para pacientes. Como señalan los investigadores, el objetivo no es reemplazar las BCI invasivas, sino ampliar las opciones para quienes no pueden o no desean someterse a cirugía.

Brain2Qwerty es un hito en la neurotecnología no invasiva, pero su impacto en el mundo real aún está lejos. Cerrar la brecha de rendimiento con los métodos invasivos, garantizar un acceso equitativo y navegar los desafíos éticos requerirá colaboración interdisciplinaria. Sin embargo, para millones de personas que esperan soluciones de comunicación, esta interfaz impulsada por inteligencia artificial representa una señal de esperanza y un futuro en el que los pensamientos puedan trascender los límites físicos.

 

*Con información de Forbes US

10