OpenAI Presenta Rosalind, un Nuevo Modelo de IA que Podría Acelerar el Descubrimiento de Fármacos

GPT-Rosalind es el primer modelo de dominio específico de OpenAI, desarrollado para el descubrimiento de fármacos y las ciencias de la vida, pero no es para todos.

Por Jose Antonio Lanz

5 min lectura

OpenAI acaba de nombrar su primer modelo de IA especializado en un dominio en honor a Rosalind Franklin, la química británica cuyo trabajo en cristalografía de rayos X ayudó a revelar la doble hélice del ADN, y a quien se le negó el crédito durante su vida.

El modelo de razonamiento GPT-Rosalind, presentado el jueves fue diseñado específicamente para biología, descubrimiento de fármacos y medicina traslacional. Es el primero de lo que OpenAI denomina su serie de modelos Life Sciences, una apuesta directa por un mercado donde numerosos laboratorios especializados, desde universidades hasta Google DeepMind, compiten por posicionarse.

Llevar un medicamento desde el descubrimiento del objetivo hasta la aprobación regulatoria en Estados Unidos toma entre 10 y 15 años en promedio, según expertos. La mayor parte de ese tiempo no se pierde en momentos de genialidad, sino en el trabajo tedioso: analizar miles de artículos, consultar bases de datos, diseñar reactivos e interpretar resultados ambiguos. Esto es lo que GPT-Rosalind intenta resolver.

OpenAI sostiene que el modelo puede comprimir ese trabajo en las etapas iniciales. Según la empresa, GPT-Rosalind está diseñado para ayudar a los científicos a "explorar más posibilidades, encontrar conexiones que de otro modo podrían pasarse por alto y llegar a mejores hipótesis con mayor rapidez".

Los benchmarks respaldan al menos parte de esa ambición. En BixBench, un benchmark construido en torno a tareas reales de bioinformática, GPT-Rosalind registró una tasa de aprobación de 0,751, la puntuación más alta entre los modelos con resultados publicados. En LABBench2, superó a su predecesor GPT-5.4 en seis de once tareas.

GPT-Rosalind supera a GPT 5.4 en todos los casos relacionados con ciencias de la vida, aunque es un modelo muy específico que tendrá un rendimiento inferior en cualquier otra área.

OpenAI también anunció que Dyno Therapeutics ayudará a probar y evaluar el modelo con secuencias de ARN no publicadas para descartar memorización. Las mejores diez propuestas de GPT-Rosalind se ubicaron por encima del percentil 95 de los expertos humanos en tareas de predicción de secuencias, y alrededor del percentil 84 en generación.

Sin embargo, Joy Jiao, directora de investigación en ciencias de la vida de OpenAI, fue cautelosa sobre las capacidades reales del modelo. Explicó que la empresa no ve a Rosalind como un modelo capaz de crear nuevos tratamientos de forma autónoma, aunque señaló a periodistas que podría ser de gran ayuda para acelerar la investigación. "Creemos que existe una oportunidad real para ayudar a los investigadores a avanzar más rápido en algunas de las partes más complejas y demandantes del proceso científico", afirmó Jiao en una rueda de prensa, según el LA Times.

El ecosistema en torno al modelo podría ser tan relevante como el modelo en sí. OpenAI también lanzará un plugin gratuito de investigación en ciencias de la vida para Codex que se conecta a más de 50 bases de datos y herramientas científicas: búsqueda de estructuras proteicas, búsqueda de secuencias, revisión de literatura y pipelines de genómica. Los usuarios empresariales con acceso a GPT-Rosalind obtienen la capa de razonamiento adicional; el resto accede al plugin con los modelos estándar.

OpenAI ha reunido un grupo de clientes farmacéuticos y de biotecnología para el lanzamiento, como Amgen, Moderna y Thermo Fisher Scientific. Por separado, mantiene una colaboración de investigación con el Laboratorio Nacional de Los Álamos sobre diseño de proteínas y catalizadores guiado por IA.

"El campo de las ciencias de la vida exige precisión en cada paso. Las preguntas son sumamente complejas, los datos son altamente singulares y las apuestas son increíblemente altas", señaló Sean Bruich, Vicepresidente Senior de IA y Datos de Amgen, en el anuncio oficial.

El acceso a Rosalind está deliberadamente restringido. El modelo es exclusivo para empresas en Estados Unidos y requiere pasar por una revisión de calificación y seguridad. La preocupación no es abstracta: una coalición internacional de más de 100 científicos ya ha pedido controles más estrictos sobre los datos biológicos utilizados para entrenar IA, citando riesgos de diseño de patógenos. El lanzamiento restringido de OpenAI es una respuesta directa a ello. Durante la vista previa de investigación, el uso no consumirá los créditos de API existentes.

Además, este no es el primer paso de OpenAI en flujos de trabajo científicos. El espacio de trabajo de escritura científica Prism, lanzado en enero, fue el primer movimiento. GPT-Rosalind es el siguiente paso, más preciso y especializado, y una señal de que los modelos específicos por dominio se están convirtiendo en un frente competitivo serio.

Ningún medicamento descubierto íntegramente por IA ha superado los ensayos de fase 3. Esa cifra sigue siendo cero. Pero si GPT-Rosalind ayuda a un investigador a diseñar un mejor experimento seis meses antes en miles de laboratorios, el efecto acumulado sobre lo que se descubre, y cuándo, podría ser la clave de todo. Esa es la verdadera tesis aquí, y vale la pena seguirla de cerca.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados