En Resumen

  • OpenAI está a punto de lanzar dos modelos revolucionarios, Strawberry y Orion, que podrían redefinir el panorama del aprendizaje automático.
  • Strawberry, anteriormente conocido como Q* o Q-Star, se enfoca en avances significativos en el razonamiento y la resolución de problemas matemáticos complejos.
  • Orion, el próximo modelo de lenguaje insignia de OpenAI, está diseñado para superar a GPT-4 en comprensión y generación de lenguaje, además de procesar entradas multimodales como texto, imágenes y videos.

OpenAI está a punto de lanzar dos modelos revolucionarios que podrían redefinir el panorama del aprendizaje automático. Con los nombres en clave Strawberry y Orion, estos proyectos tienen como objetivo llevar las capacidades de la IA más allá de los límites actuales, especialmente en el razonamiento, la resolución de problemas y el procesamiento del lenguaje, acercándonos un paso más a la inteligencia artificial general (AGI).

Strawberry, anteriormente conocido como Q* o Q-Star, parece ser más que un simple chatbot; se enfoca en mostrar un avance significativo en las habilidades de razonamiento de la inteligencia artificial. Fuentes familiarizadas con el proyecto han informado a diferentes medios como Reuters o The Information que ha demostrado una notable competencia en la resolución de problemas matemáticos complejos y en el análisis lógico.

Mientras tanto, Orion se perfila como el próximo modelo de lenguaje insignia de OpenAI, con el potencial de reemplazar a GPT-4. Está diseñado para superar a su predecesor en comprensión y generación de lenguaje, además de incorporar la capacidad de procesar entradas multimodales, como texto, imágenes y videos.

Ambos proyectos han atraído la atención de funcionarios de seguridad nacional de EE. UU., subrayando su potencial importancia estratégica. Este desarrollo se produce mientras OpenAI continúa recaudando capital a pesar del considerable crecimiento de ingresos, probablemente debido a los altos costos asociados con el desarrollo y entrenamiento de estos modelos avanzados.

Strawberry y poder de razonamiento

A pesar de una interminable avalancha de especulaciones en línea, OpenAI no ha dicho oficialmente nada sobre el Proyecto Strawberry. Sin embargo, las supuestas filtraciones tienden hacia sus capacidades para un razonamiento sofisticado.

A diferencia de los modelos tradicionales que proporcionan respuestas rápidas, se dice que Strawberry emplea lo que los investigadores llaman "System 2 thinking," capaz de tomarse el tiempo para deliberar y razonar sobre problemas, en lugar de predecir conjuntos más largos de tokens para completar sus respuestas. Este enfoque ha dado resultados impresionantes, con el modelo obteniendo un score de más del 90% en el benchmark de MATH (una colección de problemas matemáticos avanzados), según Reuters.

Otra innovación clave anticipada de Strawberry es su capacidad para generar datos de entrenamiento sintéticos de alta calidad. Esto aborda un desafío crítico en el desarrollo de la IA: la escasez de datos diversos y de alta calidad para entrenar modelos. Si es cierto, Strawberry no solo mejora sus propias capacidades, sino que también allana el camino para modelos más avanzados como Orion.

Teniendo en cuenta las enormes cantidades de datos ya recopilados por OpenAI, y el movimiento de privacidad que ahora está muy presente entre los usuarios no dispuestos a dar sus datos a los entrenadores de IA, esta función puede desempeñar un papel importante en la calidad de los futuros modelos de IA, al igual que algunos usuarios hoy en día entrenan sus propios modelos personalizados utilizando imágenes generadas por Stable Diffusion.

Sin embargo, el enfoque deliberado de procesamiento de Strawberry puede presentar desafíos para aplicaciones en tiempo real. Según informes, los investigadores de OpenAI están trabajando en "destilar" las capacidades de Strawberry, básicamente disminuyendo su calidad para que los consumidores puedan realizar grandes cantidades de inferencias a bajo costo computacional.

Aun así, la potencial integración de la tecnología de Strawberry en productos orientados al consumidor como ChatGPT podría marcar un impulso significativo en la forma en que OpenAI entrena nuevos modelos. Sin embargo, es posible que OpenAI utilice Strawberry como base para entrenar nuevos modelos en lugar de hacerlo ampliamente disponible para los consumidores.

Proyecto Orion o GPT Next

El Proyecto Orion se presenta como el ambicioso sucesor de GPT-4o de OpenAI, con el objetivo de establecer nuevos estándares en la inteligencia artificial del lenguaje. Una presentación reciente de Tadao Nagasaki, CEO de OpenAI Japan, sugiere que podría llamarse GPT Next. Aprovechando los avances de Project Strawberry, Orion está diseñado para destacarse en el procesamiento del lenguaje natural mientras se expande a capacidades multimodales.

Y OpenAI afirma que el salto no será incremental.

"El próximo modelo de IA, probablemente llamado 'GPT Next', evolucionará casi 100 veces más que sus predecesores, según el rendimiento pasado", dijo Nagasaki en el KDDI SUMMIT 2024 en Japón, según informó IT Media. "A diferencia del software tradicional, la tecnología de IA crece de forma exponencial. Por lo tanto, queremos apoyar la creación de un mundo donde la IA se integre lo antes posible."

Entrenar a Orion con datos producidos por Strawberry representaría una ventaja técnica para OpenAI. Sin embargo, esta técnica debe usarse con precaución. Los investigadores ya han demostrado que los modelos comienzan a degradarse después de ser entrenados con demasiados datos sintéticos, por lo que encontrar ese punto óptimo en el que Strawberry pueda potenciar a Orion sin afectar su precisión parece clave para que OpenAI siga siendo competitivo.

Las capacidades multimodales nativas de Orion también representarán un avance significativo. El modelo está siendo desarrollado para integrar de manera fluida entradas y salidas de texto, imagen e incluso video, según informó The Information, abriendo nuevas posibilidades para los usuarios de ChatGPT y poniendo a la compañía en competencia directa con Gemini de Google, que puede procesar hasta 2 horas de entrada de video.

Este es el modelo con el que los usuarios interactuarán al usar ChatGPT o el API Playground de OpenAI.

El desarrollo de Orion se alinea con la estrategia más amplia de OpenAI de mantener su ventaja competitiva en un paisaje de IA cada vez más concurrido. Con modelos de código abierto como LLaMA-3.1 de Meta, y modelos de última generación como Claude o Gemini avanzando rápidamente, Orion es básicamente el intento de OpenAI de mantenerse a la vanguardia.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.