¿Que se Viene en OpenAI? Conoce Todo Sobre el Proyecto Strawberry, Orion y GPT Next

Esto es lo que sabemos sobre los proyectos de IA secretos que empujan los límites de lo que OpenAI puede hacer.

5 min lectura

Sep 5, 2024

OpenAI está a punto de lanzar dos modelos revolucionarios que podrían redefinir el panorama del aprendizaje automático. Con los nombres en clave Strawberry y Orion, estos proyectos tienen como objetivo llevar las capacidades de la IA más allá de los límites actuales, especialmente en el razonamiento, la resolución de problemas y el procesamiento del lenguaje, acercándonos un paso más a la inteligencia artificial general (AGI).

Strawberry, anteriormente conocido como Q* o Q-Star, parece ser más que un simple chatbot; se enfoca en mostrar un avance significativo en las habilidades de razonamiento de la inteligencia artificial. Fuentes familiarizadas con el proyecto han informado a diferentes medios como Reuters o The Information que ha demostrado una notable competencia en la resolución de problemas matemáticos complejos y en el análisis lógico.

Mientras tanto, Orion se perfila como el próximo modelo de lenguaje insignia de OpenAI, con el potencial de reemplazar a GPT-4. Está diseñado para superar a su predecesor en comprensión y generación de lenguaje, además de incorporar la capacidad de procesar entradas multimodales, como texto, imágenes y videos.

Ambos proyectos han atraído la atención de funcionarios de seguridad nacional de EE. UU., subrayando su potencial importancia estratégica. Este desarrollo se produce mientras OpenAI continúa recaudando capital a pesar del considerable crecimiento de ingresos, probablemente debido a los altos costos asociados con el desarrollo y entrenamiento de estos modelos avanzados.

Strawberry y poder de razonamiento

A pesar de una interminable avalancha de especulaciones en línea, OpenAI no ha dicho oficialmente nada sobre el Proyecto Strawberry. Sin embargo, las supuestas filtraciones tienden hacia sus capacidades para un razonamiento sofisticado.

A diferencia de los modelos tradicionales que proporcionan respuestas rápidas, se dice que Strawberry emplea lo que los investigadores llaman "System 2 thinking," capaz de tomarse el tiempo para deliberar y razonar sobre problemas, en lugar de predecir conjuntos más largos de tokens para completar sus respuestas. Este enfoque ha dado resultados impresionantes, con el modelo obteniendo un score de más del 90% en el benchmark de MATH (una colección de problemas matemáticos avanzados), según Reuters.

Otra innovación clave anticipada de Strawberry es su capacidad para generar datos de entrenamiento sintéticos de alta calidad. Esto aborda un desafío crítico en el desarrollo de la IA: la escasez de datos diversos y de alta calidad para entrenar modelos. Si es cierto, Strawberry no solo mejora sus propias capacidades, sino que también allana el camino para modelos más avanzados como Orion.

Teniendo en cuenta las enormes cantidades de datos ya recopilados por OpenAI, y el movimiento de privacidad que ahora está muy presente entre los usuarios no dispuestos a dar sus datos a los entrenadores de IA, esta función puede desempeñar un papel importante en la calidad de los futuros modelos de IA, al igual que algunos usuarios hoy en día entrenan sus propios modelos personalizados utilizando imágenes generadas por Stable Diffusion.

Sin embargo, el enfoque deliberado de procesamiento de Strawberry puede presentar desafíos para aplicaciones en tiempo real. Según informes, los investigadores de OpenAI están trabajando en "destilar" las capacidades de Strawberry, básicamente disminuyendo su calidad para que los consumidores puedan realizar grandes cantidades de inferencias a bajo costo computacional.

Aun así, la potencial integración de la tecnología de Strawberry en productos orientados al consumidor como ChatGPT podría marcar un impulso significativo en la forma en que OpenAI entrena nuevos modelos. Sin embargo, es posible que OpenAI utilice Strawberry como base para entrenar nuevos modelos en lugar de hacerlo ampliamente disponible para los consumidores.

Proyecto Orion o GPT Next

El Proyecto Orion se presenta como el ambicioso sucesor de GPT-4o de OpenAI, con el objetivo de establecer nuevos estándares en la inteligencia artificial del lenguaje. Una presentación reciente de Tadao Nagasaki, CEO de OpenAI Japan, sugiere que podría llamarse GPT Next. Aprovechando los avances de Project Strawberry, Orion está diseñado para destacarse en el procesamiento del lenguaje natural mientras se expande a capacidades multimodales.

Y OpenAI afirma que el salto no será incremental.

"El próximo modelo de IA, probablemente llamado 'GPT Next', evolucionará casi 100 veces más que sus predecesores, según el rendimiento pasado", dijo Nagasaki en el KDDI SUMMIT 2024 en Japón, según informó IT Media. "A diferencia del software tradicional, la tecnología de IA crece de forma exponencial. Por lo tanto, queremos apoyar la creación de un mundo donde la IA se integre lo antes posible."

Entrenar a Orion con datos producidos por Strawberry representaría una ventaja técnica para OpenAI. Sin embargo, esta técnica debe usarse con precaución. Los investigadores ya han demostrado que los modelos comienzan a degradarse después de ser entrenados con demasiados datos sintéticos, por lo que encontrar ese punto óptimo en el que Strawberry pueda potenciar a Orion sin afectar su precisión parece clave para que OpenAI siga siendo competitivo.

Las capacidades multimodales nativas de Orion también representarán un avance significativo. El modelo está siendo desarrollado para integrar de manera fluida entradas y salidas de texto, imagen e incluso video, según informó The Information, abriendo nuevas posibilidades para los usuarios de ChatGPT y poniendo a la compañía en competencia directa con Gemini de Google, que puede procesar hasta 2 horas de entrada de video.

Este es el modelo con el que los usuarios interactuarán al usar ChatGPT o el API Playground de OpenAI.

El desarrollo de Orion se alinea con la estrategia más amplia de OpenAI de mantener su ventaja competitiva en un paisaje de IA cada vez más concurrido. Con modelos de código abierto como LLaMA-3.1 de Meta, y modelos de última generación como Claude o Gemini avanzando rápidamente, Orion es básicamente el intento de OpenAI de mantenerse a la vanguardia.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Get Email!

Noticias recomendados

Comité Bancario del Senado Aprueba la Ley CLARITY Pese a Tensiones por Negocios Cripto de Trump

El Comité Bancario del Senado votó para avanzar la Ley CLARITY, una pieza clave de legislación sobre criptomonedas, hacia una votación en el pleno del Senado. El jueves, los demócratas del Senado se dividieron en su apoyo a la Ley CLARITY durante la votación crucial, con dos miembros pro-cripto del partido votando a favor del histórico proyecto de ley cripto, y todos los demás votando en contra. El Sen. Ruben Gallego (D-AZ) y Angela Alsobrooks (D-MD) votaron a favor de la legislación, a pesar d...

La Corte Suprema Dice Que Trump Puede Despedir a Comisionados de la SEC y CFTC a Voluntad—En un Momento Crucial para las Criptomonedas

La Corte Suprema de Estados Unidos revocó el lunes un fallo histórico que obligaba a los presidentes a despedir a los comisionados de agencias federales solo en circunstancias extraordinarias, deshaciendo casi un siglo de precedente y otorgando al presidente Donald Trump aún más autoridad sobre áreas regulatorias clave, incluidas las criptomonedas. En una decisión de 6-3, la mayoría conservadora del tribunal confirmó el derecho de Trump a despedir a Rebecca Slaughter, una comisionada demócrata...

La "Capa Faltante" del XRP Ledger Toma Forma: Ripple Abre Pruebas de su Protocolo de Préstamos On-Chain

La cadena de bloques nativa de XRP avanzó el lunes hacia la funcionalidad que permite a las instituciones pedir prestado y prestar activos digitales directamente en la cadena, con Ripple anunciando que los desarrolladores pueden comenzar a experimentar con el Protocolo de Préstamo de XRPL dentro de un entorno de prueba. En una publicación de blog, la empresa describió cómo dos especificaciones técnicas denominadas XLS-65 y XLS-66 introducirían infraestructura crediticia nativa directamente en e...

Noticias

Cursos

Profundidades

Monedas

Videos