En Resumen

  • DeepSeek sacudió la industria de IA con un modelo eficiente que desafía a gigantes tecnológicos.
  • Nvidia perdió $600.000 millones en valor de mercado tras el lanzamiento del modelo R1 de DeepSeek.
  • OpenAI, Meta y Microsoft están analizando cómo incorporar las innovaciones de DeepSeek en sus estrategias.

Una pequeña startup china acaba de obligar a las mayores empresas tecnológicas de Estados Unidos a replantearse cómo construyen la inteligencia artificial.

El lanzamiento del modelo R1 de DeepSeek, que según los informes iguala o supera las capacidades de los sistemas de IA construidos en Estados Unidos a una fracción del coste, provocó una venta masiva de acciones tecnológicas que borró casi $600.000 millones del valor de mercado de Nvidia.

La caída del gigante de los chips golpeó al sector tecnológico estadounidense, con los líderes de la industria apresurándose a analizar cómo DeepSeek logró tales resultados.

Aunque todavía hay muchas preguntas, después de analizar el código de código abierto, el consenso, por ahora, es que los desarrolladores chinos son mejores construyendo modelos eficientes. Y a los titanes tecnológicos de la IA no les quedó más remedio que poner caras sonrientes y mirar el lado positivo, abrazando la idea de que cualquier avance en IA era bueno para la industria.

Sam Altman de OpenAI reconoció el impresionante rendimiento del modelo mientras prometía acelerar el lanzamiento de “mejores modelos”.

Mark Zuckerberg de Meta dijo que su empresa había reunido múltiples “salas de guerra” llenas de ingenieros dedicados a analizar la tecnología de DeepSeek y elaborar la estrategia de respuesta de Meta.

Mientras tanto, el Presidente Donald Trump, que nunca pierde un ciclo de noticias, calificó el avance de DeepSeek como una “llamada de atención” y un desarrollo “positivo” para la tecnología estadounidense “porque no tienes que gastar tanto dinero”.

La era post-DeepSeek

Bien, ignoremos lo que están diciendo y consideremos lo que probablemente harán para responder al avance de DeepSeek.

Resulta que varios grandes actores de código cerrado ya están introduciendo sigilosamente los métodos de DeepSeek en sus estrategias, simplemente no harán titulares sobre tomar prestado de la competencia.

Por ejemplo, Perplexity ya implementó el modelo en su motor de búsqueda, y Groq también lo hizo disponible para ejecutar en tiempos de inferencia récord.

La mayoría de los grandes nombres en la escena de IA estadounidense, incluido Meta, están adaptándose a DeepSeek o pensando en formas de aprovechar su tecnología.

A medida que el pánico inicial del mercado se disipa —las acciones de Nvidia rebotaron un 9% hoy— los líderes tecnológicos señalan un principio económico contraintuitivo que sugiere que el avance en eficiencia de DeepSeek podría impulsar la demanda de hardware de IA.

Conocido como la paradoja de Jevons, este concepto explica por qué la eficiencia tecnológica tiende a expandir el uso en lugar de disminuir el consumo.

“A medida que la IA se vuelve más eficiente y accesible, veremos que su uso se dispara, convirtiéndola en una mercancía de la que simplemente no podemos tener suficiente”, dijo Satya Nadela, CEO de Microsoft, el mayor inversor de OpenAI.

A pesar de sufrir la mayor caída en un solo día en capitalización de mercado de Wall Street, Nvidia ve el avance de DeepSeek como una oportunidad.

“El pastel acaba de hacerse mucho más grande, [de manera] más rápida. Nosotros, como una sola humanidad, estamos marchando hacia la AGI universal más pronto”, tuiteó el lunes Jim Fan, investigador jefe de Nvidia.

En otras palabras, si se aplica la paradoja de Jevons, la demostración de DeepSeek de que se pueden construir modelos de IA de alta calidad con recursos computacionales mínimos no significa que usaremos menos GPUs en general. En cambio, los grandes se harán más grandes.

En el otro extremo del espectro, a medida que la barrera de entrada baja, una oleada de nuevos desarrolladores y empresas se lanzará al desarrollo de IA.

La explosión en el total de proyectos probablemente llevará la demanda de computación y chips a niveles sin precedentes. Por supuesto, para la IA, no todos los chips son iguales, y el mercado aparentemente ha decidido que el silicio de Apple podría tener ventaja sobre los chips de Nvidia en este nuevo mundo.

Es por eso que AAPL subió un 8% esta semana, a pesar de que su “Apple Intelligence” de grado consumidor fue ridiculizada como un oxímoron.

El argumento es que los chips de Apple son más eficientes energéticamente, diseñados para uso localizado en comparación con las grandes granjas de servidores que usan chips Nvidia, y presentan una “arquitectura de memoria unificada”, lo que significa que la CPU, GPU y el Motor Neural comparten un único grupo de memoria ultrarrápida.

Esto elimina la necesidad de transferencia de datos entre componentes separados, reduciendo la latencia y aumentando la eficiencia para cargas de trabajo de IA. Para modelos como DeepSeek, que dependen del acceso rápido a memoria para operaciones complejas, UMA supuestamente mejora significativamente el rendimiento.

Claramente, en medio del Dilema del Innovador, es poco probable que Nvidia cambie su estrategia —considerando que son el proveedor dominante de hardware de IA gracias a su monopolización de la arquitectura CUDA, la clave para ejecutar y desarrollar la mayoría de los modelos de IA actualmente disponibles.

DeepSeek no desafía este monopolio —pero China está trabajando en ello para impulsar la adopción de la línea de chips Huawei Ascend.

Tal como está, Microsoft no parece demasiado preocupada por cambiar su estrategia comercial como proveedor de infraestructura.

Sin embargo, OpenAI aplicó un pequeño cambio para contrarrestar las expectativas de los usuarios, dando a los usuarios Plus (aquellos que pagan $20 al mes) algunas de las características que anteriormente solo estaban disponibles para usuarios Pro (aquellos que pagan $200 al mes) con la finalidad de retener clientes.

Otra empresa con mucho en juego es Meta, los desarrolladores de Llama —la familia más grande y popular de Large Language Model (LLM) de código abierto.

Meta ya se ha comprometido a invertir $65.000 millones en infraestructura de IA este año.

El científico jefe de IA de la empresa, Yann LeCun, también miró el lado positivo de ser superado por una pequeña startup en China: “A las personas que ven el rendimiento de DeepSeek y piensan: 'China está superando a Estados Unidos en IA."

“Lo están leyendo mal; la lectura correcta es: Los modelos de código abierto están superando a los propietarios’, publicó LeCun en LinkedIn.

No te sorprendas si Meta adopta los métodos de DeepSeek para mejorar Llama-4: “Debido a que su trabajo está publicado y es de código abierto, todos pueden beneficiarse de él —ese es el poder de la investigación abierta y el código abierto”, escribió LeCun.

Durante su llamada de ganancias del cuarto trimestre, Zuckerberg, CEO de Meta dijo que la empresa planea asignar diez veces más poder de computación para desarrollar Llama-4 que los recursos asignados para entrenar Llama-3.

La empresa puede reducir su gasto y aplicar las técnicas de DeepSeek —o mantener el gasto mientras aplica esas técnicas y crear un modelo aún más potente.

El futuro de la IA podría no depender de una IA mejor

No importa cuán brillante sea el modelo de inferencia de DeepSeek, al final, la IA todavía tiene un voraz apetito por dos cosas: energía (granjas de servidores) y datos (para entrenar y aprender).

Los analistas de la industria proyectan que la demanda de GPU aumentará un 30% este año, y los costos globales de computación de IA podrían crecer 10 veces en los próximos cinco años.

Cómo estos costos se trasladan a las empresas y consumidores es todavía una pregunta abierta.

Mientras tanto, los modelos de IA de código abierto, como el de DeepSeek, se están volviendo tan buenos que la gente se está cuestionando si los precios premium cobrados por las empresas de código propietario son justos.

¿Quién quiere pagar $20 al mes por la oferta de grado consumidor de OpenAI —y mucho menos $200 al mes por su modelo de alta gama— cuando puedes obtenerlo gratis?

“Más empresas están construyendo alternativas de código abierto a herramientas premium de IA, creando competencia que beneficia a [pequeñas y medianas empresas]”, dijo a Decrypt Karan Sirdesai, CEO y cofundador de Mira, una red descentralizada de modelos de IA. “Esta evolución natural hacia soluciones accesibles refleja cómo otras tecnologías se han democratizado a través de la dinámica del mercado en lugar de la regulación”.

Para Sirdesai, modelos como DeepSeek y otras iniciativas de código abierto impulsan la industria hacia adelante, ya que dan a los desarrolladores herramientas para posicionarse en mercados que parecen que van a estar totalmente dominados por oligopolios y algunas corporaciones masivas.

Sin embargo, resulta que “la infraestructura descentralizada y el desarrollo de código abierto ya están creando alternativas competitivas a las herramientas premium de IA”, dijo.

Atul Arya, CEO y fundador de Blackstraw AI, que desarrolla estrategias de implementación de IA para diferentes negocios, dijo que el beneficio más grande de la IA de código abierto es que ayudará al mundo a evitar una potencial brecha entre los que tienen IA y los que no.

“La diferencia entre las versiones gratuitas y pagadas típicamente se centra en la velocidad y escala, más que en las capacidades fundamentales, asegurando que la funcionalidad central permanezca accesible para el público en general”, dijo a Decrypt.

Arya cree que desarrollos de código abierto como DeepSeek ayudan a nivelar la escala y crear condiciones más justas en un mercado tan salvaje como la industria de la IA.

“El verdadero impulsor del acceso democratizado es la comunidad de código abierto, que está alcanzando rápidamente”, dijo.

Editado por Sebastian Sinclair y Josh Quittner.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.