En Resumen
- DeepSeek sacudió la industria de IA con un modelo eficiente que desafía a gigantes tecnológicos.
- Nvidia perdió $600.000 millones en valor de mercado tras el lanzamiento del modelo R1 de DeepSeek.
- OpenAI, Meta y Microsoft están analizando cómo incorporar las innovaciones de DeepSeek en sus estrategias.
Una pequeña startup china acaba de obligar a las mayores empresas tecnológicas de Estados Unidos a replantearse cómo construyen la inteligencia artificial.
El lanzamiento del modelo R1 de DeepSeek, que según los informes iguala o supera las capacidades de los sistemas de IA construidos en Estados Unidos a una fracción del coste, provocó una venta masiva de acciones tecnológicas que borró casi $600.000 millones del valor de mercado de Nvidia.
La caída del gigante de los chips golpeó al sector tecnológico estadounidense, con los líderes de la industria apresurándose a analizar cómo DeepSeek logró tales resultados.
Aunque todavía hay muchas preguntas, después de analizar el código de código abierto, el consenso, por ahora, es que los desarrolladores chinos son mejores construyendo modelos eficientes. Y a los titanes tecnológicos de la IA no les quedó más remedio que poner caras sonrientes y mirar el lado positivo, abrazando la idea de que cualquier avance en IA era bueno para la industria.
Sam Altman de OpenAI reconoció el impresionante rendimiento del modelo mientras prometía acelerar el lanzamiento de “mejores modelos”.
look forward to bringing you all AGI and beyond.
— Sam Altman (@sama) January 28, 2025
look forward to bringing you all AGI and beyond.
— Sam Altman (@sama) January 28, 2025
Mark Zuckerberg de Meta dijo que su empresa había reunido múltiples “salas de guerra” llenas de ingenieros dedicados a analizar la tecnología de DeepSeek y elaborar la estrategia de respuesta de Meta.
Mientras tanto, el Presidente Donald Trump, que nunca pierde un ciclo de noticias, calificó el avance de DeepSeek como una “llamada de atención” y un desarrollo “positivo” para la tecnología estadounidense “porque no tienes que gastar tanto dinero”.
La era post-DeepSeek
Bien, ignoremos lo que están diciendo y consideremos lo que probablemente harán para responder al avance de DeepSeek.
Resulta que varios grandes actores de código cerrado ya están introduciendo sigilosamente los métodos de DeepSeek en sus estrategias, simplemente no harán titulares sobre tomar prestado de la competencia.
Por ejemplo, Perplexity ya implementó el modelo en su motor de búsqueda, y Groq también lo hizo disponible para ejecutar en tiempos de inferencia récord.
La mayoría de los grandes nombres en la escena de IA estadounidense, incluido Meta, están adaptándose a DeepSeek o pensando en formas de aprovechar su tecnología.
China Contraataca: Conoce DeepSeek R1, la IA Gratuita de Código Abierto Que Iguala a OpenAI o1
Los investigadores chinos de IA han logrado lo que muchos pensaban que estaba a años luz de distancia: un modelo de IA gratuito y de código abierto que puede igualar o superar el rendimiento de los sistemas de razonamiento más avanzados de OpenAI. Lo que hace esto aún más notable fue cómo lo hicieron: dejando que la IA se enseñe a sí misma mediante prueba y error, similar a cómo aprenden los humanos. "DeepSeek-R1-Zero, un modelo entrenado mediante reinforcement learning (RL) a gran escala sin su...
A medida que el pánico inicial del mercado se disipa —las acciones de Nvidia rebotaron un 9% hoy— los líderes tecnológicos señalan un principio económico contraintuitivo que sugiere que el avance en eficiencia de DeepSeek podría impulsar la demanda de hardware de IA.
Conocido como la paradoja de Jevons, este concepto explica por qué la eficiencia tecnológica tiende a expandir el uso en lugar de disminuir el consumo.
“A medida que la IA se vuelve más eficiente y accesible, veremos que su uso se dispara, convirtiéndola en una mercancía de la que simplemente no podemos tener suficiente”, dijo Satya Nadela, CEO de Microsoft, el mayor inversor de OpenAI.
A pesar de sufrir la mayor caída en un solo día en capitalización de mercado de Wall Street, Nvidia ve el avance de DeepSeek como una oportunidad.
“El pastel acaba de hacerse mucho más grande, [de manera] más rápida. Nosotros, como una sola humanidad, estamos marchando hacia la AGI universal más pronto”, tuiteó el lunes Jim Fan, investigador jefe de Nvidia.
An obvious, “we are so back” moment in the AI circle somehow turned into “it’s so over” in mainstream.
> unbelievable shortsightedness
> the power of o1 in the palm of every coder’s hand to study, explore, and iterate upon
> ideas compound
> the rate of compounding accelerates…— Jim Fan (@DrJimFan) January 27, 2025
En otras palabras, si se aplica la paradoja de Jevons, la demostración de DeepSeek de que se pueden construir modelos de IA de alta calidad con recursos computacionales mínimos no significa que usaremos menos GPUs en general. En cambio, los grandes se harán más grandes.
En el otro extremo del espectro, a medida que la barrera de entrada baja, una oleada de nuevos desarrolladores y empresas se lanzará al desarrollo de IA.
La explosión en el total de proyectos probablemente llevará la demanda de computación y chips a niveles sin precedentes. Por supuesto, para la IA, no todos los chips son iguales, y el mercado aparentemente ha decidido que el silicio de Apple podría tener ventaja sobre los chips de Nvidia en este nuevo mundo.
Es por eso que AAPL subió un 8% esta semana, a pesar de que su “Apple Intelligence” de grado consumidor fue ridiculizada como un oxímoron.
Gran Actualización de IA de Apple Para iPhone, iPad y Mac Finalmente Está Disponible
Apple lanzó el miércoles la actualización más esperada para sus sistemas operativos móviles y de escritorio, entregando finalmente una serie de nuevas funciones de inteligencia artificial que prometen desbloquear la tecnología de vanguardia de OpenAI. Si bien los usuarios probaron una pequeña muestra de "Apple Intelligence" en octubre, hasta ahora, tanto consumidores como críticos han estado poco impresionados. El lanzamiento de iOS 18.2, iPadOS 18.2 y MacOS Sequoia 15.2 introduce varias funcion...
El argumento es que los chips de Apple son más eficientes energéticamente, diseñados para uso localizado en comparación con las grandes granjas de servidores que usan chips Nvidia, y presentan una “arquitectura de memoria unificada”, lo que significa que la CPU, GPU y el Motor Neural comparten un único grupo de memoria ultrarrápida.
Esto elimina la necesidad de transferencia de datos entre componentes separados, reduciendo la latencia y aumentando la eficiencia para cargas de trabajo de IA. Para modelos como DeepSeek, que dependen del acceso rápido a memoria para operaciones complejas, UMA supuestamente mejora significativamente el rendimiento.
Claramente, en medio del Dilema del Innovador, es poco probable que Nvidia cambie su estrategia —considerando que son el proveedor dominante de hardware de IA gracias a su monopolización de la arquitectura CUDA, la clave para ejecutar y desarrollar la mayoría de los modelos de IA actualmente disponibles.
DeepSeek no desafía este monopolio —pero China está trabajando en ello para impulsar la adopción de la línea de chips Huawei Ascend.
Why China's DeepSeek AI Is Blowing Everyone's Minds—And Blowing Up the Market
A Chinese artificial intelligence lab has done more than just build a cheaper AI model—it's exposed the inefficiency of the entire industry's approach. DeepSeek's breakthrough showed how a small team, in an effort to save money, was able to rethink how AI models are built. While tech giants like OpenAI and Anthropic spend several billions of dollars on compute power alone, DeepSeek purportedly achieved similar results for just over $5 million. The company's model matches or beats GPT-4o (OpenAI’...
Tal como está, Microsoft no parece demasiado preocupada por cambiar su estrategia comercial como proveedor de infraestructura.
Sin embargo, OpenAI aplicó un pequeño cambio para contrarrestar las expectativas de los usuarios, dando a los usuarios Plus (aquellos que pagan $20 al mes) algunas de las características que anteriormente solo estaban disponibles para usuarios Pro (aquellos que pagan $200 al mes) con la finalidad de retener clientes.
ok we heard y’all.
*plus tier will get 100 o3-mini queries per DAY (!)
*we will bring operator to plus tier as soon as we can
*our next agent will launch with availability in the plus tierenjoy 😊 https://t.co/w8sFsq6mI1
— Sam Altman (@sama) January 25, 2025
Otra empresa con mucho en juego es Meta, los desarrolladores de Llama —la familia más grande y popular de Large Language Model (LLM) de código abierto.
Meta ya se ha comprometido a invertir $65.000 millones en infraestructura de IA este año.
El científico jefe de IA de la empresa, Yann LeCun, también miró el lado positivo de ser superado por una pequeña startup en China: “A las personas que ven el rendimiento de DeepSeek y piensan: 'China está superando a Estados Unidos en IA."
“Lo están leyendo mal; la lectura correcta es: Los modelos de código abierto están superando a los propietarios’, publicó LeCun en LinkedIn.
No te sorprendas si Meta adopta los métodos de DeepSeek para mejorar Llama-4: “Debido a que su trabajo está publicado y es de código abierto, todos pueden beneficiarse de él —ese es el poder de la investigación abierta y el código abierto”, escribió LeCun.
Durante su llamada de ganancias del cuarto trimestre, Zuckerberg, CEO de Meta dijo que la empresa planea asignar diez veces más poder de computación para desarrollar Llama-4 que los recursos asignados para entrenar Llama-3.
La empresa puede reducir su gasto y aplicar las técnicas de DeepSeek —o mantener el gasto mientras aplica esas técnicas y crear un modelo aún más potente.
El futuro de la IA podría no depender de una IA mejor
No importa cuán brillante sea el modelo de inferencia de DeepSeek, al final, la IA todavía tiene un voraz apetito por dos cosas: energía (granjas de servidores) y datos (para entrenar y aprender).
Los analistas de la industria proyectan que la demanda de GPU aumentará un 30% este año, y los costos globales de computación de IA podrían crecer 10 veces en los próximos cinco años.
Cómo estos costos se trasladan a las empresas y consumidores es todavía una pregunta abierta.
Mientras tanto, los modelos de IA de código abierto, como el de DeepSeek, se están volviendo tan buenos que la gente se está cuestionando si los precios premium cobrados por las empresas de código propietario son justos.
¿Quién quiere pagar $20 al mes por la oferta de grado consumidor de OpenAI —y mucho menos $200 al mes por su modelo de alta gama— cuando puedes obtenerlo gratis?
DeepSeek Vuelve a la Carga: ¿Su Nuevo Modelo de IA de código abierto Supera a DALL-E 3?
DeepSeek, la startup de IA china que recientemente revolucionó las suposiciones de la industria sobre los costos de desarrollo del sector, ha lanzado una nueva familia de modelos de IA multimodales de código abierto que, según los informes, superan a DALL-E 3 de OpenAI en indicadores clave. Denominado Janus Pro, el modelo varía desde 1.000 millones (extremadamente pequeño) hasta 7.000 millones de parámetros (cerca del tamaño de SD 3.5L) y está disponible para descarga inmediata en el centro de m...
“Más empresas están construyendo alternativas de código abierto a herramientas premium de IA, creando competencia que beneficia a [pequeñas y medianas empresas]”, dijo a Decrypt Karan Sirdesai, CEO y cofundador de Mira, una red descentralizada de modelos de IA. “Esta evolución natural hacia soluciones accesibles refleja cómo otras tecnologías se han democratizado a través de la dinámica del mercado en lugar de la regulación”.
Para Sirdesai, modelos como DeepSeek y otras iniciativas de código abierto impulsan la industria hacia adelante, ya que dan a los desarrolladores herramientas para posicionarse en mercados que parecen que van a estar totalmente dominados por oligopolios y algunas corporaciones masivas.
Sin embargo, resulta que “la infraestructura descentralizada y el desarrollo de código abierto ya están creando alternativas competitivas a las herramientas premium de IA”, dijo.
DeepSeek Vuelve a la Carga: ¿Su Nuevo Modelo de IA de código abierto Supera a DALL-E 3?
DeepSeek, la startup de IA china que recientemente revolucionó las suposiciones de la industria sobre los costos de desarrollo del sector, ha lanzado una nueva familia de modelos de IA multimodales de código abierto que, según los informes, superan a DALL-E 3 de OpenAI en indicadores clave. Denominado Janus Pro, el modelo varía desde 1.000 millones (extremadamente pequeño) hasta 7.000 millones de parámetros (cerca del tamaño de SD 3.5L) y está disponible para descarga inmediata en el centro de m...
Atul Arya, CEO y fundador de Blackstraw AI, que desarrolla estrategias de implementación de IA para diferentes negocios, dijo que el beneficio más grande de la IA de código abierto es que ayudará al mundo a evitar una potencial brecha entre los que tienen IA y los que no.
“La diferencia entre las versiones gratuitas y pagadas típicamente se centra en la velocidad y escala, más que en las capacidades fundamentales, asegurando que la funcionalidad central permanezca accesible para el público en general”, dijo a Decrypt.
Arya cree que desarrollos de código abierto como DeepSeek ayudan a nivelar la escala y crear condiciones más justas en un mercado tan salvaje como la industria de la IA.
“El verdadero impulsor del acceso democratizado es la comunidad de código abierto, que está alcanzando rápidamente”, dijo.
Editado por Sebastian Sinclair y Josh Quittner.