En Resumen
- Nvidia presentó Project DIGITS, una supercomputadora personal de IA capaz de manejar modelos con hasta 200 mil millones de parámetros.
- La empresa reveló la serie RTX 5000, introduciendo DLSS 4 y prometiendo hasta 8 veces más rendimiento gráfico mediante IA.
- Anunciaron asociaciones estratégicas para agentes de IA y nuevos modelos como Nemotron, NIIM y Cosmos para tareas avanzadas.
Después de un año récord en 2024, Nvidia comienza el 2025 con fuerza, presentando una serie de productos que podrían consolidar su dominio en los campos del desarrollo de la IA y los videojuegos.
El CEO Jensen Huang subió al escenario en el CES de Las Vegas para mostrar nuevas ofertas de hardware y software que abarcan desde supercomputadoras personales de IA hasta tarjetas de juego de próxima generación.
El mayor anuncio de Nvidia fue Project DIGITS, una supercomputadora personal de IA de $3.000 que concentra un petaflop de potencia de cómputo en una caja del tamaño de un escritorio.
Construida alrededor del nuevo —y hasta ahora secreto— GB10 Grace Blackwell Superchip, esta máquina puede manejar modelos de IA con hasta 200 mil millones de parámetros mientras se alimenta desde un enchufe estándar.
Para cargas de trabajo más pesadas, los usuarios pueden vincular dos unidades para manejar modelos de hasta 405 mil millones de parámetros.
Para contexto, el modelo Llama 3.2 más grande, el Large Language Model (LLM) de código abierto más avanzado de Meta, tiene 405.000 millones de parámetros y no puede ejecutarse en hardware de consumo.
Hasta ahora, requería alrededor de 8 Nvidia A100/H100 Superchips, cada uno costando alrededor de $30.000, totalizando más de $240.000 solo en hardware de procesamiento.
Dos de las nuevas supercomputadoras de IA de grado consumidor de Nvidia costarían $6.000 y serían capaces de ejecutar el mismo modelo cuantizado.
"La IA será común en cada aplicación para cada industria. Con Project DIGITS, el Grace Blackwell Superchip llega a millones de desarrolladores", dijo Jensen Huang, CEO de Nvidia, en una publicación oficial del blog. "Colocar una supercomputadora de IA en los escritorios de cada científico de datos, investigador de IA y estudiante les permite participar y dar forma a la era de la IA".
Para aquellos que aman los detalles técnicos, el chip GB10 representa un logro significativo de ingeniería nacido de una colaboración con MediaTek.
El sistema en chip combina la última arquitectura GPU de Nvidia con 20 núcleos ARM de bajo consumo conectados a través de interconexión NVLink-C2C.
Cada unidad DIGITS cuenta con 128GB de memoria unificada y hasta 4TB de almacenamiento NVMe. Nuevamente, para contexto, las GPU más potentes hasta la fecha tienen alrededor de 24GB de VRAM (la memoria requerida para ejecutar modelos de IA) cada una, y el H100 Superchip comienza con 80GB de VRAM.
Planes de Nvidia para dominar a los agentes de IA
Las empresas se apresuran a implementar agentes de IA, y Nvidia lo sabe, quizás por eso desarrolló Nemotron, una nueva familia de modelos que viene en tres tamaños, y anunció su expansión con dos nuevos modelos: Nvidia NIIM para resumen y comprensión de video y Nvidia Cosmos para dar a Nemotron capacidades de visión—la habilidad de entender instrucciones visuales.
Hasta ahora, los LLM eran solo basados en texto. Sin embargo, los modelos sobresalieron en las siguientes instrucciones: chat, llamadas a funciones, codificación y tareas matemáticas.
Están disponibles tanto a través de Hugging Face como del sitio web de Nvidia, con acceso empresarial a través de la plataforma de software AI Enterprise de la compañía.
Nuevamente, para tener más contexto, en LLM arena, el Llama Nemotron 70b de Nvidia se clasifica más alto que el Llama 405b original desarrollado por Meta. También supera diferentes versiones de Claude, Gemini Advanced, Grok-2 mini y GPT-4o.
El impulso de agentes de Nvidia ahora también está relacionado con la infraestructura. La compañía anunció asociaciones con importantes proveedores de tecnología de agentes como LangChain, LlamaIndex y CrewAI para construir blueprints en Nvidia AI Enterprise.
Estas plantillas listas para implementar abordan tareas específicas que facilitan a los desarrolladores construir agentes altamente especializados.
Un nuevo blueprint de PDF a podcast busca competir con NotebookLM de Google, mientras que otro blueprint ayuda a construir agentes de búsqueda y resumen de video. Los desarrolladores pueden probar estos blueprints a través de la nueva plataforma Nvidia Launchables, que permite la creación de prototipos y la implementación con un clic.
¡Jugadores, alégrense! Las nuevas tarjetas GeForce RTX 5000 son unas bestias de rendimiento
Nvidia guardó sus anuncios sobre gaming para el final, revelando la muy esperada Serie GeForce RTX 5000. La RTX 5090 alberga 92 mil millones de transistores y ofrece 3.352 billones de operaciones de IA por segundo—el doble del rendimiento de la actual RTX 4090. Toda la línea cuenta con Tensor Cores de quinta generación y RT Cores de cuarta generación.
Las nuevas tarjetas introducen DLSS 4, que puede aumentar las tasas de fotogramas hasta 8 veces usando IA para generar múltiples frames por renderizado. "Blackwell, el motor de la IA, ha llegado para jugadores de PC, desarrolladores y creativos", dijo Jensen Huang, "fusionando el renderizado neural impulsado por IA y el ray tracing, Blackwell es la innovación más significativa en gráficos por computadora desde que introdujimos el sombreado programable hace 25 años".
Las nuevas tarjetas también emplean modelos transformer para super-resolución, prometiendo gráficos altamente realistas y mucho más rendimiento por su precio—que no es barato, por cierto: $549 para la RTX 5070, con la 5070 Ti en $749, la 5080 en $999, y la 5090 en $1.999.
Si no tienes ese dinero y quieres jugar, no te preocupes.
AMD también anunció su serie Radeon RX 9070. Las tarjetas están construidas sobre la nueva arquitectura RDNA 4 usando un proceso de fabricación de 4nm y cuentan con aceleradores de IA dedicados para competir con los tensor cores de Nvidia.
Mientras las especificaciones completas permanecen bajo secreto, los últimos chips Ryzen AI de AMD ya logran 50 TOPS en rendimiento máximo.
Lamentablemente, Nvidia sigue siendo el rey de las aplicaciones de IA gracias a su tecnología CUDA, la arquitectura de IA propietaria de Nvidia.
Para abordar esto, AMD ha asegurado asociaciones con HP y Asus para integración de sistemas, y más de 100 marcas de plataformas empresariales utilizarán la tecnología AMD Pro durante 2025.
Se espera que las tarjetas Radeon lleguen al mercado en el primer trimestre de 2025, dando a Nvidia una interesante batalla tanto en gaming como en aceleración de IA.
Editado por Sebastian Sinclair