En Resumen

  • Google AI presentó Gemma, una nueva familia de modelos de lenguaje de código abierto desafiando a LLaMa y Mistral de Meta.
  • Gemma está disponible en dos versiones: 2B y 7B, optimizadas para eficiencia y rendimiento respectivamente.
  • Google enfatizó su compromiso con la democratización de la IA, haciendo Gemma accesible para desarrolladores y usuarios finales.

Google AI—una división del gigante de búsqueda—presentó hoy Gemma, una nueva familia de modelos de lenguaje de código abierto derivada de su suite de herramientas de inteligencia artificial Gemini lanzada recientemente. Con Gemma, Google desafía directamente la posición líder de LLMs basados en LLaMa y Mistral de Meta.

"Tenemos una larga historia de apoyo a la ciencia y al código abierto responsable, lo cual puede impulsar un rápido progreso en la investigación,” escribió Demis Hassabis, cofundador de Google DeepMind, en un tweet. “Por lo tanto, estamos orgullosos de lanzar Gemma: un conjunto de modelos abiertos ligeros, los mejores en su clase por su tamaño, inspirados en la misma tecnología utilizada para Gemini.”

Gemini es el LLM multimodal, comercial y de código cerrado recientemente lanzado por Google para reemplazar a PaLM-2 en la alimentación de su conjunto de servicios en línea, y que compite directamente contra ChatGPT Plus de OpenAI.

Gemma está disponible en dos versiones: Gemma 2B, un modelo ligero entrenado en dos mil millones de parámetros que está optimizado para la eficiencia y puede ejecutarse en un espectro más amplio de hardware, y Gemma 7B, un modelo más robusto entrenado en 7 mil millones de parámetros, que proporciona mejores resultados, pero requiere de más potencia de cómputo.

AD

"En Google, creemos en hacer que la IA sea útil para todos," dijo Google en un anuncio oficial, enfatizando su visión de democratizar la tecnología de IA.

Liberar un modelo de código abierto puede impactar de manera más inmediata a los desarrolladores de IA y a los ingenieros de software, pero los beneficios llegan a los usuarios finales después de haber sido probados, ajustados y construidos en productos y servicios.

"A medida que continuamos expandiendo la familia de modelos Gemma, esperamos presentar nuevas variantes para diversas aplicaciones," agregó la empresa.

El anuncio de Google cubrió los fundamentos técnicos y filosóficos de Gemma, diciendo que el modelo "está diseñado con nuestros Principios de IA en primer plano."

AD

“Para comprender y reducir el perfil de riesgo de los modelos de Gemma, realizamos evaluaciones sólidas que incluyeron pruebas manuales de red teaming, pruebas adversarias automatizadas y evaluaciones de las capacidades del modelo para actividades peligrosas”, afirmó Google.

Poco después de su lanzamiento, Gemma escaló rápidamente en la lista de tendencias del famoso tablero de Hugging Face, alcanzando el segundo lugar en la lista de tendencias y superando a todos los demás LLMs y modelos de IA de código abierto, excepto por Open Cascade de Stability AI, una nueva IA generativa de texto a imagen.

Los números reales respaldan la destreza afirmada de Gemma: ha demostrado un rendimiento superior a LlaMa-2 de Meta en varios puntos de referencia sintéticos. Por ejemplo, Gemma supera a LlaMa-2 en pruebas como MMLU (conocimiento que abarca 57 disciplinas científicas), Hellaswag (evaluación de razonamiento básico en tareas cotidianas), MATH (evaluación de capacidades matemáticas) y HumanEval (prueba de competencia en codificación).

Imagen de Google
Imagen: Google

Los desarrolladores interesados en probar Gemma pueden hacerlo de forma gratuita utilizando Kaggle, una plataforma de ciencia de datos e inteligencia artificial construida por Google. La empresa también ha puesto Gemma a disposición a través de los cuadernos de Google Colab, y está otorgando $300 en créditos para usuarios nuevos de Google Cloud.

“Los investigadores también pueden solicitar créditos de Google Cloud de hasta $500.000 para acelerar sus proyectos,” dijo Google.

Editado por Ryan Ozawa.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.