Google Integra "Gems" y un Generador de Imágenes, en su IA Gemini

El recién lanzado generador de imágenes Imagen 3 forma parte de la actualización, pero se han implementado medidas de seguridad.

Por Jason Nelson

Sep 2, 2024

4 min lectura

Google impulsa gran parte de la Internet en la que confían los usuarios cotidianos. Imagen: Shutterstock

Add on Google

En Resumen

Google presentó su primera actualización importante de su modelo de IA insignia, Gemini, con el lanzamiento de "Gems" personalizables.
Gemini integrará directamente el generador de imágenes de IA de la compañía, Imagen 3, pero aún no generará imágenes de personas.
Las Gems permiten a los usuarios crear un conjunto modular de asistentes de IA personalizados para proyectos que van desde la codificación hasta consejos profesionales.

En un intento de competir con la dominancia de OpenAI en el mercado de la inteligencia artificial, Google presentó su primera actualización importante de su modelo de IA insignia, Gemini. La empresa anunció recientemente el lanzamiento de "Gems" personalizables.

Gemini también integrará directamente el generador de imágenes de IA de la compañía, Imagen 3. Sin embargo, aún no generará imágenes de personas, después de que una versión anterior produjera imágenes problemáticas y obligara a Google a retirar la herramienta de la red.

Similar a la función GPT de ChatGPT de OpenAI, las Gems, que Google anunció por primera vez durante Google I/O en mayo, brindan a los usuarios la capacidad de crear un conjunto modular de asistentes de IA personalizados construidos en el modelo Gemini que pueden ser utilizados para proyectos que van desde la codificación hasta consejos profesionales. Según Google, las Gems están disponibles para los usuarios Avanzados, Empresariales y Corporativos de Gemini.

“Con Gems, puedes crear un equipo de expertos para ayudarte a pensar en un proyecto desafiante, generar ideas para un próximo evento o escribir la leyenda perfecta para una publicación en redes sociales”, dijo Google en un comunicado. “Tu Gem también puede recordar un conjunto detallado de instrucciones para ayudarte a ahorrar tiempo en tareas tediosas, repetitivas o difíciles.”

Para los creadores que quizás no tengan en mente el prompt exacto para construir sus Gems, Gemini también cuenta con una función de reescritura impulsada por inteligencia artificial para perfeccionar el prompt que los configura. Los resultados de las Gems se pueden compartir a través de un enlace en redes sociales, y también se pueden compartir en Google Docs y Gmail para agregarlos a un borrador de correo electrónico.

“En cuanto a compartir, las Gems que creas son para uso personal en este momento”, dijo un representante de Google a Decrypt. “Puedes compartir chats que hayas tenido con Gems creando un enlace público, pero los chats compartidos con Gems no pueden ser continuados por otros con quienes compartes el enlace.”

Esta es una oferta más limitada que los GPT de OpenAI, que pueden ser compartidos más plenamente con otros que pueden usar la misma personalización.

La integración de su generador de imágenes Imagen 3 también amplía las capacidades integradas de Gemini, y el gigante tecnológico reiteró su enfoque cauteloso para el lanzamiento.

“Realizamos extensas pruebas de red internas y externas y colaboramos con expertos independientes para garantizar una mejora continua”, dijo el representante de Google. “Tenemos una Política de Uso Prohibido y prohibimos respuestas que violen nuestras políticas.”

Google lanzó Imagen 3 a principios de agosto después de anunciarlo originalmente en mayo. Enfrenta una feroz competencia de herramientas como Dall-E de OpenAI, Midjourney y Flux, integradas en el chatbot Grok de Elon Musk.

Un conejo sosteniendo una rosa creado por Gemini Imagen 3 — Imagen creada por Decrypt usando IA

“Imagen 3 establece un nuevo estándar en calidad de imagen, generando imágenes con solo unas pocas palabras”, dijo Google. “Incluso puedes pedirle a Gemini que cree imágenes en varios estilos, como paisajes fotorrealistas, pinturas al óleo texturizadas o escenas de animación en plastilina.”

Si bien Gemini puede crear imágenes de animales y objetos, lo único que aún no puede hacer es crear imágenes de personas.

“La generación de imágenes de personas llegará pronto a Gemini Advanced”, responderá el chatbot si se le pide hacerlo.

“Con Imagen 3, hemos avanzado significativamente en proporcionar una mejor experiencia de usuario al generar imágenes de personas”, dijo Google. “No admitimos la generación de individuos fotorrealistas identificables, representaciones de menores o escenas excesivamente sangrientas, violentas o sexuales.”

“Por supuesto, como con cualquier herramienta de IA generativa, no todas las imágenes que crea Gemini serán perfectas, pero seguiremos escuchando los comentarios de los primeros usuarios mientras seguimos mejorando”, agregó Google. “Implementaremos esto gradualmente, con el objetivo de llevarlo a más usuarios e idiomas pronto.”

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.

Coin Prices