Opera Adopta a Gemini de Google Para Impulsar su Asistente de IA y Generador de Imágenes

Uniéndose al juego de navegadores de IA de Microsoft y Brave, Opera aprovecha los últimos modelos base de Google para mejorar sus ofertas de IA integradas.

Por Jose Antonio Lanz

6 min lectura

Opera, la compañía detrás del quinto navegador de escritorio más popular, permitirá a los usuarios de su asistente de inteligencia artificial integrado, Aria, generar imágenes fácilmente con el último modelo de generación de imágenes de Google, Imagen 2.

El proyecto del navegador anunció un acuerdo el martes que también potenciará a Aria con Gemini de Google para su chatbot basado en texto.

"Estamos emocionados de anunciar la profundización de esta colaboración en el campo de la IA generativa para potenciar aún más nuestra suite de servicios de IA del navegador", dijo Per Wetterdal, jefe de alianzas en Opera, en un comunicado oficial, citando dos décadas de colaboraciones pasadas.

La característica estuvo inmediatamente disponible en Opera Developer, la versión de prelanzamiento, pero públicamente accesible de Opera, donde los usuarios pueden previsualizar y probar las próximas funciones. La versión Developer típicamente se traslada a Opera Beta (anteriormente conocida como Opera Next) antes de convertirse finalmente en la próxima versión principal y estable.

Indicaciones generadas mediante Opera Developer, Opera GX y Opera Browser.

Además, la actualización permite que la inteligencia artificial de Opera responda de manera conversacional, gracias al modelo de texto a audio de Google.

Si bien hay acceso a una versión anterior de Aria en el navegador móvil de Opera, la actualización impulsada por Gemini aún no está disponible en teléfonos inteligentes. Opera no respondió a una solicitud de comentario de Decrypt.

Aria, el asistente de inteligencia artificial de Opera presentado por primera vez en mayo de 2023, solía depender de ChatGPT de OpenAI, pero más tarde integró una versión mejorada del modo PaLM 2 de Google. Este modelo ahora está desactualizado, puesto que Google ha trasladado su desarrollo de IA a Gemini, un nuevo modelo fundamental que impulsa sus propios servicios de IA. Aria de Opera procesa los comandos del usuario y decide qué modelo utilizar para cada tarea, Gemini o Imagen 2.

Con la integración del modelo Gemini de Google, Opera ahora podrá proporcionar a sus usuarios respuestas de mayor calidad al nivel de las obtenidas a través de GPT-4. En este momento, GPT-4o y Gemini 1.5 Pro ocupan el primer y segundo lugar en el ranking de Chatbot Arena, una clasificación basada en las calificaciones de los usuarios.

“Creemos que el futuro de la IA será abierto, por lo que estamos brindando acceso a lo mejor de la infraestructura de Google, productos de IA, plataformas y modelos base para capacitar a las organizaciones a trazar su curso con IA generativa," dijo Eva Fors, directora general de Google Cloud para la región nórdica. “Estamos felices de elevar nuestra cooperación de larga data con Opera al potenciar su innovación en IA dentro del espacio del navegador.”

Opera aún ha mantenido su integración preexistente con ChatGPT (ahora impulsado por GPT-4 y Dall-e 3) de OpenAI. Los usuarios solo necesitan hacer clic en un icono diferente que se muestra justo debajo del botón Aria.

Opera ha estado aprovechando el potencial de la IA en el navegador desde hace más de un año con todos sus navegadores insignia, incluido su navegador de juegos Opera GX. La compañía también abrió recientemente un clúster de datos de IA alimentado por energía verde en Islandia con tecnología NVIDIA DGX para expandir rápidamente su programa de IA.

Las guerras de navegadores de IA

La batalla por dominar el mercado de navegadores ha sido significativamente impactada por la integración de la inteligencia artificial. Mientras que Chrome de Google sigue siendo el líder indiscutible, su falta de integración predeterminada de IA ha dejado espacio para que otros jugadores innoven y ganen terreno.

Microsoft, en particular, ha apostado fuertemente por la IA, renovando por completo su navegador Edge, con muchas funciones impulsadas por IA. Edge ha experimentado un notable resurgimiento en los últimos meses tras ser objeto de burlas, con usuarios bromeando que su mejor uso era para descargar Chrome.

Al cambiar a un motor basado en Chromium y al incorporar capacidades de IA, el navegador de Microsoft ha escalado posiciones, superando a Safari de Apple para reclamar el segundo lugar a finales de 2023, según datos de Statcounter. El punto de inflexión coincide con el anuncio de Microsoft de su experiencia unificada Copilot el 26 de septiembre de 2023.

Este movimiento empresarial de Opera y Google Cloud es significativo porque ofrece una alternativa basada en Google en el mercado de los navegadores impulsados por IA. Con el ascenso de Microsoft Edge gracias a sus integraciones de IA, la colaboración entre Opera y Google brinda a los usuarios una opción sólida para aprovechar los modelos avanzados de Google en lugar de los de OpenAI.

La alegría de la elección

Si la conveniencia de utilizar herramientas de IA dentro de un navegador web es atractiva, ahora tienes tres opciones sólidas: Opera con Aria de Google, Edge con Copilot de Microsoft y Brave con Leo, impulsado por Mistral y Anthropic.

Brave, el renombrado navegador de criptomonedas, puede resultar atractivo para los usuarios preocupados por la privacidad. Brave ha integrado su propio asistente de IA, Leo, directamente en su navegador, y puede responder preguntas, proporcionar resúmenes, generar nuevo contenido y más. Sin embargo, aún no puede generar imágenes.

Leo está impulsado por grandes modelos de lenguaje grande o Large Language Models (LLMs) como Mixtral 8x7B, Claude Instant y Llama 2 13B. A diferencia de otros asistentes de IA, Brave aloja estos modelos en sus propios servidores, asegurando que las entradas de usuario y las conversaciones con Leo no se retengan ni se utilicen para el entrenamiento del modelo.

Entre Opera y Edge, Copilot puede tener una ventaja en respuestas basadas en texto, pero las capacidades de Imagen 2 de Google superan a Dall-E 3 en cuanto a realismo y coherencia. En pruebas realizadas por Decrypt, Aria también demostró ser más versátil y creativa, entendiendo indicaciones más cortas.

Por ejemplo, la interpretación de Aria de una simple solicitud de un perro comiendo una hamburguesa fue realista. Copilot pidió una indicación más descriptiva, creando una imagen menos realista con una estética de renderizado 3D solo después de que pedimos crear un perro con gafas de sol comiendo una hamburguesa.

Generaciones de Aria, Copilot y Copilot después de expandir la indicación

Si utilizas Copilot en Edge, Aria en Opera es una opción que vale la pena considerar, y las capacidades de generación de imágenes de cualquiera de ellos pueden ser una razón para probar algo más allá de la burbuja privada que ofrece Leo en Brave.

Editado por Ryan Ozawa.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados