4 min lectura
Google se está preparando para lanzar Gemini, su esperado sistema de IA conversacional, preparando el escenario para una batalla de IA total con ChatGPT de OpenAI.
Según un informe de The Information, Google ha abierto las pruebas de Gemini a empresas seleccionadas, lo que indica que su lanzamiento para consumidores podría ser inminente. Gemini es un LLM multimodal, es decir, puede recibir de manera nativa entradas de diferentes modalidades, como texto, imagen, audio, etc.
"Gemini fue creado desde cero para ser multimodal", dijo el CEO de Google, Sundar Pichai, en el discurso principal de Google i/o en mayo. Aunque todavía es temprano, ya estamos viendo impresionantes capacidades multimodales que no se ven en modelos anteriores", agregó.
Esto enfrentaría al gigante tecnológico contra el exitoso chatbot ChatGPT de OpenAI, que ha estado causando sensación desde su lanzamiento en noviembre pasado.
Desde fintech hasta atención médica, las empresas están invirtiendo grandes cantidades de dinero para aprovechar sus sorprendentes habilidades conversacionales.
Pero Pichai parece no estar preocupado por la perspectiva de un duelo de IA.
"No me queda del todo claro que hubiera funcionado tan bien", dijo Pichai a Wired cuando se le preguntó si Google debería haber lanzado un competidor de ChatGPT antes.
Pichai ha estado aumentando la inversión en lo que él llama el "futuro de Google basado en la IA" desde 2016. Pero cree que se necesitaba más tiempo para perfeccionar sus modelos antes de su lanzamiento. "Me siento muy cómodo con dónde estamos" señaló.
El lanzamiento inicial de Google de su chatbot Bard basado en LaMDA en febrero fue un fracaso después de que fallara en datos básicos sobre el telescopio James Webb. Sin embargo, Bard ha recibido una importante actualización para aprovechar el nuevo modelo multimodal PaLM 2 de Google, que "supera significativamente" a su predecesor, como pudo confirmar Decrypt en una comparación.
El renovado Bard ha demostrado que puede competir con ChatGPT Plus en ciertas áreas, al ser gratuito y más accesible. Una prueba de Decrypt encontró que Bard ofrece traducciones más rápidas y contextuales en comparación con ChatGPT. También superó a la competencia en la generación de código, admitiendo más de 20 lenguajes de programación. Pero ChatPGT se ha puesto al día en ese aspecto con su herramienta Advanced Data Analytics, que ha convertido al chatbot en una máquina de codificación poderosa que ahora es mucho más avanzada que las capacidades nativas de Bard.
Y la integración de Bard con el vasto índice de búsqueda en tiempo real de Google le dio al chatbot una ventaja al responder preguntas sobre eventos actuales. Google también es el principal inversor en Anthropic, la startup detrás de Claude AI, el competidor más poderoso de ChatGPT hasta la fecha.
Claude puede manejar más de 100.000 tokens de contexto, lo que significa que los usuarios pueden proporcionar al chatbot 10 veces más información de la que ChatGPT puede manejar. Y los resultados regularmente lo sitúan entre GPT3.5 y GPT-4 en términos de calidad.
Con las amplias capacidades de contexto de Claude, la integración de Bard con Google para el consumidor promedio y las capacidades multimodales de Gemini, se pudiese decir que Google busca dominar el espacio de la IA y ocupar el trono actualmente ocupado por OpenAI y Microsoft.
Google también está siguiendo un enfoque de "ecosistema" enfocado en la IA, integrando capacidades generativas en sus productos como Docs, Maps y Search. Justo esta semana anunció nuevas actualizaciones de IA destinadas a mejorar cómo las personas encuentran y asimilan información en línea.
Con Gemini a punto de salir, el imperio de IA de OpenAI podría enfrentar su desafío más grande hasta ahora. Aunque por ahora, parece que Pichai está contento de tomar un enfoque lento y constante.
Decrypt-a-cookie
This website or its third-party tools use cookies. Cookie policy By clicking the accept button, you agree to the use of cookies.