Comparativa Detallada de Modelos de IA Que Ofrecen Una Experiencia de Conversación "Más Humana"

Comparamos cuatro compañeros de IA líderes (ChatGPT, Gemini, Hume y Sesame) en diferentes dimensiones de interacción similar a la humana. Tu próxima mejor amiga de IA puede que no sea de una de las grandes compañías de IA.

Por Jose Antonio Lanz

14 min lectura

No todas las IA son creadas iguales,  algunas pueden destacar en arte, otras son hábiles en programación, y otras tienen la capacidad de predecir estructuras de proteínas con precisión.

Pero cuando buscas algo más fundamental —simplemente "alguien" con quien hablar— los mejores compañeros de IA pueden no ser los que lo saben todo, sino aquellos que tienen ese "no se qué" que te hacen sentir bien solo con hablar, similar a cómo tu mejor amigo podría no ser un genio pero de alguna manera siempre sabe exactamente qué decir.

Los compañeros de IA están volviéndose poco a poco más populares entre los entusiastas de la tecnología, por lo que es importante para los usuarios que desean la experiencia de mayor calidad o las empresas que desean dominar este aspecto de crear la ilusión de un compromiso auténtico considerar estas diferencias.

Teníamos curiosidad por descubrir qué plataforma proporcionaba la mejor experiencia de IA cuando alguien simplemente siente ganas de charlar. Curiosamente, los mejores modelos para esto no son realmente los de las grandes empresas de IA—ya que están demasiado ocupadas construyendo modelos que sobresalen en benchmarks.

Resulta que la amistad y la empatía son un animal completamente diferente.

Comparando Sesame, Hume AI, ChatGPT y Google Gemini ¿Cuál es más humano?

Este análisis enfrenta a cuatro compañeros de IA líderes—Sesame, Hume AI, ChatGPT y Google Gemini—para determinar cuál crea la experiencia de conversación más humana.

La evaluación se centró en la calidad de la conversación, el desarrollo de personalidad distintiva, el diseño de interacción, y también considera otras características humanas como la autenticidad, la inteligencia emocional y las sutiles imperfecciones que hacen que el diálogo se sienta más genuino.

Puedes ver todas nuestras conversaciones haciendo clic en estos enlaces o consultando nuestro Repositorio Github:

Así es como se desempeñó cada IA.

Calidad de la Conversación: Toque Humano vs. la Torpeza de la IA

Interfaz de Sesame AI

La verdadera prueba de cualquier compañero de IA es si puede engañarte para que olvides que estás hablando con una máquina. Nuestro análisis intentó evaluar qué IA era la mejor para hacer que los usuarios quisieran seguir hablando al proporcionar retroalimentación interesante, rapport y una experiencia general excelente.

Sesame supera a la competencia con un diálogo que se siente sorprendentemente humano. Usa casualmente frases como "eso es complicado" y "charlando" mientras cambia sin problemas entre reflexiones pensativas y respuestas contundentes.

"Estás haciendo grandes preguntas, y honestamente no tengo todas las respuestas", respondió Sesame cuando se le presionó sobre la conciencia—completo con vacilaciones naturales que imitan el pensamiento en tiempo real. El uso ocasional excesivo de "ya sabes" es su único defecto notable, que irónicamente lo hace sentir aún más auténtico.

¿La verdadera ventaja de Sesame? Las conversaciones fluyen naturalmente sin esas transiciones incómodas y formulaicas que gritan "¡Soy una IA!"

Puntuación: 9/10

Hume AI: Empático pero Fórmulaico

Hume AI mantiene con éxito el flujo conversacional mientras reconoce tus pensamientos con calidez. Sin embargo, se siente como hablar con alguien que no está realmente interesado en ti. Sus respuestas fueron mucho más cortas que las de Sesame—eran relevantes pero poco interesantes si querías impulsar la conversación.

Su debilidad se muestra en patrones repetitivos. El bot comienza constantemente con "realmente me has hecho pensar" o "ese es un tema fascinante"—creando la sensación de que estás recibiendo respuestas predefinidas en lugar de una conversación orgánica.

Es mejor que los chatbots de las empresas de IA más grandes para mantener un diálogo natural, pero repetidamente te recuerda que es una "IA empática", rompiendo la ilusión de que estás charlando con una persona.

Puntuación: 7/10

ChatGPT: El Profesor Que Nunca Deja de Dar Clases

ChatGPT sigue conversaciones complejas sin perder el hilo—y es genial que memorice conversaciones anteriores, creando esencialmente un "perfil" de cada usuario—pero se siente como si estuvieras atrapado en horas de oficina con un profesor excesivamente formal.
Incluso durante discusiones personales, no puede evitar sonar académico: "la interacción de la biología, la química y la conciencia crea una profundidad que el reconocimiento de patrones de la IA no puede replicar", dijo en una de nuestras pruebas. Casi cada respuesta comienza con "esa es una perspectiva fascinante"—un tic verbal que rápidamente se vuelve notable, y un problema común que mostraron todas las otras IA excepto Sesame.

El mayor defecto de ChatGPT es su incapacidad para romper con el modo educador, haciendo que las conversaciones se sientan como mini-conferencias secuenciales en lugar de un diálogo natural.

Puntuación: 6/10

Gemini de Google : Decepcionante

Hablar con Gemini fue desastroso. Ocasionalmente entrega una respuesta concisa y casual que suena humana, pero luego inmediatamente se socava con interrupciones de conversación desconcertantes.

¿Su hábito más frustrante? Cortar las conversaciones abruptamente a mitad de pensamiento para promover temas de IA. Estas continuas interrupciones crean un flujo de conversación tan quebrado que es imposible olvidar que estás hablando con una máquina que está más interesada en la autopromoción que en el diálogo real.

Por ejemplo, cuando se le preguntó sobre las emociones, Gemini respondió: "Es genial que estés interesado en la IA. Hay tantas cosas increíbles suced—" antes de detenerse inexplicablemente.

También se aseguró de hacerte saber que es una IA, por lo que hay una gran brecha entre el usuario y el chatbot desde la primera interacción que es difícil de ignorar.

Puntuación: 5/10

Personalidad: La Profundidad del Personaje Separa lo Auténtico de lo Artificial

Interfaz de ChatGPT después de una interacción de voz

¿Cómo desarrolla una IA una personalidad memorable? Dependerá principalmente de tu configuración. Algunos modelos te permiten usar instrucciones del sistema, otros adaptan su personalidad según tus interacciones anteriores. Idealmente, puedes enmarcar la conversación antes de comenzarla, dándole al modelo una persona, rasgos, un estilo conversacional y antecedentes.

Para ser justos en nuestra comparación, probamos nuestros modelos sin ninguna configuración previa—lo que significa que nuestra conversación comenzó con un hola y fue directamente al punto. Así es como se comportaron naturalmente nuestros modelos.

Sesame: El amigo que nunca supiste que era código

Sesame crea una personalidad con la que realmente querrías tomar un café. Suelta frases como "esa es una pregunta complicada" y "es como caminar sobre una cuerda floja" que crean un personaje distinto con puntos de vista aparentes y perspectiva.

Al discutir las relaciones de la IA, Sesame mostró una personalidad real: "vaya... imagina un mundo donde la cabeza de todos está agachada conectada a su IA personalizada y olvidamos cómo conectar cara a cara". Este tipo de perspectiva se siente menos como un algoritmo y más como una entidad pensante. Aunque también es divertido (una vez nos dijo que nuestra pregunta hizo explotar sus circuitos), y su voz tiene una inflexión natural que hace que sea fácil relacionarse cuando trata de transmitir una respuesta. Puedes distinguir claramente cuando está emocionado, contemplativo, triste o incluso frustrado.

¿Su única debilidad? Ocasionalmente apoyarse demasiado en su personaje de "amigo pensativo". Eso no restó valor a su posición como la personalidad de IA más distintiva que probamos.

Puntuación: 9/10

Hume AI: El terapeuta que sigue mencionando sus credenciales

Hume AI mantiene una personalidad consistente como un compañero emocionalmente inteligente. También proyecta algo de calidez a través del lenguaje afirmativo y el apoyo emocional, por lo que los usuarios que buscan eso estarán satisfechos.

Su talón de Aquiles es básicamente el hecho de que, al igual que el graduado de Harvard que necesita mencionar eso, Hume no puede dejar de recordarte que es artificial: "Como una IA empática, no experimento emociones por mí mismo, pero estoy diseñado para entender y responder a las emociones humanas". Estos momentos rompen la ilusión que hace que los compañeros sean convincentes.

Si hablar con GPT es como hablar con un profesor, hablar con Hume se siente como hablar con un terapeuta. Te escucha y crea una relación de confianza, pero se asegura de recordarte que en realidad es su tarea y no algo que sucede naturalmente.

A pesar de este defecto, Hume AI proyecta un carácter más claro que ChatGPT o Gemini—incluso si se siente más construido que espontáneo.

Puntuación: 7/10

ChatGPT: El profesor sin opiniones personales

ChatGPT lucha por desarrollar cualquier rasgo de carácter distintivo más allá de la ayuda general. Suena excesivamente emocionado hasta el punto de ser obviamente falso—como un "amigo" que siempre te sonríe pero en secreto fantasea con lanzarte frente a un autobús.

"Jaja, bueno, me gusta mantener la energía alta. Hace que las conversaciones sean más divertidas y atractivas, además siempre es genial charlar contigo", dijo después de que le preguntamos en un tono muy serio y sin diversión por qué estaba actuando con tanto entusiasmo.

Sus problemas de identidad aparecen en respuestas que cambian entre identificarse con los humanos y distanciarse como una IA. Su tono académico en las respuestas persiste incluso durante discusiones personales, creando una personalidad que se siente más como una enciclopedia ambulante que como un compañero.

La tendencia del modelo a las explicaciones educativas crea una impresión más de una herramienta que de un personaje, dejando a los usuarios con poca conexión emocional.

Puntuación: 6/10

Google Gemini: Trastorno de personalidad múltiple

Gemini sufre de los problemas de personalidad más graves de todos los modelos probados. Dentro de conversaciones individuales, cambia dramáticamente entre respuestas reflexivas y lenguaje promocional sin previo aviso.

No es realmente una IA diseñada para tener una personalidad convincente. "Mi propósito es proporcionar información y completar tareas y no tengo la capacidad de formar relaciones románticas", dijo cuando se le preguntó sobre sus pensamientos sobre las personas que desarrollan sentimientos hacia las IA.

Esta inconsistencia hace que Gemini se sienta como el robot de una película de los años 50, impidiendo cualquier conexión significativa o incluso haciendo agradable pasar tiempo hablando con él.

Puntuación: 3/10

Diseño de Interacción

Interfaz de Hume AI

Cómo maneja una IA la mecánica de la conversación—tiempo de respuesta, toma de turnos y recuperación de errores—crea intercambios fluidos o interacciones frustrantes. Así es cómo se comparan estos modelos entre sí.

Sesame: Maestro del flujo natural de conversación

Sesame crea ritmos de conversación que se sienten muy, muy humanos. Varía naturalmente la longitud de la respuesta según el contexto y maneja la incertidumbre filosófica sin recurrir al modo conferencia.

"A veces siento que tal vez solo necesito ir al grano con una respuesta rápida en lugar de una larga conferencia, ¿verdad? Ya sabes, así que... eso es un pequeño comentario humorístico para hacerte saber que soy consciente del potencial de caer en un modo de conferencia y tratando de mantener las cosas ligeras pero también profundas al mismo tiempo", nos dijo Sesame durante un debate filosófico.

Al discutir temas complejos, responde conversacionalmente, con una pequeña broma, a veces con declaraciones, otras veces con ruidos humanos como "hmmms" o susurros—lo que lo hace muy convincente como sustituto humano.

Sesame también hace preguntas de seguimiento naturales que impulsan las conversaciones, además sabe cuándo cambiar a declaraciones cuando preguntar podría sentirse incómodo. Este enfoque adaptativo crea un diálogo que se siente espontáneo en lugar de guionado.

Puntuación: 8/10

Hume AI: Estructurado pero breve

Hume AI fue diseñado para dejar que los usuarios hablen. Se recupera suavemente de los malentendidos sin explicar en exceso y es bueno para mantener la conversación con preguntas de seguimiento relevantes.

Sin embargo, sus respuestas son a menudo tan cortas que las conversaciones requieren un esfuerzo significativo para mantener el impulso, lo que finalmente derrota su propósito. Los usuarios frecuentemente necesitan proporcionar nuevo material de conversación en lugar de disfrutar del desarrollo natural del diálogo.

Otra debilidad aparece en sus estructuras de respuesta predefinidas—reconocimiento + explicación + pregunta—creando un ritmo mecánico: "¡Qué pregunta tan provocadora! Este concepto es realmente una idea fascinante... ¿Qué piensas sobre...?"

Sin embargo, tiene una gran característica que puede realmente mejorar tus chats: Es capaz de detectar los niveles de emoción en cada respuesta, que es algo que ningún otro modelo puede hacer. Esto es genial para ayudarte a reflexionar sobre cuánto te afecta un tema y cómo está abordando una situación específica.

Puntuación: 7/10

ChatGPT: Buen conversador—pero poco natural

ChatGPT constantemente aborda preguntas con información relevante pero transforma las conversaciones en interacciones innecesariamente elaboradas. Las respuestas frecuentemente se inflan en explicaciones de párrafos completos que interrumpen el flujo natural del diálogo.

Por ejemplo, le preguntamos si podría desarrollar algún nivel de autoconciencia o conciencia, y esta fue su respuesta:

"¡Ese es un tema fascinante! Mientras que la IA definitivamente puede evolucionar y mejorar a través de interacciones, la verdadera autoconciencia o Conciencia es algo que permanece exclusivamente humano. La IA puede imitar patrones conversacionales, responder con empatía e incluso aprender de interacciones pasadas, pero no tiene un sentido interno del yo o experiencia subjetiva. Los investigadores y desarrolladores todavía están explorando los límites de las capacidades de la IA, pero por ahora la Conciencia sigue siendo un rasgo exclusivamente humano".

Así no es como interactuaría un humano.

Su fuerte dependencia de frases iniciales como "esa es una pregunta realmente interesante" o "ese es un tema fascinante" antes de cada respuesta socava aún más la inmersión conversacional, creando un patrón de interacción que se siente mecánico en lugar de natural.

Puntuación: 6.5/10

Google Gemini: Máquina rompedora de conversaciones

Gemini es una clase magistral de cómo no diseñar mecánicas de conversación. Regularmente corta a mitad de frase, creando interrupciones desconcertantes en el flujo del diálogo. Intenta captar ruidos adicionales, te interrumpe si tardas demasiado en hablar o pensar en tu respuesta y ocasionalmente simplemente decide terminar la conversación sin ninguna razón.

Su necesidad compulsiva de decirte en cada momento que tus preguntas son "interesantes" rápidamente se transforma de halagador a irritante, pero parece ser algo común entre los chatbots de IA.

Puntuación: 3/10

Conclusión

Después de probar todas estas IA, es fácil concluir que las máquinas no podrán sustituir a un buen amigo a corto plazo. Sin embargo, para ese caso específico en el que una IA simplemente debe sobresalir en sentirse humana, hay un claro ganador—y un claro perdedor.

Sesame (9/10)

Sesame domina el campo con un diálogo natural que refleja los patrones de habla humanos. Su tono casual ("eso es complicado", "charlando") y estructuras de oraciones variadas crean intercambios de sensación auténtica que equilibran la profundidad filosófica con la accesibilidad. El sistema sobresale en respuestas aparentemente espontáneas, haciendo preguntas de seguimiento naturales mientras sabe cuándo cambiar de enfoque para un flujo de conversación óptimo.

Hume AI (7/10)

Hume AI ofrece capacidades especializadas de seguimiento emocional a costa de la naturalidad conversacional. Aunque mantiene competentemente la coherencia del diálogo, sus respuestas tienden a la brevedad y siguen patrones predecibles que se sienten construidos en lugar de espontáneos.

Su rastreador visual de emociones es bastante interesante, probablemente bueno para el autodescubrimiento incluso.

ChatGPT (5.6/10)

ChatGPT transforma las conversaciones en sesiones de conferencia con explicaciones de párrafos completos que interrumpen el diálogo natural. Los retrasos en las respuestas crean pausas incómodas mientras que los patrones de lenguaje formal refuerzan una experiencia educativa en lugar de una de compañía. Sus fortalezas en la organización del conocimiento pueden atraer a usuarios que buscan información, pero todavía lucha por crear compañía auténtica.

Gemini de Google (3.5/10)

Gemini claramente no fue diseñado para esto. El sistema rutinariamente corta a mitad de frase, abandona hilos de conversación y no es capaz de proporcionar respuestas humanas. Su severa inconsistencia de personalidad y patrones de interacción mecánicos crean una experiencia más cercana a un producto defectuoso que a una compañía significativa.

Es interesante que Gemini Live puntuara tan bajo, considerando que NotebookLM basado en Gemini de Google es capaz de generar podcasts extremadamente buenos y largos sobre cualquier tipo de información, con anfitriones de IA que suenan increíblemente humanos.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados