En Resumen
- OpenAI lanzó "Fine-tuning" para GPT-3.5 Turbo, permitiendo ajustar el modelo con datos personalizados para mejorar su rendimiento.
- La nueva función ayuda a crear experiencias personalizadas como chatbots con la voz de una marca o código a medida.
- OpenAI busca liderar la industria IA dando más control a sus usuarios para moldear las herramientas IA a sus necesidades.
OpenAI continúa en racha, anunciando actualizaciones consecutivas que permiten a los usuarios personalizar dos de sus modelos de IA más populares.
El mes pasado, la compañía reveló que los usuarios de ChatGPT ahora pueden proporcionar "instrucciones personalizadas" para mejorar las respuestas del chatbot. Ahora, OpenAI anunció que el ajuste "Fine-tuning" está disponible para GPT-3.5 Turbo, permitiendo a los desarrolladores de IA lograr un rendimiento mejorado en tareas específicas a través de datos especializados.
Estas mejoras podrían permitir a la compañía mantener su liderazgo sobre competidores bien financiados como Bard de Google o Claude de Anthropic.
"Acabamos de lanzar Fine-tuning para GPT-3.5 Turbo", anunció OpenAI en Twitter. "El Fine-tuning te permite entrenar el modelo con los datos de tu empresa y ejecutarlo a gran escala".
"Las pruebas iniciales han demostrado que GPT-3.5 Turbo ajustado con Fine-tuning puede igualar o superar a GPT-4 en tareas específicas", agregó.
We've just launched fine-tuning for GPT-3.5 Turbo! Fine-tuning lets you train the model on your company's data and run it at scale. Early tests have shown that fine-tuned GPT-3.5 Turbo can match or exceed GPT-4 on narrow tasks: https://t.co/VaageW9Kaw pic.twitter.com/nndOyxS2xs
— OpenAI (@OpenAI) August 22, 2023
OpenAI explicó que con el Fine-tuning, los desarrolladores pueden dar forma directamente a las habilidades de GPT-3.5 Turbo para que se adapten a sus necesidades. Por ejemplo, un desarrollador podría ajustar GPT-3.5 Turbo con Fine-tuning para generar código personalizado o resumir documentos legales en alemán impecable después de alimentarlo con un corpus de datos existentes de toda la empresa del cliente.
Esta capacidad es especialmente valiosa para empresas y desarrolladores que crean experiencias de usuario personalizadas. Por ejemplo, las empresas pueden ajustar el modelo para que se alinee con la voz de su marca y asegurarse de que un chatbot tenga una personalidad y tono complementarios.
El poder de la personalización también se puede ver en la comunidad de desarrolladores de Stable Diffusion. Los modelos SD v1.5 ajustados han logrado un nivel de calidad que supera al modelo base, al más capaz v2.1 e incluso se pueden comparar favorablemente con el SDXL de última generación que se lanzó recientemente.
Además, los beneficios del Fine-tuning se extienden a una mejor manejabilidad, un formato de salida consistente y reducciones en el tamaño de las indicaciones, según OpenAI, lo que conduce a respuestas más rápidas de la API y costos reducidos. Por ejemplo, las indicaciones podrían reducirse hasta en un 90%, acelerando los flujos de trabajo y reduciendo los costos.
Mientras que los modelos base GPT-3.5 Turbo comienzan en $0.0004 por 1,000 tokens (la unidad básica de información manejada por un modelo de lenguaje grande), las versiones mejoradas tienen un precio más alto de $0.012 por 1,000 tokens de entrada y $0.016 por 1,000 tokens de salida.
El proceso de entrenamiento inicial también incurre en tarifas basadas en el tamaño de los datos. Aun así, el precio premium puede valer la pena por la capacidad de personalización, además te da acceso a las "instrucciones personalizadas" introducidas para los usuarios de ChatGPT Plus que fueron anunciadas en julio.
Por ejemplo, los usuarios podrían especificar su lenguaje de programación preferido para asegurarse de que ChatGPT siempre sugiera soluciones en Python. Otras opciones de personalización recomendadas por OpenAI incluyen ubicación, hobbies, metas y tono preferido.
Las instrucciones personalizadas permiten a los usuarios dar forma a ChatGPT en un asistente digital personalizado ajustado a sus necesidades únicas. Cada conversación seguirá las pautas, eliminando la molestia de repetir preferencias. En lugar de ser un modelo completamente nuevo, la actualización es un modelo que adopta una mentalidad diferente, por así decirlo.
La compañía ha implementado medidas para garantizar el uso responsable de la función Fine-tuning.
"Para preservar las características de seguridad del modelo predeterminado a través del proceso de Fine-tuning, los datos de entrenamiento de Fine-tuning pasan por nuestra API de Moderación y un sistema de moderación impulsado por GPT-4", explica OpenAI. Este sistema intenta identificar y anular datos de entrenamiento inseguros, asegurando que incluso la salida personalizada esté en línea con los estándares de seguridad de OpenAI.
Esto quiere decir que OpenAI tiene cierto nivel de control sobre los datos que los usuarios ingresan en sus modelos.
Con el lanzamiento de Fine-tuning y las instrucciones personalizadas, OpenAI está otorgando más control a los usuarios que buscan moldear los modelos según sus requisitos exactos.
A medida que la batalla por la supremacía en la IA generativa continúa, la personalización puede ser la próxima frontera que le dé a OpenAI una ventaja. Sin embargo, por ahora, estas capacidades siguen siendo algo exclusivas para los clientes que pagan.