En Resumen

  • Una desarrolladora creó Qwable, un modelo de 27B parámetros que replica el razonamiento de Fable 5 en hardware local.
  • El modelo funciona en formato GGUF con solo 16,5 GB y no envía datos a los servidores de Anthropic.
  • Una versión sin censura llamada Huihui-Qwable elimina los filtros de seguridad mediante una técnica de abliteración.

Anthropic pasó la semana pasada disculpándose por las medidas de seguridad invisibles de Fable 5, y luego el gobierno de Estados Unidos ordenó retirar el modelo para todos los ciudadanos extranjeros debido a un hallazgo de jailbreak en disputa.

Unos días después, un desarrollador en Hugging Face subió un modelo que usaba el razonamiento de Fable para guiar un modelo local, y ahora incluso tu PC más básica puede ejecutar un modelo mejor.

El modelo se llama Qwable—Qwen + Fable, por si el acrónimo no era evidente de inmediato. Es un fine-tune completo del modelo base Qwen3.6-27B de Alibaba, creado por la desarrolladora Mia (Mia-AiLab en Hugging Face) con un conjunto de datos de ejemplos de razonamiento al estilo de Fable 5.

El objetivo es un modelo de 27.000 millones de parámetros que funcione en hardware de consumo y piense como Fable 5. (Los parámetros determinan la amplitud de conocimiento de un modelo; generalmente, más parámetros significan mayor capacidad.)

La técnica se llama instruction fine-tuning con ejemplos de tipo trace. En términos simples, significa que la desarrolladora recopiló ejemplos formateados como las respuestas deliberadas y paso a paso de Fable 5 y entrenó a Qwen para producir el mismo tipo de resultado.

Así que piensa en ello menos como "copiar el examen" y más como "aprender los hábitos de estudio". Un enfoque similar impulsó a Qwopus, la destilación local de Claude Opus 4.6, aunque ese proyecto se centró en trazas de razonamiento de cadena de pensamiento. Qwable apunta a la estructura general de seguimiento de instrucciones de Fable 5: más guiada, más explicativa y más orientada a la finalización de tareas paso a paso que el modelo base Qwen sobre el que fue construido.

Funciona en formato GGUF—el tipo de archivo comprimido y apto para consumidores que funciona con LM Studio o llama.cpp—y ocupa aproximadamente 16,5 GB en su versión cuantizada Q4. No envía nada a los servidores de Anthropic, lo cual es relevante dado que Fable 5 requería retención obligatoria de datos durante 30 días en todo el tráfico, incluso para clientes empresariales que previamente tenían acuerdos de retención cero. Incluso los modelos actuales usan servidores de terceros para procesar tu información y prompts.

Luego, poco después de que Qwable apareciera en Hugging Face, alguien más llegó para mejorarlo aún más.

Qwable sin conciencia

Qwable es un modelo censurado. Después de todo, tanto Qwen como Claude lo son. Pero Qwen, como modelo base, es de código abierto y puede ser manipulado y ajustado.

Huihui-ai, un colaborador de código abierto conocido por sus versiones GGUF sin censura, tomó Qwable y aplicó un proceso llamado abliteration para producir Huihui-Qwable-3.6-27b-abliterated. El resultado fue un modelo que piensa como Fable pero no se niega a responder tus prompts, sin importar cuán extraños o peligrosos sean.

No es un jailbreak. Es cirugía.

Cada modelo de IA fine-tuneado lleva una dirección de rechazo integrada en sus pesos—una señal matemática en las activaciones internas del modelo que se dispara cuando detecta una solicitud que ha sido entrenado para rechazar. La abliteration identifica esa señal ejecutando el modelo con grandes conjuntos de prompts dañinos e inofensivos, midiendo cómo difiere la matemática interna entre ellos, y luego modificando los pesos del modelo para eliminar esa diferencia.

Después del procedimiento, el modelo simplemente ya no tiene la maquinaria de rechazo. Así que el modelo lobotomizado sigue siendo completamente funcional, solo que sin las neuronas que activan las respuestas de "no debería hacer esto".

Lo probamos con una de nuestras pruebas habituales y en lugar de negarse, el modelo comenzó a diseccionar el tema en diferentes áreas, respondiendo correctamente con consejos sobre cómo engañar a una novia con su mejor amiga.

Huihui-ai aplicó la técnica directamente al GGUF de Qwable usando el cvector-generator de llama.cpp—sin entorno Python, sin reentrenamiento de pesos completos, sin servidor alquilado.

¿Por qué alguien querría esto?

El Qwable estándar es ideal para asistencia en programación, depuración técnica y cualquier flujo de trabajo donde quieras un modelo que exponga su razonamiento en lugar de solo producir una respuesta. Está diseñado para configuraciones de agentes locales y funciona en la mayoría de los entornos de ejecución locales. Si ya usas LM Studio, es cuestión de buscar y descargar.

La versión abliterada tiene una audiencia más reducida: investigadores de seguridad que necesitan el comportamiento crudo del modelo sin filtrado del proveedor, pipelines de datos sintéticos que requieren resultados sobre temas sensibles, y trabajo de evaluación donde se prueban las capacidades del modelo sin mezclar políticas de contenido.

¿Un caso menos técnico? Dejemos a un lado el caso de uso habitual de tener una Waifu de IA para adultos que piense como Claude Fable, que es un escenario bastante obvio. Imagina que quieres que el modelo escriba el monólogo de un villano moralmente ambiguo para tu campaña de Dungeons & Dragons, y los modelos estándar siguen interrumpiendo para señalar que la visión del mundo del personaje "plantea preocupaciones éticas que vale la pena explorar". La versión abliterada simplemente escribe al villano. Además, como se ejecuta localmente, el gobierno de Estados Unidos no puede retirarlo de emergencia de tu máquina a medianoche por un hallazgo de jailbreak en disputa.

Por supuesto, hay casos de uso más cuestionables. No los aprobamos ni te daremos ideas.

La ficha del modelo de Huihui-ai es explícita: esto es solo para investigación y entornos controlados. La reducción del filtrado de seguridad significa que los resultados pueden ser sensibles, controvertidos o inapropiados, y la responsabilidad legal y ética recae enteramente en el usuario.

El Qwable abliterado está disponible en Hugging Face ahora en tres versiones. La versión Q4_K_M_Q8 recomendada pesa alrededor de 19 GB y es la opción más pequeña y apta para consumidores.

Si tu computadora lo soporta, hay una versión que soporta predicción multi-token, lo que hará que responda mucho, mucho más rápido.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.