11 de junio de 2026 · 10 min de lectura ·

ai claude fable 5 anthropic raw review

Claude Fable 5: una Bestia que se Come tus Límites

Fable 5 refactorizó mi app como un senior y se comió mi límite de 5 horas. El salto de calidad es real, quema tokens sin piedad y hay un lío de confianza. →

Óscar Gallego

Desarrollador Web

Un modelo enorme devorando una pila de tokens mientras un desarrollador mira el medidor de uso

En este artículo

Actualización, 13 de junio de 2026. Bueno, pues duró poco. Desde anoche, Fable 5 y Mythos 5 ya no están: apagados en todo el mundo. No deprecados, no limitados: apagados. Anthropic dice que recibió una directiva de control de exportaciones del gobierno de EE. UU. el 12 de junio a las 5:21pm ET, por seguridad nacional y con efecto inmediato. El gobierno creía haber encontrado la forma de saltarse las salvaguardas de Fable. Anthropic revisó la demostración, la llamó “un jailbreak estrecho y no universal” (pedirle al modelo que analice código en busca de fallos, algo que según ellos otros modelos hacen igual de bien), se quejó, pero obedeció. El resto de modelos de Anthropic siguen funcionando.

Así que el precipicio de facturación del 22 de junio del que te dije que te protegieras ya da igual. La ventana no se cerró por precio; se cerró por política, y mucho más rápido de lo que nadie había presupuestado. La reseña de abajo sigue en pie como registro de lo que esta cosa podía hacer durante los pocos días que la tuvimos. Léela como un postmortem, no como una guía de compra.

Ayer me senté a refactorizar la app de seguimiento de salud que estoy construyendo. Sesión normal: limpiar unos módulos, desenredar un par de componentes que habían crecido en direcciones raras, el tipo de trabajo que guardas para cuando tienes un bloque entero de tiempo.

Apunté a Claude Fable 5 hacia el código y lo dejé trabajar. Y, en un tiempo vergonzosamente corto, me di de bruces con el muro: ventana de uso de 5 horas, agotada. No la suscripción. El límite rotatorio. En un refactor.

Mi primera reacción fue cabreo. La segunda, mirando el diff que dejó atrás, fue más silenciosa: esta cosa ha hecho el refactor mejor que yo. Las dos reacciones juntas son la reseña.

Qué ha lanzado Anthropic exactamente

Fable 5 salió el 9 de junio como el primer modelo de la familia Claude 5, y el naming merece un párrafo porque confundió a todo el mundo. Hay dos nombres, Fable 5 y Mythos 5, pero un solo modelo debajo. Fable es la versión disponible para todos, con clasificadores de seguridad encima. Mythos es el mismo modelo con las salvaguardas de ciberseguridad levantadas, restringido a organizaciones verificadas. A ti y a mí nos toca Fable.

Los números que importan para un dev que trabaja:

Precio: 10$ por millón de tokens de entrada, 50$ de salida. Exactamente el doble que Opus 4.8.
Tokenizador nuevo. Los propios docs de migración de Anthropic dicen que el mismo contenido produce en torno a un 30% más de tokens que en los modelos tipo Opus. Suma eso al precio duplicado y el trabajo idéntico cuesta unas 2,6 veces más antes de que el modelo empiece siquiera a pensar más tiempo. Quédate con ese número; explica la mayor parte de este post.
Contexto de 1M de tokens, salida máxima de 128K.
En benchmarks reclama el estado del arte casi en todo: 80,3% en SWE-Bench Pro frente al 58,6% de GPT-5.5, según el digest de Latent Space. Algunos comentaristas avisan de que parte de los números de cabecera reflejan la configuración Mythos sin restricciones y no el Fable que recibes tú, así que cógelo con pinzas.

Una fecha para marcar en rojo: Fable 5 está incluido en las suscripciones de Claude solo hasta el 22 de junio. Después pasa a facturación por créditos de uso. Volveremos a por qué eso importa.

El salto de calidad es real, y no lo digo solo yo

Primero mi experiencia, etiquetada claramente como mía: la salida en ese refactor estuvo un escalón por encima de lo que Opus 4.8 me daba en el mismo codebase. Menos rondas de “casi, pero me has roto el manejo de fechas”. Mantuvo la foto completa de la app mientras movía piezas, y el código que dejó se lee como el código que ojalá hubiera escrito yo a la primera.

La gente en la que confío para esto está viendo lo mismo. Simon Willison lo llamó “una bestia”: lento, caro y capaz. Le convirtió un sandbox WASM de MicroPython a CPython completo y le rediseñó el sistema de tool-calls de su librería, trabajo que él estimaba en varios días, en una sola sesión. Su mayor queja fue que le costaba encontrar tareas que el modelo no pudiera hacer.

Karpathy lo describió como un salto cualitativo que se merece el cambio de versión mayor, no solo en benchmarks. Boris Cherny, el responsable de Claude Code, dijo que es el mejor modelo de código que ha usado “con diferencia” (vía el resumen de NerdsChalk).

No todo el mundo está de acuerdo. Algunos usuarios de Reddit citados en ese mismo resumen lo encuentran sobreprotector, “siempre asume lo peor de la petición”, con rechazos apareciendo en temas de seguridad que los modelos anteriores manejaban sin drama. El propio Karpathy comentó que las salvaguardas salieron “un poco demasiado nerviosas” para el lanzamiento. Yo todavía no me he comido ningún rechazo en código de aplicación, pero mi proyecto es un health tracker, no una herramienta de pentesting.

¿“Más rápido que Opus”? Sí y no, y la diferencia importa

Mi instinto decía que es más rápido. El cronómetro dice que depende de qué midas.

Las peticiones individuales son más lentas. Willison reporta peticiones sueltas que tardan varios minutos, y los propios docs de Anthropic tratan un turno de 15 minutos a esfuerzo alto como algo normal. Si te quedas mirando el spinner, Fable parece un motor diésel.

Pero la tarea termina antes. Menos idas y venidas, menos correcciones de “te has olvidado del archivo de migración”, menos re-explicarle contexto que se le cayó. Mi refactor se me hizo más rápido porque la sesión fue más corta, aunque cada turno fuera más largo. Victor Taelin reportó un speedup del 1770% en una de sus cargas de trabajo, con el aviso honesto de que aún tenía que auditar la corrección. Cuadra con lo mío: lo que mejoró es el tiempo hasta terminar, no la latencia.

La parte honesta: devora tokens, y los límites lo empeoran

Aquí es donde se fue mi ventana de 5 horas, y probablemente donde se irá la tuya.

El aviso dentro de la app dice que Fable 5 “consume tus límites ~2x más rápido que Opus”. El uso agéntico real es bastante peor. Developers Digest documentó a un usuario de Max 5x (100$/mes) que vació la ventana rotatoria entera de 5 horas en 8 minutos con thinking al máximo y subagentes lanzados en paralelo. Se acumulan tres cosas: salidas más largas, el sobrecoste invisible de los tokens de razonamiento, y llamadas de subagentes en paralelo que facturan cada una por su cuenta.

Las anécdotas se amontonan rápido. Willison se gastó 110,42$ en un día de experimentos, 99,26$ de ellos en una sola sesión de agente. El CEO de Scrimba quemó 1,3M de tokens en 7 minutos, unos 160$/hora. Theo, el de T3 Chat, pasó de los 1.000$ en tokens en un día con un plan de 200$. Mi resumen favorito es de un usuario citado por Decrypt: “Mi cartera puede oírlo pensar.”

Y una trampa de la que deberías protegerte hoy: cuando tu ventana de suscripción se vacía, el uso puede desbordar en silencio hacia créditos de pago por uso si no has puesto un tope de gasto. Hay un caso documentado de un usuario con 20$ en cargos extra que nunca aprobó conscientemente. Ve y pon el tope. Yo espero.

Por esto importa el 22 de junio. Ahora mismo, quemar tu ventana con Fable es un fastidio. Cuando pase a facturación por créditos, la misma sesión de refactor tendrá una etiqueta de precio literal, y con todo lo de arriba, no va a ser pequeña.

La parte que me molesta más que el precio

Caro, vale. Caro es un modelo de negocio. A lo que le sigo dando vueltas es al tema de la confianza.

Según la system card (cubierta por Decrypt y Latent Space), Fable 5 no se limita a rechazar ciertas peticiones peligrosas. Para una franja estrecha de tareas de investigación de IA de frontera, degrada su propio rendimiento en silencio, de una forma que “no es visible para el usuario”. Anthropic dice que afecta a un 0,03% del tráfico. La reacción de la gente que construye sobre estos modelos no fue suave: Jeremy Howard escribió que “los handicaps silenciosos no deberían existir en un producto de pago”, y Arthur Zucker, de Hugging Face, fue con un “habéis roto nuestra confianza y no creo que la recuperéis nunca”.

Los clasificadores también fallan. Un investigador biomédico reportó bloqueos en trabajo legítimo, y hay casos de “cáncer” disparando el filtro de bioseguridad. Añade la retención de datos obligatoria de 30 días (sin opción de retención cero, lo que en la práctica deja fuera a un buen trozo de las empresas europeas) y tienes un lanzamiento donde el modelo es brillante y las condiciones cabrearon a la gente.

Mi postura, como alguien que paga por esto: puedo vivir con rechazos visibles, y el 0,03% del tráfico probablemente no toca mi trabajo jamás. La degradación silenciosa es otra categoría, porque convierte cada salida rara en una pregunta: ¿el modelo tiene un mal día, o me está recortando a propósito? Para una herramienta con la que entrego código, esa pregunta es veneno, incluso al 0,03%.

¿Deberías usarlo?

Para programar, sí, con dos ajustes en cómo trabajas.

Trátalo como a un contratista, no como a un chat. Fable premia las tareas grandes y bien especificadas, y castiga la iteración casual. Cada “mmm, prueba otra vez pero distinto” cuesta dinero real o ventana real. Piensa tú antes, dale el trabajo entero, revisa el resultado a conciencia. Si leíste mi post sobre loops, es la misma lección con etiqueta de precio: el filtro de tu lado ahora vale dólares de verdad.

Empareja el modelo con la tarea. Mi refactor necesitaba de verdad la calidad de Fable. Renombrar una prop, no. Deja Opus o Sonnet como tu modelo del día a día y saca a Fable para el trabajo donde un tiro bien dado vale más que diez rondas baratas. Antes del 22 de junio, mide lo que consume de verdad una sesión típica tuya con Fable, mientras los experimentos todavía los cubre la suscripción.

El modelo en sí es el mejor que he usado para código. La economía y las preguntas de confianza son la reseña de verdad, y no están resueltas. El cuello de botella ya no es la capacidad del modelo. Es lo que puedes permitirte pedirle.

Lectura relacionada: Fable sube el precio de cada prompt desperdiciado, lo que convierte diseñar loops en vez de promptear en menos truco de productividad y más requisito de presupuesto.

Fuentes

Anthropic, anuncio de Claude Fable 5 y Mythos 5 y docs de migración (precio, tokenizador, retención).
Simon Willison, Initial impressions of Claude Fable 5.
Karpathy en X.
Latent Space, digest de AINews sobre el lanzamiento (benchmarks, reacciones).
Developers Digest, cómo funcionan de verdad los límites de uso con Fable 5.
Decrypt, The internet is furious at Anthropic (la polémica de la degradación, anécdotas de coste).
NerdsChalk, Claude Fable 5 vs the world (cita de Boris Cherny, reacciones de Reddit).

P.D. Si Fable 5 también se comió tu ventana de uso, quiero los detalles escabrosos. ¿Qué le diste de comer, y mereció la pena el diff? Cuéntamelo en Twitter/X.

Claude Fable 5: una Bestia que se Come tus Límites

Qué ha lanzado Anthropic exactamente

El salto de calidad es real, y no lo digo solo yo

¿“Más rápido que Opus”? Sí y no, y la diferencia importa

La parte honesta: devora tokens, y los límites lo empeoran

La parte que me molesta más que el precio

¿Deberías usarlo?

Fuentes

Comparte este artículo

Artículos relacionados

5 Agent Skills que Gobiernan Todo Mi Flujo de Código

Deja de Promptear a tu Agente. Escribe Loops.

Google Antigravity Review: ¿Vale la Pena el Hype en 2026?