Cuando te limitan o cortan los tokens, ¿te quedas sin trabajo?

Hace apenas unas semanas escribí "Los mejores desarrolladores, consumen menos tokens". La tesis era simple: medir productividad por volumen de tokens es absurdo, el buen desarrollador hace más con menos, y la eficiencia es una disciplina de ingeniería.

Y esta semana 404 publica este reportaje:

Adobe corta el acceso ilimitado a Claude. Citi bloquea Opus 4.7 y GPT-5.5 para todos sus empleados "sin excepción" porque se estaban comiendo el presupuesto. Atlassian pasó de gastar 5 millones de dólares mensuales en AI a 15 millones, y ahora lanzó un dashboard para que cada empleado vea cuánto le cuesta a la empresa su uso de modelos. Amazon apagó su leaderboard interno de consumo de tokens: resultó que gamificar el gasto era una idea estúpida, y dos semanas después aparecieron límites que nadie sabía que existían.

En Slack internos, empleados preguntando: "ahora cómo hago mi trabajo."

Mi predicción se cumplió. Las empresas están forzando a sus desarrolladores a consumir menos tokens. Pero no por convicción, no por eficiencia bien entendida, sino por presupuesto. Y ahí está la trampa: una cosa es elegir la disciplina, y otra muy distinta es que te la impongan a la fuerza.

De la virtud a la ventaja material

Cuando escribí el artículo de mayo, lo planteé como una preferencia casi filosófica. Un ethos. "Yo vengo de un 486 con 16 MB de RAM, siempre traté de hacer más con menos." Sonaba bonito, pero era opinable. Podías leerlo y pensar: "bueno, cada quien con su estilo, yo prefiero tirarle 15 reintentos a Opus y que me lo resuelva."

El reportaje de 404 Media cambia la naturaleza del argumento por completo.

Ya no es una cuestión de estilo. Es una cuestión de supervivencia profesional. Cuando la empresa te raciona los tokens (_y lo va a hacer, si es que no lo hizo ya_) tu capacidad de seguir produciendo depende directamente de cuánto de tu propio criterio conservaste mientras el acceso era ilimitado.

El experimento es involuntario pero perfecto: mismo límite externo para todos, consecuencias radicalmente distintas.

El desarrollador que se acostumbró a tirar prompts mínimos con contexto cero y regenerar quince veces hasta que algo compilara... está paralizado. Su flujo de trabajo era una apuesta al volumen. Sin volumen, no tiene flujo. Las quejas en Slack no son exageración: gente que literalmente delegó su criterio en el modelo y ahora no sabe operar sin él.

El otro, el que usaba la herramienta para revisar código, para tener un mapa general, para acelerar lo que ya sabía hacer... apenas siente el throttling. Porque el pensamiento central sigue siendo suyo. Porque el modelo no reemplazaba su intención, la amplificaba.

El pensamiento sigue siendo mío

Este es el ángulo que me faltaba en mayo. No se trata solo de cuántos tokens consumes, sino de quién está guiando la interacción.

Hay una diferencia fundamental entre "resuélveme esto" y "muéstrame dónde está el problema." La primera delega intención. La segunda la potencia. La primera te deja vulnerable cuando te cortan el acceso. La segunda te convierte en alguien que simplemente trabaja un poco más lento sin el modelo, pero que no deja de trabajar.

Cuando Citi bloquea Opus 4.7 pero mantiene Sonnet 4.6, el desarrollador que sabe *qué preguntar* y *cómo preguntarlo* puede hacer arquitectura con el modelo de menor capacidad. El que no sabe guiar la conversación necesita que el modelo sea suficientemente inteligente para inferir lo que él ni siquiera articuló. Ese se quedó sin herramienta.

Tokenomics no es solo eficiencia, es soberanía

Tokenomics, en el sentido que le di en mayo, no se trata solo de ahorrar plata. Se trata de conservar agencia sobre tu propio trabajo. De no volverte un apéndice de un servicio externo cuyo acceso no controlas.

Las empresas no van a pagar consumo ilimitado para siempre. Eso ya era evidente en mayo. Lo que no era evidente es la velocidad de la corrección. La paciencia corporativa duró menos de dos años.

Y aquí es donde mi argumento da la vuelta completa. No se trata de ser bueno o eficiente por amor al arte. Se trata de que cuando llegue la escasez, el que desarrolló criterio propio y aprendió a guiar la herramienta en vez de ser guiado por ella, sigue en pie. El que no... bueno, los mensajes en Slack hablan por sí solos.

En Fin

Yo todavía hago mi trabajo. No porque tenga acceso a los modelos más caros (_no lo necesito_) sino porque el pensamiento central es mío. La AI acelera, verifica, orienta. Pero la intención, la dirección, el criterio para saber cuándo el modelo está alucinando o tomando un mal camino... eso no está en venta por tokens.

No es virtud. Es ventaja competitiva.

Y ni siquiera empecemos con el hecho de que Accenture esta ofreciendo "consultoría de gestión de tokens"... (_cries in machine spirit_)

Foto de Igor Omilaev en Unsplash

Cuando te limitan o cortan los tokens, ¿te quedas sin trabajo?

0 Comentarios

Dejar un comentario

También te puede interesar

Acerca del Autor

Alex Barrios

Cuando te limitan o cortan los tokens, ¿te quedas sin trabajo?

0 Comentarios

Dejar un comentario

También te puede interesar

Beta Eterno: la normalización de los errores y la mala calidad de Software

Los mejores desarrolladores, consumen menos tokens

Human-Augmented AI Development: El Arte de No Rendirse ante la Máquina

Acerca del Autor

Alex Barrios