Llevo siendo desarrollador de software y fanático de los computadores desde hace más de 20 años. Mi primer computador fue un 486 DX2 con 16 MB de RAM y un disco duro de apenas 512 MB. Con estas especificaciones se pueden imaginar lo complicado que era instalar cosas.
Recuerdo que si quería jugar la primera versión de "Los Sims" tenía que desinstalar todo, dejar solo el sistema operativo, instalar el juego, disfrutarlo por una hora, y luego desinstalar para volver a colocar otros programas.
¡Luego logré conseguir un disco de 1 GB! Todo el espacio del mundo, "¿Cómo voy a hacer para llenar 1 GB de data?" ... 25 años más tarde ... "Mmmm, necesito agregar un par de discos más al NAS de 14 TB".
El punto es que desde el principio siempre estuve acostumbrado a trabajar con pocos recursos, poca RAM, poco disco, y trato de ser eficiente en mi uso de las distintas tecnologías, lo cual también está presente en el uso de LLM y la economía de los tokens.
Recuerdo que si quería jugar la primera versión de "Los Sims" tenía que desinstalar todo, dejar solo el sistema operativo, instalar el juego, disfrutarlo por una hora, y luego desinstalar para volver a colocar otros programas.
¡Luego logré conseguir un disco de 1 GB! Todo el espacio del mundo, "¿Cómo voy a hacer para llenar 1 GB de data?" ... 25 años más tarde ... "Mmmm, necesito agregar un par de discos más al NAS de 14 TB".
El punto es que desde el principio siempre estuve acostumbrado a trabajar con pocos recursos, poca RAM, poco disco, y trato de ser eficiente en mi uso de las distintas tecnologías, lo cual también está presente en el uso de LLM y la economía de los tokens.
Economia de Tokens: Tokenomics
En blockchain, tokenomics es el estudio del diseño y la gestión de activos digitales para crear economías sostenibles basadas en incentivos, a menudo centradas en los principios de escasez y política monetaria. El token es un activo que se posee, se intercambia y se valora.
Sin embargo, en el contexto de los LLM, el token no es un activo, sino la unidad fundamental de consumo: una utilidad medida que representa el trabajo computacional.
Cada interacción con un LLM, desde la solicitud inicial (entrada) hasta la respuesta generada por el modelo (salida), se mide y se factura en tokens. Esto redefine el desafío económico. El objetivo no es manipular el valor de un token escaso, sino optimizar el consumo.
Esta optimización no es solo para ahorrar dinero; es una disciplina de ingeniería. Es volver a hacer más con menos, trayendo esa mentalidad de recursos finitos al mundo de la IA.
El futuro es la eficiencia
Se habla mucho de que el futuro es la eficiencia, y por fin las empresas están entendiendo que no gana quien más tokens gasta, sino quien logra resultados con menos recursos.
¿Cómo lograr el resultado deseado con el mínimo número de tokens, manteniendo un nivel aceptable de rendimiento y coste? La respuesta está en la precisión: prompts claros, contexto quirúrgico y verificar antes de regenerar.
Por eso me parecen absurdos los "leaderboards" que premian al equipo que consume más tokens. Parece que la meta fuera volcar todo nuestro pensamiento en estas herramientas, en vez de coexistir con ellas y utilizarlas como palanca para avanzar en nuestras carreras.
En Fin
Mi naturaleza fundamental se mantiene siempre igual, buscar lograr el mejor resultado con el menor uso de recursos y costes posibles, y este modelo mental es más útil hoy que nunca.
No castiguemos a quien usa la IA como acompañante y aún se atreve a escribir código manualmente porque el LLM nunca logró llegar a la solución que él ya tenía en mente. Ese que utiliza la herramienta para revisar el código, preguntar sobre él y tener un mapa general.
Este modo de pensar estratégico no consume tantos tokens como el que dice "haz todo" con el mínimo de contexto y simplemente le da "inténtalo nuevamente" 15 veces hasta que lo logra.
El primero usa la herramienta para potenciar su intención; el segundo solo quema intentos innecesariamente.
Foto de micheile henderson en Unsplash