Token-schaarste vraagt geen AI-paniek, maar beter werkontwerp

Van token-paniek naar volwassen AI-gebruik
Wanneer AI-kosten zichtbaarder worden, ontstaat snel een reflex: ofwel alles moet goedkoper, ofwel het duurste model blijft de veilige standaard. Beide reacties zijn te grof. Token-schaarste betekent niet automatisch dat AI-gebruik moet worden afgeremd. Het betekent vooral dat organisaties moeten leren waar zware AI-capaciteit echt waarde toevoegt, en waar een eenvoudiger route voldoende is.
Voor teams die AI serieus willen inzetten, verschuift de vraag daarom van “welk model is het beste?” naar “welke taak vraagt welk niveau van redenering, context en controle?” Dat is een andere manier van kijken. Niet de modelnaam staat centraal, maar het werk dat moet gebeuren: classificeren, samenvatten, schrijven, analyseren, controleren, beslissen of escaleren.
Die verschuiving is gezond. In de eerste fase van AI-adoptie experimenteren teams vaak royaal: veel prompts, veel context, veel herhalingen en weinig inzicht in kosten per taak. In een volwassen fase wordt AI-gebruik meer ontworpen. Dan kijk je naar taaktypes, risico, herwerk, foutgevoeligheid en de waarde van een betere uitkomst. Pas daarna kies je het modelniveau.
Niet elke taak verdient een frontiermodel
Een veelgemaakte fout is dat alle AI-taken naar hetzelfde zware model gaan. Dat voelt overzichtelijk, maar het maakt workflows duurder en minder leerzaam. Een simpele classificatie van een inkomende aanvraag vraagt bijvoorbeeld een ander niveau dan het beoordelen van een complex contractvoorstel of het schrijven van een strategische analyse. Als je die taken gelijk behandelt, mis je zowel kostencontrole als kwaliteitsinzicht.
Een praktische indeling begint met vier routes. Route één is geen model: een template, vaste regel of bestaande automatisering is genoeg. Route twee is een lichter model voor eenvoudige tekstbewerking, labeling of standaardvragen. Route drie is een zwaarder model voor taken met meer context, nuance of redenering. Route vier is menselijke beoordeling, eventueel ondersteund door AI, wanneer de foutimpact groot is of de context te gevoelig.
Deze indeling is geen pleidooi om altijd het goedkoopste te kiezen. Soms is een sterker model verstandiger omdat het minder herwerk veroorzaakt of betere tussenstappen oplevert. Het punt is dat die keuze expliciet moet zijn. Kostenbewust werken is niet hetzelfde als bezuinigen op kwaliteit; het is weten waarom een bepaalde taak een bepaalde AI-route krijgt.

Routing is werkontwerp, geen technisch trucje
AI-routing klinkt technisch, maar de kern is organisatorisch. Iemand moet bepalen welke taken binnenkomen, hoe ze worden herkend, welke informatie nodig is, wanneer een model mag antwoorden en wanneer een mens moet meekijken. Zonder die afspraken blijft routing een losse toolinstelling. Met die afspraken wordt het een werkproces dat teams kunnen verbeteren.
Een goede AI-workflow bevat minimaal zes bouwstenen: intake, classificatie, modelkeuze, escalatie, logging en evaluatie. Bij intake bepaal je welke vraag of taak binnenkomt. Bij classificatie herken je het type werk. Bij modelkeuze koppel je taak en risico aan het passende modelniveau. Bij escalatie leg je vast wanneer de workflow stopt of naar een mens gaat. Logging zorgt dat je later kunt zien wat er gebeurde. Evaluatie maakt verbetering mogelijk.
Voor Funnel Adviseur is dit dezelfde denklijn als bij funnelautomatisering: je automatiseert niet zomaar losse handelingen, je ontwerpt een route. In B2B-processen werkt dat alleen als de overdracht tussen stappen klopt. Wie daar verder over wil nadenken, kan de principes achter AI-automatisering voor B2B-processen vertalen naar interne AI-workflows.
Meet kosten per taak, niet alleen de totaalfactuur
Veel organisaties kijken pas naar AI-kosten wanneer de maandfactuur opvalt. Dat is te laat en te algemeen. Een totale kostenpost vertelt weinig over welke workflow waarde oplevert, welke taak onnodig duur is en waar herwerk ontstaat. Beter is om kosten te verbinden aan taaktypes: hoeveel kost intake, hoeveel kost analyse, hoeveel kost outputcontrole en hoeveel kost correctie achteraf?
Daarbij hoort ook dat je niet alleen tokens telt. Een goedkope AI-stap die regelmatig verkeerde output geeft, kan duur worden door correcties, vertraging of reputatierisico. Een duurdere stap kan verdedigbaar zijn wanneer die aantoonbaar minder herwerk veroorzaakt of een beslissing beter voorbereidt. Kostencontrole vraagt dus om meerdere signalen: modelkosten, doorlooptijd, foutpercentage, herwerk en beslisimpact.
Begin klein. Kies één workflow, bijvoorbeeld het verwerken van klantvragen, het maken van eerste concepten of het samenvatten van dossiers. Label taken per type, test verschillende modelniveaus en vergelijk uitkomsten. Niet op gevoel, maar met vooraf afgesproken criteria. Zo voorkom je discussies waarin de ene persoon alleen naar kwaliteit kijkt en de ander alleen naar kosten.
Twee slechte reacties op AI-kosten
De eerste slechte reactie is alles naar het duurste model sturen. Dat lijkt veilig, maar het maakt teams afhankelijk van één route en belemmert leren. Je ontdekt niet welke taken eenvoudiger kunnen, welke prompts te lang zijn, welke context overbodig is en waar een vaste regel beter werkt. Bovendien wordt AI dan al snel gezien als een oplopende kostenpost in plaats van een ontworpen werklaag.
De tweede slechte reactie is AI-kosten zo hard dichtknijpen dat mensen terugvallen op losse experimenten. Dan verdwijnt het leerproces uit de organisatie. Medewerkers gebruiken verschillende tools, zonder logging, zonder kwaliteitsnorm en zonder gedeelde verbetercyclus. Op papier is het budget dan onder controle, maar in de praktijk ontstaat versnippering.
De middenweg is bewuste begrenzing. Geef teams ruimte om te testen, maar werk met stopregels. Spreek af wanneer een taak niet automatisch verder mag, wanneer een output moet worden gecontroleerd en wanneer een workflow opnieuw moet worden ontworpen. Meer praktische AI-inzichten in de kennisbank kunnen helpen om die afspraken concreet te maken.

Een nuchtere checklist voor AI-teams
Wie token-schaarste praktisch wil aanpakken, kan starten met een eenvoudige checklist. Eén: beschrijf de workflow in gewone taal. Twee: splits het werk op in taaktypes. Drie: bepaal per taak de foutimpact. Vier: kies per taak een eerste modelniveau of niet-modelroute. Vijf: leg vast wanneer escalatie verplicht is. Zes: registreer uitzonderingen en correcties. Zeven: evalueer periodiek of de route nog klopt.
Deze aanpak vraagt geen groot AI-programma om te beginnen. Het vraagt wel discipline. Zonder taakdefinitie wordt elk modelgesprek abstract. Zonder stopregels wordt autonomie te ruim. Zonder logging blijft verbetering gokken. En zonder evaluatie verandert een tijdelijke keuze ongemerkt in een vaste gewoonte.
De belangrijkste les is dus niet dat AI plots te duur wordt, of dat elk bedrijf dezelfde routinglaag nodig heeft. De les is dat AI-gebruik volwassen wordt wanneer organisaties de kosten, risico’s en kwaliteitskeuzes per workflow expliciet maken. Token-schaarste is dan geen paniekverhaal, maar een aanleiding om beter werk te ontwerpen.



