Goedkope AI werkt pas als je workflow klopt

Een model van 2 cent kan nog steeds een dure fout maken
Een AI-taak die vandaag 98 procent goedkoper lijkt, kan morgen alsnog duur worden als iemand het resultaat moet herstellen. Dat is de blinde vlek in veel gesprekken over open-source modellen. Men vergelijkt tokenprijs met tokenprijs, terwijl het echte verschil in de operatie eromheen zit.
Modellen zoals GLM 5.2 laten zien dat goedkope intelligentie geen theorie meer is. Voor standaardwerk zijn zulke modellen vaak snel, scherp en verrassend bruikbaar. Denk aan eerste tekstversies, samenvattingen, simpele code, presentatiestructuren, social drafts en analyses die een mens snel kan controleren.
Het verschil zit niet in slimheid, maar in taaksoort
De praktische vraag is niet of GLM, DeepSeek, Claude of OpenAI 'beter' is. De praktische vraag is welk werk je ermee doet. Veel bedrijfswerk zit in het midden van de verdeling: herkenbare formats, duidelijke voorbeelden, voorspelbare output en snelle menselijke controle.
| Taaktype | Goedkoper model | Frontier model |
|---|---|---|
| Eerste blog- of socialdraft | Vaak prima als briefing helder is | Nuttig bij scherpe positionering of gevoelige nuance |
| Routine-samenvatting | Sterk bij duidelijke brondata | Nodig bij juridische of strategische interpretatie |
| Bekende codepatronen | Goed voor eerste pass en refactor-suggesties | Beter bij onbekende architectuur of hoge impact |
| Bedrijfscontext combineren | Kan, mits context schoon wordt aangeleverd | Sterker wanneer veel impliciete context meespeelt |
| Besluiten met reputatierisico | Alleen met strakke review | Vaak verstandiger als eerste route |
Ik zie dit ook in marketingprocessen. Een model kan makkelijk tien LinkedIn-hooks schrijven. Maar of die hooks passen bij je merk, je aanbod, je klantfase en je commerciële prioriteit... dat is geen modelvraag meer. Dat is systeemontwerp.

Waarom bedrijven niet zomaar overstappen
De grootste lock-in zit niet altijd in het contract. Die zit in gemak. Als Claude in Slack hangt, OpenAI in je interne tooling zit en collega’s daar al context in stoppen, dan huur je niet alleen een model. Je huurt een stuk bedrijfsbrein terug.
“You are not replacing a model call. You are replacing a whole work system.”
- Medewerkers vragen om de tools die ze al kennen.
- Bestaande prompts zijn vaak geschreven voor één modelstijl.
- Tool-calls werken per model net anders.
- Memory en context moeten opnieuw ontworpen worden.
- Reviewstappen ontbreken vaak omdat het in de demo wel goed leek.
- IT ziet wel de licentiekosten, maar niet altijd de herstelkosten.
Dat verklaart waarom dure modellen marktmacht houden. Niet omdat elk antwoord magisch beter is, maar omdat de ervaring dichter op het dagelijkse werk zit. Slack, documenten, code, meetings, klantcontext. Precies daar ontstaat afhankelijkheid.
De router wordt belangrijker dan het model
Een volwassen AI-aanpak begint daarom niet met de vraag welk model het goedkoopst is. Begin met een taakrouter. Welke taken zijn laag risico en controleerbaar? Welke taken vragen diepe context? Welke taken mogen nooit zonder menselijke review door?
- Maak een lijst van terugkerende AI-taken in je organisatie.
- Label elke taak als standaard, contextgevoelig of hoog risico.
- Koppel standaardtaken aan goedkopere modellen met vaste output-eisen.
- Laat contextgevoelige taken via een model met betere redeneercapaciteit lopen.
- Zet hoog-risico taken altijd achter review, logging en herleidbare brondata.
- Meet herstelwerk, niet alleen tokenkosten.
Dat klinkt minder spannend dan 'we draaien alles lokaal'. Maar het is wel de stap die kostenbesparing echt bestuurbaar maakt. Anders verplaats je alleen de rekening: van tokenkosten naar herstelwerk, vertraging en twijfel.
Voor een directieteam is dit vooral handig omdat het gesprek concreet wordt. Niet langer: welk model kopen we? Maar: welke werkstroom verdient automatisering, welke fout mogen we accepteren en waar moet bewijs verplicht zichtbaar blijven voor iemand op publish drukt?

Wat dit betekent voor MKB en bureaus
Voor MKB-bedrijven is dit een kans, maar ook een valkuil. De kans: veel dagelijkse AI-taken kunnen goedkoper. De valkuil: je hebt technische discipline nodig om kwaliteit, privacy en bedrijfscontext niet te laten weglekken in losse experimenten.
Voor bureaus en consultants zit hier een duidelijke propositie. Niet 'wij installeren een model', maar: wij brengen je werkprocessen in kaart, verlagen modelkosten waar dat kan en bouwen review in waar dat moet. Dat is veel concreter dan 'AI-strategie'.
Richard Rumelt schreef in Good Strategy/Bad Strategy dat goede strategie begint met een diagnose. Dat geldt hier ook. Zonder diagnose van je taakverdeling bouw je geen AI-strategie. Dan doe je 'dingetjes doen' met modellen.

De echte vraag: waar wil je je bedrijfscontext bewaren?
De komende jaren wordt bedrijfscontext waardevoller dan modeltoegang. Modellen worden goedkoper. Context wordt schaarser. Wie weet wat klanten vragen, welke bezwaren terugkomen, welke offertes winnen en welke workflows vertragen, heeft een voorsprong.
Daarom moet je bewust kiezen waar die context leeft. In Slack bij een leverancier? In losse chats van medewerkers? In je CRM, documentatie en eigen automatiseringslaag? Er is geen universeel goed antwoord, maar niets kiezen is ook kiezen.
De volwassen route is model-onafhankelijk denken. Je gebruikt Claude, OpenAI, GLM of een lokaal model waar het past, maar je bedrijfslogica blijft niet opgesloten in één leverancier. Dat is minder sexy. Wel verstandiger.
Conclusie: bespaar pas als je kunt sturen
Goedkope AI is er al. De bottleneck is niet meer alleen intelligentie, maar inrichting. Wie kosten wil verlagen, moet eerst weten welke taken goedkoop mogen, welke taken duur moeten blijven en waar een mens tussen moet zitten.
Voor Funnel Adviseur is dit precies de interessante laag: niet nog een losse AI-tool, maar een commercieel systeem waarin content, opvolging, data, review en publicatie logisch samenwerken. De motor is belangrijk. De aandrijving bepaalt of je vooruitkomt.
De bedrijven die dit nu serieus aanpakken, bouwen straks niet met één model. Ze bouwen met een eigen werklaag boven modellen. Ben benieuwd hoeveel bedrijven dat pas doorhebben nadat de eerste goedkope AI-besparing duurder uitvalt dan gepland.



