Hoe bedrijven de grip terugkrijgen op de stijgende AI kosten

jun 18—2026

De bedrijfseconomische realiteit van kunstmatige intelligentie (AI) is op dit moment pijnlijk zichtbaar op de werkvloer. Echte efficiëntie ontstaat pas wanneer de opbrengsten sneller stijgen dan de kosten, maar in de praktijk gebeurt nu exact het omgekeerde. Bedrijven worden geconfronteerd met exploderende rekeningen doordat werknemers en autonome systemen op grote schaal data verspillen. De oorzaak van deze financiële kater ligt in het fundamentele misverstand over hoe de kosten van deze technologie worden berekend. In de wereld van grote taalmodellen betaal je niet per maand of per gebruiker zoals bij traditionele software. De munteenheid van de AI economie is de token (een microscopisch stukje tekst of code dat door het model wordt verwerkt). Elk woord dat een werknemer intypt, elk document dat als achtergrondinformatie wordt geüpload en elk antwoord dat de computer genereert, tikt onbarmarmhartig door op de digitale teller.

De afgelopen jaren zijn de eenheidsprijzen per token met meer dan 99% gedaald door hevige concurrentie tussen techgiganten. Toch zijn de totale AI rekeningen bij menig bedrijf verdrievoudigd. Deze paradox legt de vinger op de zere plek van de huidige bedrijfscultuur. Omdat de technologie zo laagdrempelig en goedkoop leek, zijn werknemers AI klakkeloos gaan gebruiken. Het ontbreken van financieel bewustzijn heeft geleid tot een wildgroei aan digitale verspilling. De situatie is het afgelopen jaar in een stroomversnelling geraakt door de opkomst van autonome AI agenten (systemen die niet simpelweg een vraag beantwoorden maar zelfstandig plannen maken en softwarecode schrijven). Onderzoek van universiteiten en analisten laat zien dat zo een zelfstandige agent voor een gemiddelde taak tot wel 1000 keer meer tokens verbruikt dan een mens die een simpele vraag stelt in een chatvenster. Een agent start een interne dialoog, probeert iets uit, maakt een fout, voegt de fout toe aan zijn geheugen en probeert het opnieuw. Bij elke herhaling zwelt de hoeveelheid meegesleepte data exponentieel aan.

Zonder dat er een mens meekijkt, kan een verkeerd geprogrammeerde softwareagent in een paar uur tijd duizenden euro’s aan computerkracht verbruiken. Grote technologiebedrijven hebben de noodrem al moeten intrappen. Uber ontdekte dat het volledige jaarbudget voor AI codering binnen 4 maanden was verdampt, waarna er strenge maandelijkse limieten per programmeur werden ingesteld. Zelfs Meta moest het eigen personeel via interne memo’s streng toespreken en budgetcontroles invoeren omdat de interne AI kosten in de miljarden dreigden te lopen. Om het tij te keren en AI eindelijk echt efficiënt te maken, transformeren bedrijven hun volledige technische architectuur. De tijd van onbeperkt experimenteren is voorbij en heeft plaatsgemaakt voor strakke kostenbeheersing.

De eerste ingreep die overal wordt doorgevoerd is het slim routeren van dataverkeer. Voorheen stuurden werknemers elke triviale vraag naar het grootste, krachtigste en allerduurste model dat beschikbaar was. Tegenwoordig bouwen bedrijven een slimme filterlaag die de complexiteit van een inkomende vraag vooraf inschat. Een simpele opdracht zoals het samenvatten van een e-mail of het controleren van een spelling wordt direct doorgezet naar een vederlicht budgetmodel dat een fractie van de prijs kost. Alleen wanneer er diepgaande logica of strategische besluitvorming nodig is, krijgt het dure topmodel toestemming om te antwoorden. Deze gelaagde aanpak verlaagt de operationele kosten direct met 80% zonder dat de kwaliteit van het werk achteruitgaat. Daarnaast pakken bedrijven de constante herhaling van data aan via geavanceerde cachingtechnieken (het tijdelijk opslaan van veelgevraagde informatie om rekenkracht te besparen). Het is pure kapitaalvernietiging om elk uur een handboek van 300 pagina’s naar een AI model te sturen zodat een werknemer er een specifieke vraag over kan stellen. Door de statische delen van een prompt slim op te slaan in het geheugen van de servers, geven providers enorme kortingen op het dataverbruik.

Innovatieve bedrijven gaan nog een stap verder met semantische opslag. Wanneer een klantenservicemedewerker een vraag stelt die sterk lijkt op een vraag van een uur geleden, vist het systeem het eerdere antwoord direct uit een lokale database. Het dure AI model hoeft dan helemaal niet te worden geactiveerd, wat een enorme besparing oplevert bij repeterend werk. Een andere cruciale verandering is de herwaardering van klassieke softwaretechnologie. In de begindagen van de AI hype pleitten enthousiastelingen ervoor om alle bedrijfsinformatie ongefilterd in de enorme contextvensters (de maximale hoeveelheid data die een model in een keer kan verwerken) van taalmodellen te gooien. Die benadering blijkt financieel onhoudbaar. Ervaren softwarearchitecten gebruiken nu eerst traditionele, efficiënte code om data lokaal te filteren, te sorteren en plat te slaan tot de absolute essentie. Pas wanneer de informatie is gereduceerd tot een compact pakketje, mag de kunstmatige intelligentie ermee aan de slag. AI wordt zo niet langer gebruikt als een dure bezem om door een hooiberg te zoeken, maar puur als de logische denker aan het einde van de rit.

Ten slotte vindt er een verschuiving plaats naar lokale hardware om de onvoorspelbaarheid van de cloudrekening volledig te omzeilen. Dankzij krachtige nieuwe chips kunnen compacte maar zeer capabele modellen direct op de desktops van werknemers draaien. Voor het schrijven van dagelijkse e-mails, het genereren van basiscode of het analyseren van interne documenten is dan geen verbinding met een externe server meer nodig. De tokens die deze lokale systemen genereren zijn in feite gratis omdat er geen teller van een externe leverancier meeloopt. Het transformeren van een variabele, onvoorspelbare clouduitgave naar een vaste investering in eigen hardware is voor veel financiële directeuren de ultieme manier om de controle terug te krijgen.

De huidige kostencrisis legt een fundamentele waarheid bloot over de integratie van nieuwe technologie. AI maakt jouw organisatie niet automatisch productiever. Zolang werknemers de systemen klakkeloos blijven voeden met overbodige data en zolang autonome agenten zonder toezicht geld kunnen stukslaan, blijft de beloofde efficiëntie een fabeltje. De echte winnaars van de AI revolutie zijn niet de bedrijven die de meeste prompts versturen, maar de bedrijven die hun data het slimst filteren, routeren en beheersen. Efficiëntie gaat tenslotte niet over hoeveel technologie je gebruikt, maar over hoe intelligent je de kosten ervan beheert.

Economie, Technologie

Hoe bedrijven de grip terugkrijgen op de stijgende AI kosten

Dit delen:

Vind ik leuk:

Ontdek meer van Typify