Terug naar Nieuws 22 mei 2026

Praat caveman beter

Of hoe je AI leert om minder tokens te gebruiken. LLM's blabberen onophoudbaar en dat kost centen oftewel tokens, de munteenheid van AI.

Caveman

Julius Brussee en Caveman

Wie herinnert zich nog aan de telefoontikken tijd? Nog niet zo heel lang geleden. Die komen waarschijnlijk niet meer terug, maar in plaats daarvan hebben we nu AI tokens. Zelfde idee maar dan voor gebruik van een AI abonnement. Meeste mensen gebruiken eerst de vrije variant en de meer je AI gebruikt de eerder sluit je je eerste abo af. Doe je iets met software ontwikkelen dan wordt het snel een Pro account en zelfs dan bereikt men snel het limiet aan tokens die je mag gebruiken. Wat zou er mogelijkerwijse fout kunnen gaan?

Stel je ontwikkelt een app dan vliegen de tokens er enorm snel doorheen: “You reached your limit. Bye” Het wordt dan snel duur en niet zo een beetje ook. Eerst gaa je dan kijken hoe je minder tokens kan verbruiken en dat lukt misschien een beetje maar slaat geen deuk in een pak boter. Maar hulp is onderweg want Julius heeft daar wat op bedacht: weg met dat babbelzieke taal gebruik van die chat apps.

De Nederlandse student Julius Brussee doet wat AI-bedrijven “over het hoofd zagen”: hij stelde een eenvoudige vraag. “Waarom veel tokens gebruiken als weinig tokens ook werken?”

Zijn antwoord: Caveman — een Claude Code skill die de woordvloed van AI-antwoorden met wel 75% vermindert door modellen te dwingen als een slimme holbewoner te communiceren. Geen opvulling. Geen beleefdheidsfrasen. Alleen de technische kern.

Slim. De repository (github.com/JuliusBrussee/caveman) explodeerde: 63k sterren, 3,5k forks. Het concept is verrassend eenvoudig: haal lidwoorden, aarzelingen en opvulling uit AI-antwoorden terwijl elke gram technische nauwkeurigheid behouden blijft. Een antwoord dat eerst 100 tokens kostte, kost nu 25.

En? Doet het wat? Caveman is geen grap. Het is een token-efficiëntie revolutie. Voor AI-agenten die duizenden interacties verwerken, lopen de besparingen snel op. Bedrijven die vlootjes codeeragenten draaien, zagen directe kostenverlagingen. De skill ondersteunt meerdere intensiteitsniveaus — lite, full, ultra — en zelfs klassieke Chinese varianten voor niet-Engelstalige workflows.

Het BNR-artikel (die op de radio) ziet het als paradox: een tiener versloeg AI-giganten met een benadering die zo voor de hand lag, dat niemand eraan dacht. Terwijl Silicon Valley grotere modellen achterna zat, vroeg Brussee: wat als we gewoon stoppen met het verspillen van tokens aan “Ik help je graag” en “Laat me daar eens over nadenken”? Nu zou je ook kunnen denken: goh, die gasten verdienen hun geld met tokens, waarom zouden ze minder goed vinden. Maar goed, iedereen kijkt er weer anders tegen aan.

Het virale succes van Caveman bewijst een fundamentele waarheid over AI-ontwikkeling: soms zijn de grootste doorbraken geen nieuwe algoritmes, maar het verwijderen van wat nooit nodig was. Brussee bouwde geen beter model. Hij bouwde een betere manier om de modellen die we al hebben te gebruiken. En dat is tegelijkertijd een van de opmerkelijke vindingen: met al die milljarden van die bedrijven lukt het ze steeds minder om te innoveren. Er gebeurt meer op het vlak van door ontwikkeling van AI in de open-source wereld dan waar dan ook.

Hoe dan ook. Wij hebben het uitgeprobeert en het werkt fantastisch. Bedankt Julius, je hebt ons al een hoop zinloze tokens bespaart.

De repository ondersteunt nu Claude Code, Codex en meerdere agent frameworks. De boodschap is duidelijk: in het tijdperk van AI-overvloed is echte schaarste aandacht — en Caveman levert dat, één terzijdig token per keer.

Praat caveman beter

Caveman

Julius Brussee en Caveman

Links

Advies welkom?