Ga naar inhoud
Ikbenstil Computers
Zurück zu Nachrichten

Höhlenmensch besser reden

Oder wie man der KI beibringt, weniger Token zu verwenden. LLMs plappern unaufhörlich und das kostet Pfennige oder Token, die Währung der KI.

Höhlenmensch besser reden

Caveman

Julius Brussee und Caveman

Wer erinnert sich noch an die Zeit der Telefon-Ticks? Das ist noch gar nicht so lange her. Diese werden wahrscheinlich nicht mehr zurückkommen, aber stattdessen haben wir jetzt KI-Token. Das gleiche Prinzip, nur für die Nutzung eines KI-Abonnements. Die meisten Menschen nutzen zunächst die kostenlose Variante, und je häufiger Sie die KI nutzen, desto eher schließen Sie Ihr erstes Abonnement ab. Wenn Sie sich mit Softwareentwicklung beschäftigen, wird es schnell zu einem Pro-Account, und selbst dann erreicht man schnell das Limit an Tokens, die man nutzen darf. Was könnte möglicherweise schiefgehen?

Angenommen, Sie entwickeln eine App, dann sind die Token im Nu aufgebraucht: „You reached your limit. Tschüss.“ Das wird dann schnell teuer, und zwar nicht nur ein bisschen. Zunächst versuchen Sie dann herauszufinden, wie Sie weniger Token verbrauchen können, und das gelingt vielleicht ein wenig, macht aber kaum einen Unterschied. Doch Hilfe ist unterwegs, denn Julius hat sich etwas einfallen lassen: Weg mit dem geschwätzigen Sprachgebrauch dieser Chat-Apps.

Der niederländische Student Julius Brussee tut das, was KI-Unternehmen „übersehen“ haben: Er stellte eine einfache Frage. „Warum viele Token verbrauchen, wenn wenige Token auch funktionieren?“

Seine Antwort: Caveman – ein Claude-Code-Skill, der den Wortschwall von KI-Antworten um bis zu 75 % reduziert, indem er Modelle dazu zwingt, wie ein kluger Höhlenmensch zu kommunizieren. Keine Füllwörter. Keine Höflichkeitsfloskeln. Nur der technische Kern.

Clever. Das Repository (github.com/JuliusBrussee/caveman) explodierte: 63.000 Sterne, 3.500 Forks. Das Konzept ist überraschend einfach: Entfernen Sie Artikel, Zögern und Füllwörter aus KI-Antworten, während jedes Gramm technischer Genauigkeit erhalten bleibt. Eine Antwort, die zuvor 100 Token kostete, kostet nun 25.

Und? Funktioniert es? Caveman ist kein Scherz. Es ist eine Revolution der Token-Effizienz. Für KI-Agenten, die Tausende von Interaktionen verarbeiten, summieren sich die Einsparungen schnell. Unternehmen, die ganze Flotten von Codierungsagenten betreiben, verzeichnen direkte Kostensenkungen. Die Skill unterstützt mehrere Intensitätsstufen – Lite, Full, Ultra – und sogar klassische chinesische Varianten für nicht-englischsprachige Workflows.

Der BNR-Artikel (im Radio) sieht darin ein Paradoxon: Ein Teenager schlug KI-Giganten mit einem Ansatz, der so naheliegend war, dass niemand daran gedacht hatte. Während Silicon Valley größeren Modellen hinterherjagte, fragte Brussee: Was wäre, wenn wir einfach aufhören würden, Token für „Ich helfe Ihnen gerne“ und „Lassen Sie mich darüber nachdenken“ zu verschwenden? Nun könnte man auch denken: Mann, diese Leute verdienen ihr Geld mit Token, warum sollten sie weniger wollen? Aber gut, jeder sieht das wieder anders.

Der virale Erfolg von Caveman beweist eine grundlegende Wahrheit über die KI-Entwicklung: Manchmal sind die größten Durchbrüche keine neuen Algorithmen, sondern das Weglassen dessen, was nie nötig war. Brussee hat kein besseres Modell entwickelt. Er hat eine bessere Methode entwickelt, die Modelle zu nutzen, die wir bereits haben. Und das ist gleichzeitig eine der bemerkenswerten Erkenntnisse: Trotz all der Milliarden dieser Unternehmen gelingt es ihnen immer weniger, innovativ zu sein. Im Bereich der KI-Entwicklung passiert in der Open-Source-Welt mehr als irgendwo sonst.

Wie dem auch sei. Wir haben es ausprobiert und es funktioniert fantastisch. Danke, Julius, Sie haben uns bereits eine Menge sinnloser Token erspart.

Das Repository unterstützt nun Claude Code, Codex und mehrere Agent-Frameworks. Die Botschaft ist klar: Im Zeitalter des KI-Überflusses ist Aufmerksamkeit das wahre Knappheitsgut – und Caveman liefert genau das, ein einziges Token nach dem anderen.

Links

Ratschläge willkommen?

Sagen Sie uns, was Sie brauchen.

Wir antworten in der Regel innerhalb eines Arbeitstages.