Zurück zu Nachrichten 18 juni 2026

H(ai)pe?

Of geen Hype, wat is het nou met AI? Oftewel gaat het nog wat worden? Zover het er nu voor staat niet met die amerikaanse modellen, de vraag is alleen of we die ueberhaupt nodig hebben?

Claude Fable is VERBOTEN buiten de VS, wat wij sinds tijden (anderhalve jaar) roepen namelijk dat je daar niet meer op kan bouwen is nu dus realiteit. Voor wie het nog niet wilde geloven is het nu een feit geworden. Dat is mooi, net op tijd zeg maar. Voor je het weet ben je er namelijk van afhankelijk en wie nu met het topmodel Claude moet werken is best zuur. Ja, het klopt, de amerikaanse modellen zijn in veel dingen de beste en meest geavanceerd alleen dat heb je vaak helemaal niet nodig. Daar komt de kosten factor bij. OpenAi en Anthropic willen na de beurs en verlies lijdende bedrijven worden daar vaak niet met open armen ontvangen. Dus moest de prijs omhoog, en wel aanzienlijk. Hi zeggen tegen Claude Fable is dan al een dure grap geworden en dat is geen grap. Hier mag je al $10/$50 voor Input Output betalen en wie ooit een stukje software ontwikkelt heeft met AI die weet hoe hart dat gaat met die tokens (sorry telefoontikken).

Zodoende komen we bij: heb je dat nodig? Of nog betere vraag wil je dat wel? Als je hier kijkt: https://isaiprofitable.com en vervolgens bedenkt wie deze schulden zo meteen mag gaan betalen dan durfen wij zomaar te beweren dat dit de gebruikers zijn, uiteindelijk. En dat betekent dat amerikaans AI stervensduur is een ook gaat blijven want die uitzonderlijk lange rode pilaren moeten uiteindelijk toch een keer terugbetaald worden.

Hermes Agent

Er is nog meer onder de zon zeker als men richting open source kijkt waar in feite hele coole dingen vandaan komen: Open Code, Open Design en Hermes Agent En daar wilden we het eigenlijk over hebben. Hermes is een “agentic harness”. Daarmee wordt bedoelt dat dit een stuk software is waarmee je de AI kan bouwen die je nodig hebt en die de dingen doet die jij wilt en hoe je dat wilt. Die eigenschap is dan ook de valkuil van Hermes. Hermes is niet het meest makkelijk in te richten appje omdat er enorm veel bij komt te kijken afhankelijk wat je wilt dat het doet. Op het reddit fora zie je dan ook dat veel mensen enthousiast eraan beginnen en vervolgens iets draaiend hebben en dan graag willen weten wat je er eigenlijk me kan doen, grappig fenomeen.

Wij gebruiken het bijvoorbeeld voor hardware research, als RAG, elke ochtend zoek het voor ons belangrijk nieuws dat relevant is voor Ikbenstil Computers. dit kan via desktop maar ook via smartphone. Sterker nog wij kunnen fotos maken en de AI uit laten zoeken wat het over dat onderdeel weet. De kracht van Hermes is dat het geheugen heeft. Wie eerder een aantal dagen met AI gewerkt heeft weet: op maandag weet de AI niet meer wat je op vrijdag deed. Zo niet Hermes: hier heb je de mogelijkheid een korte termijn en een lange termijn geheugen te installeren.

Het probleem met Hermes is dat het als platform snel met heel veel andere apps moet kunnen praten. Er komen dus aardig wat api verbindingen bij te kijken, databases (ja, plural) externe Ai verbindingen en lokale verbindingen. wij gebruiken bijvoorbeeld een API AI via Cortecs en een lokale beeldherkening AI.

Maar, nogmaals: het is een platform dus je kan er van maken wat je ervan maakt, of zoals veel reddit gebruikers zeggen: going down the rabbithole. Maar wel indrukwekkend cool. Dit is AI die ook daadwerkelijk iets doet en iets kan. Kleine waarschuwing: ja je kan Hermes met zowat alles verbinden waarmee je wilt, mail, databases, beeld creatie, geluid opnames … je kan het zo gek niet verzinnen en het kan. Dat wil zeggen: de beste route is uitproberen, leren kennen en pas als het “onder controle” is verbinden met apps die belangrijk zijn.

En, want we waren begonnen met het gebruik van amerikaanse AI modellen, Hermes kan volledig lokaal gebruikt worden en dat werkt uitstekend. En ja dat betekent dus volledige, 100% privacy. Je hoeft alleen voldoende VRAM. Iets waar op dit moment helaas geen overvloed van is. Wel heb je dus het voordeel: nieuw model, nieuwe capabilities = gebruik model klaar. Tip van onze kant; je moet modellen gebruiken die met tools en skills overweg kunnen.

Nu we toch bezig zijn met tips: draai het lokaal op dedicated hardware. Mocht je API LLM’s gebruiken dan is een Raspy al voldoende. Docker is cool maar kan ook in de weg zitten. Er zijn mensen die dit op een VPS installeren, dat kan, alleen voegt het een laag complextiteit toe.

Hier de capability lijst:

1. Core Identity

Open-source AI agent framework by Nous Research (the lab behind Hermes, Nomos, Psyche models)
Self-improving — the only agent with a built-in learning loop: creates skills from experience, improves them during use, persists knowledge across sessions
Provider-agnostic — works with 20+ LLM providers (OpenRouter, Anthropic, OpenAI, DeepSeek, Google Gemini, xAI, local models via LM Studio, custom endpoints, and more)
Runs anywhere — Linux, macOS, WSL2, Windows (native), Android (Termux); on a $5 VPS, a GPU cluster, or serverless (Daytona, Modal)

2. Interfaces & Access

CLI — interactive terminal chat with full tool access
Web UI — built-in dashboard (hermes dashboard) + community web workspaces (hermes-webui, hermes-workspace)
20+ Messaging Platforms from a single gateway:
- Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Email, SMS, DingTalk, Feishu, WeCom, Weixin (WeChat), QQ Bot, Yuanbao, BlueBubbles (iMessage), Home Assistant, Microsoft Teams, Google Chat, API Server, Webhooks
IDE integration — ACP server mode for editor integration
Voice mode — real-time voice interaction in CLI, Telegram, Discord, and Discord Voice Channels

3. Toolsets (60+ built-in tools)

Category	Capabilities
Terminal	Shell commands, background processes, PTY mode, Docker/SSH/Modal/Daytona/Singularity backends
File	Read, write, search, patch files; directory operations
Code Execution	Sandboxed Python execution with tool library access
Web	Web search (Firecrawl, Parallel, Tavily, Exa backends), content extraction, PDF parsing
Browser	Full browser automation (Chromium, Browserbase, Camofox) — navigate, click, type, screenshot, vision
Vision	Image analysis (native model vision or auxiliary vision model fallback)
Image Generation	AI image generation
Text-to-Speech	Edge TTS, ElevenLabs, OpenAI, MiniMax, Mistral, NeuTTS (local)
Speech-to-Text	Local faster-whisper, Groq, OpenAI, Mistral Voxtral
Memory	Persistent cross-session memory (pluggable backends: built-in, Honcho, Hindsight, Mem0, Mnemosyne)
Session Search	Full-text search across all past conversations
Delegation	Spawn isolated subagents for parallel workstreams (up to 3 concurrent)
Cron/Scheduling	Built-in job scheduler with delivery to any platform
Skills	Browse, install, create, manage procedural memory
Todo	In-session task planning and tracking
Messaging	Cross-platform message sending
Home Automation	Home Assistant integration
MCP	Connect to any Model Context Protocol server for extended tools
Reinforcement Learning	RL training tools (Atropos integration)
Mixture of Agents	Multi-agent inference

4. Memory & Learning System

Persistent memory — remembers user preferences, environment facts, corrections across sessions
Dual memory stores — user profile (who you are) + agent notes (environment, lessons)
Mnemosyne — advanced memory with vector search, FTS5, knowledge graphs, temporal decay, fact triples, shared surface memory, import/export
Hindsight — PostgreSQL-backed RAG with auto-indexing of documents
Honcho — dialectic user modeling
Three-tier memory pattern — hot context (built-in) → Obsidian vault (warm) → document store (cold)
Session search — full-text search over entire conversation history with bookend/scroll navigation

5. Skills System (Procedural Memory)

Self-creating — agent saves complex workflows as reusable skills after solving problems
Self-improving — patches skills when it discovers better approaches or pitfalls
Skills Hub — 2000+ community-contributed skills, searchable and installable
Portable — compatible with agentskills.io standard
Categorized — organized by domain (devops, mlops, research, creative, etc.)
Per-platform enablement — different skills active on different channels
Skill taps — add GitHub repos as skill sources

6. Multi-Agent & Orchestration

Subagent delegation — spawn isolated child agents for parallel tasks
Process spawning — run full independent Hermes instances via tmux
Swarm mode — autonomous multi-agent orchestration with role-based dispatch (builders, reviewers, QA, research, ops)
Git worktree mode — parallel agents editing code without conflicts
Programmatic Tool Calling — execute_code collapses multi-step pipelines into single inference calls
Cron job chaining — jobs can reference each other’s output

7. Profiles & Multi-User

Named profiles — isolated configs, sessions, skills, memory, gateway instances
Per-profile gateway — each profile gets its own systemd service and bot token
Multi-tenant architecture — serve multiple users from one host with full isolation
Profile cloning — --clone, --clone-all, --clone-from
Profile export/import — portable tar.gz archives

8. Security & Privacy

Command approval — manual, smart (LLM-assisted), or off (YOLO mode)
Secret redaction — auto-mask API keys in tool output
PII redaction — hash user IDs, strip phone numbers before model context
Website blocklist — Tirith security layer
DM authorization — pairing/approval system for gateway DMs
Container isolation — Docker/SSH backends for sandboxed execution
Credential pools — rotate across multiple API keys per provider

9. Scheduling & Automation

Built-in cron — flexible scheduling (intervals, cron expressions, one-shot)
Cross-platform delivery — cron output goes to Telegram, Discord, Slack, etc.
Script mode — run shell scripts on schedule with no LLM cost (watchdog pattern)
Webhook subscriptions — event-driven agent runs via HTTP POST triggers
Job chaining — inject previous job output as context for next job

10. Local AI / Self-Hosted

LM Studio integration — local model serving with OpenAI-compatible API
GGUF model support — import pre-downloaded models, JIT loading
Local STT — faster-whisper (no API key needed)
Local TTS — NeuTTS (fully local)
Local vision — Qwen2.5-VL via LM Studio as auxiliary vision provider
Fallback chains — local primary → cloud fallback (or vice versa)
RAG — marker-pdf → ChromaDB pipeline for document Q&A
Hindsight — local PostgreSQL + vector embeddings for semantic search

11. Research & Data

arXiv — paper search by keyword, author, category
Web scraping — Firecrawl, Tavily, Exa, SearXNG integration
PDF extraction — marker-pdf for scientific documents
Jupyter — live kernel integration for iterative exploration
Data analysis — pandas, numpy, full Python ecosystem
YouTube — transcript extraction and summarization
Blog/RSS monitoring — blogwatcher-cli integration

12. Developer Experience

60+ slash commands — session control, config, tools, gateway, utility
Context compression — automatic when approaching token limits
Filesystem checkpoints — rollback to previous states
Shell completions — bash, zsh
Session management — list, browse, export, rename, prune
Usage analytics — token tracking, cost ledger
Plugin system — extensible via ~/.hermes/plugins/
MCP server mode — Hermes itself can act as an MCP server

13. Deployment & Infrastructure

One-line install — curl pipe to bash
Desktop app — Hermes Desktop for Windows/macOS
systemd service — gateway auto-installs as background service
Docker Compose — containerized deployment
Remote access — WireGuard VPN, Tailscale, reverse proxy patterns
LAN multi-user — workspace with password auth, PWA support

14. Unique Differentiators (vs. Claude Code, Codex, etc.)

Learning loop — creates and improves its own skills
Multi-platform — same agent on 20+ messaging platforms with full tool access
Provider-agnostic — swap models/providers mid-workflow
Self-hostable — runs on a $5 VPS or air-gapped LAN
Open source — MIT license, by Nous Research
Multi-user — profile isolation, per-user gateways, tenant architecture
Scheduled automation — built-in cron with cross-platform delivery
Research-ready — batch processing, trajectory export, RL training integration

15. Supported LLM Providers (20+)

Provider	Auth Method
OpenRouter	API key
Anthropic	API key
Nous Portal	OAuth
OpenAI Codex	OAuth
GitHub Copilot	Token
Google Gemini	API key
DeepSeek	API key
xAI / Grok	API key
Hugging Face	Token
Z.AI / GLM	API key
MiniMax	API key
Kimi / Moonshot	API key
Alibaba / DashScope	API key
Xiaomi MiMo	API key
Kilo Code	API key
AI Gateway (Vercel)	API key
OpenCode Zen / Go	API key
Qwen	OAuth
LM Studio (local)	None (OpenAI-compat)
Custom endpoint	Config

16. Terminal Backends (where commands execute)

Backend	Description
Local	Direct shell on host machine
Docker	Isolated container execution
SSH	Remote server execution
Daytona	Serverless dev environment (hibernates when idle)
Modal	Serverless cloud (pay-per-use)
Singularity	HPC container runtime

Source: Hermes Agent documentation (hermes-agent.nousresearch.com), skill database, and live system inspection. June 2026.