Ga naar inhoud
Ikbenstil Computers
Zurück zu Nachrichten

H(ai)pe?

Of geen Hype, wat is het nou met AI? Oftewel gaat het nog wat worden? Zover het er nu voor staat niet met die amerikaanse modellen, de vraag is alleen of we die ueberhaupt nodig hebben?

H(ai)pe?

Claude Fable is VERBOTEN buiten de VS, wat wij sinds tijden (anderhalve jaar) roepen namelijk dat je daar niet meer op kan bouwen is nu dus realiteit. Voor wie het nog niet wilde geloven is het nu een feit geworden. Dat is mooi, net op tijd zeg maar. Voor je het weet ben je er namelijk van afhankelijk en wie nu met het topmodel Claude moet werken is best zuur. Ja, het klopt, de amerikaanse modellen zijn in veel dingen de beste en meest geavanceerd alleen dat heb je vaak helemaal niet nodig. Daar komt de kosten factor bij. OpenAi en Anthropic willen na de beurs en verlies lijdende bedrijven worden daar vaak niet met open armen ontvangen. Dus moest de prijs omhoog, en wel aanzienlijk. Hi zeggen tegen Claude Fable is dan al een dure grap geworden en dat is geen grap. Hier mag je al $10/$50 voor Input Output betalen en wie ooit een stukje software ontwikkelt heeft met AI die weet hoe hart dat gaat met die tokens (sorry telefoontikken).

Zodoende komen we bij: heb je dat nodig? Of nog betere vraag wil je dat wel? Als je hier kijkt: https://isaiprofitable.com en vervolgens bedenkt wie deze schulden zo meteen mag gaan betalen dan durfen wij zomaar te beweren dat dit de gebruikers zijn, uiteindelijk. En dat betekent dat amerikaans AI stervensduur is een ook gaat blijven want die uitzonderlijk lange rode pilaren moeten uiteindelijk toch een keer terugbetaald worden.

Hermes Agent

Er is nog meer onder de zon zeker als men richting open source kijkt waar in feite hele coole dingen vandaan komen: Open Code, Open Design en Hermes Agent En daar wilden we het eigenlijk over hebben. Hermes is een “agentic harness”. Daarmee wordt bedoelt dat dit een stuk software is waarmee je de AI kan bouwen die je nodig hebt en die de dingen doet die jij wilt en hoe je dat wilt. Die eigenschap is dan ook de valkuil van Hermes. Hermes is niet het meest makkelijk in te richten appje omdat er enorm veel bij komt te kijken afhankelijk wat je wilt dat het doet. Op het reddit fora zie je dan ook dat veel mensen enthousiast eraan beginnen en vervolgens iets draaiend hebben en dan graag willen weten wat je er eigenlijk me kan doen, grappig fenomeen.

Wij gebruiken het bijvoorbeeld voor hardware research, als RAG, elke ochtend zoek het voor ons belangrijk nieuws dat relevant is voor Ikbenstil Computers. dit kan via desktop maar ook via smartphone. Sterker nog wij kunnen fotos maken en de AI uit laten zoeken wat het over dat onderdeel weet. De kracht van Hermes is dat het geheugen heeft. Wie eerder een aantal dagen met AI gewerkt heeft weet: op maandag weet de AI niet meer wat je op vrijdag deed. Zo niet Hermes: hier heb je de mogelijkheid een korte termijn en een lange termijn geheugen te installeren.

Het probleem met Hermes is dat het als platform snel met heel veel andere apps moet kunnen praten. Er komen dus aardig wat api verbindingen bij te kijken, databases (ja, plural) externe Ai verbindingen en lokale verbindingen. wij gebruiken bijvoorbeeld een API AI via Cortecs en een lokale beeldherkening AI.

Maar, nogmaals: het is een platform dus je kan er van maken wat je ervan maakt, of zoals veel reddit gebruikers zeggen: going down the rabbithole. Maar wel indrukwekkend cool. Dit is AI die ook daadwerkelijk iets doet en iets kan. Kleine waarschuwing: ja je kan Hermes met zowat alles verbinden waarmee je wilt, mail, databases, beeld creatie, geluid opnames … je kan het zo gek niet verzinnen en het kan. Dat wil zeggen: de beste route is uitproberen, leren kennen en pas als het “onder controle” is verbinden met apps die belangrijk zijn.

En, want we waren begonnen met het gebruik van amerikaanse AI modellen, Hermes kan volledig lokaal gebruikt worden en dat werkt uitstekend. En ja dat betekent dus volledige, 100% privacy. Je hoeft alleen voldoende VRAM. Iets waar op dit moment helaas geen overvloed van is. Wel heb je dus het voordeel: nieuw model, nieuwe capabilities = gebruik model klaar. Tip van onze kant; je moet modellen gebruiken die met tools en skills overweg kunnen.

Nu we toch bezig zijn met tips: draai het lokaal op dedicated hardware. Mocht je API LLM’s gebruiken dan is een Raspy al voldoende. Docker is cool maar kan ook in de weg zitten. Er zijn mensen die dit op een VPS installeren, dat kan, alleen voegt het een laag complextiteit toe.

Hier de capability lijst:

1. Core Identity

  • Open-source AI agent framework by Nous Research (the lab behind Hermes, Nomos, Psyche models)
  • Self-improving — the only agent with a built-in learning loop: creates skills from experience, improves them during use, persists knowledge across sessions
  • Provider-agnostic — works with 20+ LLM providers (OpenRouter, Anthropic, OpenAI, DeepSeek, Google Gemini, xAI, local models via LM Studio, custom endpoints, and more)
  • Runs anywhere — Linux, macOS, WSL2, Windows (native), Android (Termux); on a $5 VPS, a GPU cluster, or serverless (Daytona, Modal)

2. Interfaces & Access

  • CLI — interactive terminal chat with full tool access
  • Web UI — built-in dashboard (hermes dashboard) + community web workspaces (hermes-webui, hermes-workspace)
  • 20+ Messaging Platforms from a single gateway:
    • Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Email, SMS, DingTalk, Feishu, WeCom, Weixin (WeChat), QQ Bot, Yuanbao, BlueBubbles (iMessage), Home Assistant, Microsoft Teams, Google Chat, API Server, Webhooks
  • IDE integration — ACP server mode for editor integration
  • Voice mode — real-time voice interaction in CLI, Telegram, Discord, and Discord Voice Channels

3. Toolsets (60+ built-in tools)

CategoryCapabilities
TerminalShell commands, background processes, PTY mode, Docker/SSH/Modal/Daytona/Singularity backends
FileRead, write, search, patch files; directory operations
Code ExecutionSandboxed Python execution with tool library access
WebWeb search (Firecrawl, Parallel, Tavily, Exa backends), content extraction, PDF parsing
BrowserFull browser automation (Chromium, Browserbase, Camofox) — navigate, click, type, screenshot, vision
VisionImage analysis (native model vision or auxiliary vision model fallback)
Image GenerationAI image generation
Text-to-SpeechEdge TTS, ElevenLabs, OpenAI, MiniMax, Mistral, NeuTTS (local)
Speech-to-TextLocal faster-whisper, Groq, OpenAI, Mistral Voxtral
MemoryPersistent cross-session memory (pluggable backends: built-in, Honcho, Hindsight, Mem0, Mnemosyne)
Session SearchFull-text search across all past conversations
DelegationSpawn isolated subagents for parallel workstreams (up to 3 concurrent)
Cron/SchedulingBuilt-in job scheduler with delivery to any platform
SkillsBrowse, install, create, manage procedural memory
TodoIn-session task planning and tracking
MessagingCross-platform message sending
Home AutomationHome Assistant integration
MCPConnect to any Model Context Protocol server for extended tools
Reinforcement LearningRL training tools (Atropos integration)
Mixture of AgentsMulti-agent inference

4. Memory & Learning System

  • Persistent memory — remembers user preferences, environment facts, corrections across sessions
  • Dual memory stores — user profile (who you are) + agent notes (environment, lessons)
  • Mnemosyne — advanced memory with vector search, FTS5, knowledge graphs, temporal decay, fact triples, shared surface memory, import/export
  • Hindsight — PostgreSQL-backed RAG with auto-indexing of documents
  • Honcho — dialectic user modeling
  • Three-tier memory pattern — hot context (built-in) → Obsidian vault (warm) → document store (cold)
  • Session search — full-text search over entire conversation history with bookend/scroll navigation

5. Skills System (Procedural Memory)

  • Self-creating — agent saves complex workflows as reusable skills after solving problems
  • Self-improving — patches skills when it discovers better approaches or pitfalls
  • Skills Hub — 2000+ community-contributed skills, searchable and installable
  • Portable — compatible with agentskills.io standard
  • Categorized — organized by domain (devops, mlops, research, creative, etc.)
  • Per-platform enablement — different skills active on different channels
  • Skill taps — add GitHub repos as skill sources

6. Multi-Agent & Orchestration

  • Subagent delegation — spawn isolated child agents for parallel tasks
  • Process spawning — run full independent Hermes instances via tmux
  • Swarm mode — autonomous multi-agent orchestration with role-based dispatch (builders, reviewers, QA, research, ops)
  • Git worktree mode — parallel agents editing code without conflicts
  • Programmatic Tool Callingexecute_code collapses multi-step pipelines into single inference calls
  • Cron job chaining — jobs can reference each other’s output

7. Profiles & Multi-User

  • Named profiles — isolated configs, sessions, skills, memory, gateway instances
  • Per-profile gateway — each profile gets its own systemd service and bot token
  • Multi-tenant architecture — serve multiple users from one host with full isolation
  • Profile cloning--clone, --clone-all, --clone-from
  • Profile export/import — portable tar.gz archives

8. Security & Privacy

  • Command approval — manual, smart (LLM-assisted), or off (YOLO mode)
  • Secret redaction — auto-mask API keys in tool output
  • PII redaction — hash user IDs, strip phone numbers before model context
  • Website blocklist — Tirith security layer
  • DM authorization — pairing/approval system for gateway DMs
  • Container isolation — Docker/SSH backends for sandboxed execution
  • Credential pools — rotate across multiple API keys per provider

9. Scheduling & Automation

  • Built-in cron — flexible scheduling (intervals, cron expressions, one-shot)
  • Cross-platform delivery — cron output goes to Telegram, Discord, Slack, etc.
  • Script mode — run shell scripts on schedule with no LLM cost (watchdog pattern)
  • Webhook subscriptions — event-driven agent runs via HTTP POST triggers
  • Job chaining — inject previous job output as context for next job

10. Local AI / Self-Hosted

  • LM Studio integration — local model serving with OpenAI-compatible API
  • GGUF model support — import pre-downloaded models, JIT loading
  • Local STT — faster-whisper (no API key needed)
  • Local TTS — NeuTTS (fully local)
  • Local vision — Qwen2.5-VL via LM Studio as auxiliary vision provider
  • Fallback chains — local primary → cloud fallback (or vice versa)
  • RAG — marker-pdf → ChromaDB pipeline for document Q&A
  • Hindsight — local PostgreSQL + vector embeddings for semantic search

11. Research & Data

  • arXiv — paper search by keyword, author, category
  • Web scraping — Firecrawl, Tavily, Exa, SearXNG integration
  • PDF extraction — marker-pdf for scientific documents
  • Jupyter — live kernel integration for iterative exploration
  • Data analysis — pandas, numpy, full Python ecosystem
  • YouTube — transcript extraction and summarization
  • Blog/RSS monitoring — blogwatcher-cli integration

12. Developer Experience

  • 60+ slash commands — session control, config, tools, gateway, utility
  • Context compression — automatic when approaching token limits
  • Filesystem checkpoints — rollback to previous states
  • Shell completions — bash, zsh
  • Session management — list, browse, export, rename, prune
  • Usage analytics — token tracking, cost ledger
  • Plugin system — extensible via ~/.hermes/plugins/
  • MCP server mode — Hermes itself can act as an MCP server

13. Deployment & Infrastructure

  • One-line install — curl pipe to bash
  • Desktop app — Hermes Desktop for Windows/macOS
  • systemd service — gateway auto-installs as background service
  • Docker Compose — containerized deployment
  • Remote access — WireGuard VPN, Tailscale, reverse proxy patterns
  • LAN multi-user — workspace with password auth, PWA support

14. Unique Differentiators (vs. Claude Code, Codex, etc.)

  1. Learning loop — creates and improves its own skills
  2. Multi-platform — same agent on 20+ messaging platforms with full tool access
  3. Provider-agnostic — swap models/providers mid-workflow
  4. Self-hostable — runs on a $5 VPS or air-gapped LAN
  5. Open source — MIT license, by Nous Research
  6. Multi-user — profile isolation, per-user gateways, tenant architecture
  7. Scheduled automation — built-in cron with cross-platform delivery
  8. Research-ready — batch processing, trajectory export, RL training integration

15. Supported LLM Providers (20+)

ProviderAuth Method
OpenRouterAPI key
AnthropicAPI key
Nous PortalOAuth
OpenAI CodexOAuth
GitHub CopilotToken
Google GeminiAPI key
DeepSeekAPI key
xAI / GrokAPI key
Hugging FaceToken
Z.AI / GLMAPI key
MiniMaxAPI key
Kimi / MoonshotAPI key
Alibaba / DashScopeAPI key
Xiaomi MiMoAPI key
Kilo CodeAPI key
AI Gateway (Vercel)API key
OpenCode Zen / GoAPI key
QwenOAuth
LM Studio (local)None (OpenAI-compat)
Custom endpointConfig

16. Terminal Backends (where commands execute)

BackendDescription
LocalDirect shell on host machine
DockerIsolated container execution
SSHRemote server execution
DaytonaServerless dev environment (hibernates when idle)
ModalServerless cloud (pay-per-use)
SingularityHPC container runtime

Source: Hermes Agent documentation (hermes-agent.nousresearch.com), skill database, and live system inspection. June 2026.

Ratschläge willkommen?

Sagen Sie uns, was Sie brauchen.

Wir antworten in der Regel innerhalb eines Arbeitstages.