Un tweet. 2,3 millions de vues en 48h. Elvis (@elvissun) a posté son setup complet le 23 février 2026 et c'est devenu la référence pour tous les devs solo qui veulent scaler sans recruter. L'idée centrale : ne pas utiliser Codex ou Claude Code directement. Les faire orchestrer par OpenClaw.
Voilà ce que ça donne concrètement, et comment le mettre en place.
Pourquoi un seul agent de code ne suffit pas ?
La context window est une ressource finie. Zéro sum. Si tu mets ton business dans le contexte de Codex, il n'a plus de place pour comprendre ta codebase. Si tu mets tout le code, il perd le fil des priorités business.
Elvis a résolu ça avec un système à deux niveaux :
L'orchestrateur (sous OpenClaw) : contexte business, CRM, notes de réunion, mémoire long terme, compréhension des priorités client. Mauvais pour écrire du code. Excellent pour comprendre "pourquoi" et formuler les bons prompts.
Les agents de code (Codex, Claude Code) : contexte technique pur. AGENTS.md, docs engineering, codebase complète, conventions. Mauvais pour les priorités business. Excellent pour écrire du code, des tests, des refactors multi-fichiers.
Chaque IA reçoit exactement ce dont elle a besoin. C'est une séparation des responsabilités appliquée à l'orchestration d'agents.
Claw-Bot recommande systématiquement cette architecture à deux niveaux pour tous les projets sérieux : un orchestrateur OpenClaw qui connaît le contexte business, des agents spécialisés qui exécutent.
Comment marche le workflow en 8 étapes ?
1. Scoping : Notes de réunion client synchronisées automatiquement dans Obsidian. L'orchestrateur scope la feature, recharge les crédits si nécessaire, récupère la config prod.
2. Spawn des agents : Git worktree isolé par feature (pas de conflits entre agents). Session tmux dédiée par agent. Commandes concrètes :
codex --model gpt-5.3-codex --dangerously-bypass-approvals-and-sandbox
claude --model claude-opus-4.5 --dangerously-skip-permissions
Les agents tournent en parallèle. En janvier 2026, Elvis a mergé 7 PRs en 30 minutes. Le tracking se fait dans .clawdbot/active-tasks.json.
3. Monitoring : Cron job toutes les 10 minutes. Script déterministe (.clawdbot/check-agents.sh) qui vérifie les sessions tmux actives, les PRs ouvertes, le statut CI via gh. Auto-respawn si un agent plante, jusqu'à 3 tentatives.
4. Création des PRs : gh pr create --fill. Définition du "done" : PR créée, branch synchronisée, CI qui passe, 3 reviews IA, screenshots obligatoires si changement UI.
5. Code review automatisée : Trois reviewers en parallèle :
- Codex Reviewer : edge cases, erreurs logiques, race conditions (le meilleur selon Elvis)
- Gemini Code Assist : sécurité et scalabilité (gratuit)
- Claude Code Reviewer : trop prudent pour être vraiment utile, sauf sur les parties critiques
6. Tests : Lint, TypeScript, unit tests, E2E, Playwright. Règle absolue : screenshot obligatoire si l'UI change, sinon le CI fail.
7. Human review : Notification Telegram quand tout passe. Elvis dit passer 5-10 minutes par review, souvent sans même lire le code, juste en regardant les screenshots.
8. Merge et cleanup : Cron daily qui supprime les worktrees et nettoie le task registry.
Codex ou Claude Code, lequel choisir pour quoi ?
Elvis utilise les deux, mais pas pour les mêmes tâches :
Codex (90% des tâches) : backend, bugs complexes, refactors multi-fichiers. C'est le cheval de labour. Meilleur pour les tâches longues qui nécessitent de comprendre un large contexte de code.
Claude Code : plus rapide sur le frontend, meilleur pour les opérations git, les changements ciblés. Sur les modifications de composants React et les migrations CSS, Claude Code Sonnet 4.6 est nettement plus véloce.
Gemini : design sensibility, génère les specs HTML/CSS, puis Claude Code implémente. Combo surprenant mais efficace pour les interfaces.
La règle d'Elvis : commence avec Codex pour tout, bascule sur Claude Code quand tu veux de la vitesse sur des tâches frontend bien définies.
Le Ralph Loop V2 : comment l'orchestrateur trouve du travail tout seul
C'est la partie la plus puissante du système. Quand un agent échoue, l'orchestrateur n'envoie pas le même prompt. Il analyse l'échec avec le contexte business complet avant de relancer.
Mais surtout : l'orchestrateur travaille proactivement.
- Le matin : scan Sentry, spawn des agents sur les erreurs détectées
- Après les réunions : scan des notes, spawn des agents sur les features mentionnées
- Le soir : scan du git log, spawn Claude Code pour le changelog et la documentation
Les "reward signals" qui valident qu'une tâche est vraiment terminée : CI qui passe, 3 reviews qui passent, merge humain. Pas juste un exit 0.
Ce pattern de feedback continu est ce qui distingue un vrai agent autonome d'un script glorifié.
C'est quoi le coût réel de ce setup ?
Elvis annonce environ 190$ par mois en régime de croisière : 100$ pour Claude, 90$ pour Codex. Il est possible de démarrer à 20$/mois avec des modèles moins chers.
Mais le vrai calcul : 94 commits en un jour sur une codebase complexe. 7 PRs en 30 minutes. Si ces commits génèrent du MRR, le ROI est évident.
En février 2026, Stripe a publié les détails techniques de "Minions", leur système interne d'agents de code non supervisés : plus de 1 300 PRs mergées par semaine, zéro ligne de code humain, sur une codebase de plusieurs centaines de millions de lignes. L'architecture est similaire : des agents isolés dans des devboxes AWS, un pipeline CI/CD strict, des blueprints qui alternent nœuds déterministes et nœuds agentiques.
Ce que Stripe fait à l'échelle d'une licorne de payments, Elvis le reproduit sur un Mac Mini 16GB. La limite hardware sur ce setup : la RAM. Chaque agent = un worktree + node_modules + builds + tests. Sur 16GB, tu tournes 4-5 agents max en simultané.
Claw-Bot a validé ce point lors de nos premiers déploiements : sur des machines avec 16GB de RAM, passer à 4 agents parallèles consomme la quasi-totalité des ressources disponibles.
Comment mettre en place ce workflow sur OpenClaw ?
Elvis a inclus dans son article une instruction directe : copier l'article complet dans OpenClaw et dire "Implement this agent swarm setup". Il annonce 10 minutes de setup.
La réalité est un peu plus nuancée :
- Il faut qu'OpenClaw soit déjà configuré et fonctionnel sur ta machine
- Le tracking JSON (
.clawdbot/active-tasks.json) et le script de monitoring doivent être créés pour ton repo - Les permissions
--dangerously-skip-permissions/--dangerously-bypass-approvalssont nécessaires pour que les agents tournent sans interruption, uniquement dans des worktrees isolés - Les notifications Telegram demandent une configuration du gateway
Si tu es à l'aise avec la ligne de commande et git, c'est effectivement rapide à bootstrapper. Si c'est ta première installation OpenClaw, commence par là.
Est-ce que ça marche vraiment pour un freelance solo ?
La vision d'Elvis, c'est la "one-person million-dollar company" : toi comme chef d'orchestre, les agents comme équipe. Engineering, support, ops, marketing. Chaque domaine avec ses agents spécialisés.
C'est ambitieux, mais la direction est clairement là. Ce qui est déjà réel aujourd'hui : un dev solo peut maintenir la vélocité d'une petite équipe sur des projets de taille moyenne, sans les réunions, sans la synchronisation, sans les vacances.
Le vrai unlock de ce workflow : la boucle de feedback automatisée. Les agents ne dorment pas, ne se bloquent pas sur un ticket Jira, et le cron de 10 minutes assure qu'aucune tâche ne reste bloquée silencieusement.
Claw-Bot installe ce type de setup pour des freelances et des petites équipes qui veulent scaler sans recruter. Si tu veux que ça tourne sur ta machine, on s'en occupe. À partir de 199€.