Blog
10. April 2026Dev Team Serie7 min

Die Schmiede

Warum ich Claude Code nachgebaut habe — und was ich dabei über KI-Tools gelernt habe

Ich habe Claude Code nachgebaut. Nicht aus Langeweile, nicht aus Übermut — sondern weil ich an eine Wand gelaufen bin, die jeder kennt, der ernsthaft mit KI-Agenten arbeitet: Vendor Lock-in.

Das Problem, das keiner anspricht

Claude Code ist brillant. Opus 4 denkt tiefer als jedes andere Modell, das ich kenne. Aber Claude Code läuft nur mit Anthropic-Modellen. Ein 370.000 LOC Tool, das mich an einen einzigen Provider bindet.

Gleichzeitig arbeite ich täglich mit Gemini 2.5 Pro, wenn ich eine Million Token Kontext brauche. Mit GPT-5, wenn ich Reasoning-Aufgaben habe. Mit lokalen Modellen via Ollama, wenn Daten nicht in die Cloud dürfen. Jedes Modell hat Stärken. Kein Modell kann alles.

Forge: Eine Schmiede für Software

Also habe ich Forge gebaut. Eine autonome Entwicklungsplattform, die sich selbst optimiert, jedes LLM nutzt, und von jedem Gerät steuerbar ist. Der Name ist Programm: Eine Schmiede, die Software schmiedet wie ein erfahrenes Team.

Die Architektur ist modular: Ein Model Router abstrahiert alle Provider — Anthropic, Google, OpenAI, lokale Modelle. Jede Aufgabe bekommt nicht das teuerste Modell, sondern das passendste. Opus für Architektur. Gemini für großen Kontext. Sonnet für schnelle Iterationen.

29 Tools, 131 Tests, 58% Parity

Ich habe den gesamten Claude Code Source Code analysiert — 38 Tools, 18+ Dateien allein für den Agent-Executor, 1.185 Zeilen nur für das Read-Tool. Dann habe ich jedes einzelne Tool nachgebaut: File-Tools, Shell-Tools, Agent-Tools, MCP-Integration, Workflow-Tools, Team-Tools, IDE-Tools. 29 Tools in Produktion, 131 Tests grün.

Und dann habe ich Features gebaut, die Claude Code nicht hat: Cron-Scheduling für wiederkehrende Aufgaben. LLM-basierte Kontext-Zusammenfassung statt simples Abschneiden. Cost-Tracking mit Budgets pro Session, Tag und Modell. Hook-basiertes Tool-Blocking.

Cross-Device: Vom Handy planen, am Rechner bauen

Der tägliche Bruch, den ich lösen wollte: Idee auf dem Handy in Claude.AI besprechen. An den Rechner setzen, Kontext neu aufbauen. Session endet, Wissen verloren. Nächster Tag: von vorne.

In Forge lebt der Session-State auf dem Server. Jedes Gerät ist ein Fenster in dieselbe Arbeit. Handy zum Planen und Reviewen. Desktop für Deep Work. Tablet zum Monitoring. Der Kontext geht nie verloren.

Bootstrapping: Forge baut Forge

Das Schönste an Forge ist das Prinzip des Bootstrappings. Phase 1: Forge wird mit Claude Code gebaut. Phase 2: Forge baut mit Forge und Claude Code zusammen. Phase 3: Forge baut sich selbst. Jede Verbesserung an Forge macht Forge besser darin, sich selbst zu verbessern.

Aktuell bin ich in Phase 1. 29 Tools funktionieren. Der Query-Engine streamt. Agents spawnen. Aber der Weg zur vollständigen Selbstoptimierung ist noch lang. Und genau das macht es so spannend.

Warum das für alle relevant ist

Forge ist ein Hobby-Projekt. Aber das Problem, das es löst, ist universell: Wer heute ernsthaft mit KI entwickelt, braucht Zugang zu mehreren Modellen. Braucht Persistenz über Sessions hinweg. Braucht Quality Gates, die hart durchgreifen — nicht Prompts, die bitten. Und braucht die Freiheit, das beste Tool für die jeweilige Aufgabe zu wählen.

Das ist keine Theorie. Das ist das, was ich jeden Tag lebe — bei Mercedes-Benz und in meinen eigenen Projekten. Die Zukunft der KI-Entwicklung ist nicht ein Modell, ein Tool, ein Provider. Sie ist ein Orchester.

— Philipp