Blog
10. April 2026Dev Team Serie7 min

Die Endlosschleife

Wie mein Dev Team Bugs findet, fixt und daraus lernt — ohne mich zu fragen

Es ist 23:47 Uhr. Mein Laptop meldet: 3 neue DevProcess-Tickets. Ich schaue kurz hin: Severity Low, UI-Fehler. Ich tippe: „Arbeite autonom an den offenen Tickets.“ Dann gehe ich schlafen.

Der Traum von autonomer Entwicklung

Jeder, der mit KI-Agenten arbeitet, kennt das Gefühl: Du bist der Flaschenhals. Der Agent wartet auf dein „Ja“, dein Review, deine Bestätigung. Bei jedem Commit. Bei jeder Datei. Bei jeder Entscheidung. Das ist Human in the Loop — und es skaliert nicht.

In meiner Agent-in-the-Loop Studie habe ich es gemessen: 38% aller meiner Nachrichten an KI-Agenten waren Frustrations-Overhead. „Nein, nicht so.“ „Das war nicht gemeint.“ „Lösch das wieder.“ 31% waren komplett automatisierbar. Nur 6% waren echte strategische Entscheidungen.

Das autonome Dev Team

Also habe ich ein System gebaut, das die 31% eliminiert. Kein neues Framework, kein Standalone-Service — nur intelligente Verkettung dessen, was schon da ist: 34 Skills, 4 Hook-Typen, 2 MCP-Server, Memory-System.

Die Architektur folgt einem einfachen Prinzip: Risiko bestimmt Autonomie. Level 1 bis 3 — Code-Style, Commit-Messages, Test-Strategie — entscheidet der Agent allein. Level 4 bis 6 — Architektur, API-Design — konsultiert er den Knowledge Backbone. Level 7 und 8 — Breaking Changes, Security, Production — fragt er mich.

Skill Chains: Der autonome Workflow

Wenn ich sage „Implementiere MVA-456 komplett“, passiert Folgendes: Der Orchestrator erkennt den Workflow-Typ. Liest das JIRA-Ticket via MCP. Fragt den KB-Agent nach relevantem Kontext. Erstellt einen Feature-Branch. Implementiert. Führt ein Self-Review durch. Testet im Browser. Erstellt den PR. Und meldet sich: „PR ready for review.“

Dazwischen liegen 5 verkettete Skills, 2 MCP-Abfragen, 4 Quality Gates und null Fragen an mich. Das ist die Endlosschleife: Ticket rein, PR raus.

Der Knowledge Backbone

Das Herzstück ist der KB-Agent — ein semantischer Wissensspeicher mit Temporal Knowledge Management. Jede Entscheidung, jede Korrektur, jeder Fehler fließt zurück. Confidence Decay sorgt dafür, dass veraltetes Wissen an Gewicht verliert. Conflict Detection erkennt widersprüchliche Informationen.

Wenn ich den Agent korrigiere — „Nein, nicht so, sondern so“ — erkennt der Learning Loop die Korrektur und speichert sie. Nächstes Mal macht er denselben Fehler nicht mehr. Das System wird mit jeder Interaktion besser.

Circuit Breaker und Reliability

Autonomie ohne Zuverlässigkeit ist gefährlich. Deshalb habe ich ein Reliability System gebaut: Workflow State Machine, Task Persistence, Circuit Breaker für externe Services, Confidence Tracking für Entscheidungen.

Wenn JIRA nicht erreichbar ist, greift der Cache. Wenn ein Skill fehlschlägt, wird automatisch ein anderer Ansatz versucht. Wenn der Browser-Test Fehler meldet, liest der Agent den Source Code, bevor er fixt. Drei Versuche. Dann erst Eskalation an mich.

Die Zahlen dahinter

Vorher: 10 manuelle Triggers pro Feature, 5 Korrekturen, 3 Context Rebuilds, 4 Stunden Time-to-Ship. Nachher: 2 bis 3 Triggers, 1 bis 2 Korrekturen, null Context Rebuilds, unter einer Stunde.

Das sind keine Marketing-Zahlen. Das sind die realen Metriken aus meiner täglichen Arbeit an 5 Projekten parallel. Der Punkt ist nicht Perfektion — es ist Richtung. Und die Richtung stimmt.

Was als Nächstes kommt

Die Endlosschleife ist nie fertig. Aktuell arbeite ich daran, die Retro-Automatisierung zu verbessern: Nach jedem Sprint analysiert das System seine eigene Performance. Welche Skills waren langsam? Welche Korrekturen häuften sich? Welche Regeln müssen angepasst werden?

Das Ziel: Nicht ich optimiere das System. Das System optimiert sich selbst. Und ich bleibe der Dirigent, der die Partitur schreibt.

— Philipp