Mein eigener Jarvis
Proxmox, Kubernetes, lokale LLMs und 54 Terabyte — die KI-Infrastruktur meiner Familie
Wenn meine Frau mich fragt, was im Serverraum steht, sage ich: „Jarvis.“ Das ist natürlich gelogen. Da steht ein Minisforum N5Pro. Klein, leise, 96 GB RAM. Aber was darauf läuft, ist näher an Jarvis als an einem normalen Homeserver.
Warum ein Homelab, wenn es die Cloud gibt?
Weil ich meine Daten kontrollieren will. Fotos, Dokumente, Steuererklärungen, Gesundheitsdaten, die Schulzeugnisse meiner Kinder — das gehört nicht auf fremde Server. Und weil ich lokale LLMs laufen lassen will. Modelle, die meine Dokumente verarbeiten, ohne dass ein Token die Hardware verlässt.
Das klingt nach Prinzipienreiterei. Ist es nicht. Wenn dein Homelab deine Steuerdokumente verarbeitet, deine Familienfotos taggt und deine Gesundheitsdaten analysiert, dann ist „lokal“ keine Präferenz. Es ist die einzige vertretbare Option.
Die Architektur hinter Jarvis
Proxmox 9 als Hypervisor. 8 VMs: TrueNAS für 54 TB Storage, Home Assistant für die Hausautomation, Windows für KNX-Programmierung mit ETS — und ein kompletter k3s-Kubernetes-Cluster mit 3 Masters und 2 Workers. Dazu 26 LXC-Container: DevProcess, Docker, n8n, Qdrant, Elasticsearch, PostgreSQL, Redis, InfluxDB. Ein AI-Stack. Dokumentenverarbeitung. Monitoring. Medien. Netzwerk.
Paperless-NGX und Stirling-PDF für Dokumente. Grafana, Prometheus und Uptime Kuma fürs Monitoring. Jellyfin, PhotoPrism und Audiobookshelf für Medien. WireGuard, AdGuard und UniFi fürs Netzwerk. Node-RED, MQTT und ESPHome für die Hausautomation. Und dazwischen: n8n als Orchestrator, der alles verbindet.
Die Familie im Mittelpunkt
Die Storage-Architektur ist Family-Centric. Jedes Familienmitglied hat seinen eigenen Bereich: Dokumente, Fotos, Videos, Backups. Dazu ein Shared-Bereich: Familienfotos, Urlaubsvideos, Versicherungen, Schulunterlagen. PhotoPrism sortiert automatisch. Audiobookshelf verwaltet unsere Hörbücher. Jellyfin streamt im ganzen Haus. Alles lokal, alles unter meiner Kontrolle.
Ollama und die n8n-Agenten
Der AI-Stack nutzt die 96 GB RAM voll aus. Ollama läuft mit mehreren Modellen: Llama für allgemeine Aufgaben, Codellama für Code-Analyse, Mistral für schnelle Antworten. Kein Token geht an einen externen Server. Kein Prompt wird geloggt. Kein Modell kann abgeschaltet werden, weil ein Provider sein Pricing ändert.
Das eigentlich Spannende sind nicht die einzelnen Services. Es ist die Vernetzung. n8n-Workflows als Agenten, die Paperless-Dokumente durchsuchen, Antworten aus Ollama generieren, Ergebnisse in Home Assistant einspeisen. Alles lokal. Kein Cloud-Abo, keine API-Kosten für Routineaufgaben, keine Abhängigkeit von Firmen, die morgen ihren Free Tier abschaffen.
RAG für das eigene Leben
Der Workflow ist simpel: Dokument mit Adobe Scan abfotografieren, per E-Mail an eine spezifische Adresse weiterleiten — fertig. Verschiedene E-Mail-Adressen bedeuten verschiedene Vorqualifikationen: Rechnung, Versicherung, Schule, Gesundheit. Paperless-NGX liest die Mail ein, und Paperless AI übernimmt auf Basis der lokalen LLMs die Feinklassifikation. Kein manuelles Sortieren, kein Ordnersystem, keine Cloud.
Dasselbe gilt für digitale Post: E-Mail weiterleiten, fertig. Das Endspiel ist RAG über alles. Qdrant als Vektordatenbank. Ollama-Embeddings für semantische Suche. „Wann war der letzte TÜV?“ — und das System durchsucht nicht Ordner, sondern versteht die Frage und findet die Antwort in einem gescannten Brief von vor drei Jahren. Auf einem Minisforum unter meinem Schreibtisch.
Der Doorbird und die Gesichtserkennung
Die Türklingel ist ein Doorbird D2102. Die Kamera erkennt Gesichter. Home Assistant reagiert: Bekanntes Gesicht → Tür öffnen, Licht an, Musik starten. Unbekanntes Gesicht → Benachrichtigung mit Foto aufs Handy. Alles lokal verarbeitet, kein Cloud-Service.
Der Traum vom autonomen Haus
Jarvis ist noch nicht fertig. Er wird nie fertig sein. Aber er wächst. Jeder neue Service, jeder neue Workflow, jedes neue Modell macht ihn ein Stück intelligenter. Und eines Tages wird er nicht nur meine Fragen beantworten, sondern sie voraussehen.
Wenn mein Sohn in zehn Jahren fragt, warum im Keller ein Server steht, werde ich sagen: „Das ist Jarvis. Er passt auf uns auf.“
— Philipp