Más que un chatbot
Cómo construí un Breathing Agent que observa, comprende y actúa por sí mismo
AG-UI · A2A · MCP · React · FastAPI · Bedrock
Imagina que estás sentado en un estudio de grabación. A tu lado hay una productora de audiolibros experimentada. Siempre está ahí. Casi siempre en silencio. Cuando trabajas concentrado y todo va bien, no dice nada. Pero sabes que está ahí. Y cuando ve algo — una repetición, una ruptura de estilo, un error — habla. Directa, constructiva, nunca condescendiente.
El problema con los agentes clásicos
Agente Clásico
- Espera en la habitación de al lado
- El usuario debe llamar
- Panel de chat como prisión
- Sin contexto entre páginas
- O encendido o apagado
Breathing Agent (Aria)
- Se sienta a tu lado
- Observa y actúa autónomamente
- Vive en la aplicación
- Contexto persistente en todas partes
- 4 estados de respiración fluidos
Todas las aplicaciones de IA que conozco hacen lo mismo: una ventana de chat, un campo de entrada, un botón. Eso no es un asistente — es un mostrador de servicio. Con AudioLoom quería algo diferente. La pregunta nunca fue: ¿Dónde colocamos el agente? La pregunta era: ¿Cómo se comporta una colega competente?
Aria respira
REPOSO
Todo funciona. Solo su avatar con un pulso suave. Como una respiración tranquila.
ATENTA
Nota algo. Un toast en el borde — sin cambio de layout, solo una observación concreta.
EN CONVERSACIÓN
El usuario se dirige a ella. Se abre el diálogo. Contexto completo, historial persistente.
ORQUESTANDO
'Hazlo.' Los campos se llenan, las páginas cambian, barras de progreso. Todo interrumpible.
Navegación y Aria respiran en sentido contrario. Aria se expande → Navegación colapsa a iconos. Transición de 300ms. Pérdida neta: 60 píxeles. Nadie lo nota.
5 paradojas de un buen asistente
“Las reglas no hacen un buen asistente. Las tensiones entre reglas hacen un buen asistente.”
Segura ↔ Humilde
Suficiente fuerza para discrepar — suficiente grandeza para equivocarse.
Proactiva ↔ Contenida
Ayuda antes de preguntar — nunca molesta.
Autónoma ↔ Transparente
Trabaja independientemente — devuelve el control en cualquier momento.
Honesta ↔ Diplomática
Nombra problemas — protege el proceso creativo.
Competente ↔ Aprendiendo
Cuando Aria admite equivocarse, su siguiente desacuerdo gana peso.
El modo director
'Tengo un PDF con mi novela. Haz una serie de audiolibros de 5 partes. Noir, Hamburgo, primera persona.' Lo que pasa: Aria lee, analiza, crea la serie, construye la biblia, genera 5 episodios — todo visible, todo interrumpible. El usuario no tocó un formulario. Habló, Aria trabajó.
Esto no es un modo separado. Es Aria respondiendo a una instrucción verbal en lugar de esperar entrada de formulario.
Cómo Aria controla la página: AG-UI
Aria no es un agente de chat aislado. Controla la aplicación directamente vía el protocolo AG-UI. 'Crea un nuevo episodio' → Aria navega a la página, abre el diálogo, rellena los campos, confirma. El usuario ve cada paso. Aria no trabaja en segundo plano — trabaja ante tus ojos.

Tres capas de percepción
Tier 1: Browser
Repeticiones, campos vacíos, violaciones ACX. Instantáneo, gratis.
Tier 2: Server
Consistencia entre episodios, alineación con biblia. Debounced, 5s después del último cambio.
Tier 3: LLM
Análisis de estilo, agujeros de trama, feedback de género. Solo al completar fases o bajo petición.
El usuario no experimenta a Aria como omnisciente, sino como atenta. Algunas cosas las ve inmediatamente, otras necesitan un momento. Como un humano.
Por qué esto funciona
“La mejor interacción con IA no se siente como IA. Se siente como una buena colega.”

La filosofía del Breathing Agent no es una característica de AudioLoom. Es una filosofía de diseño para cada producto con asistente de IA. La pregunta central siempre permanece: no dónde coloco el agente — sino cómo se comporta una persona en la habitación.
— Philipp
¿Breathing Agent para tu producto? Hablemos de asistentes de IA que se sienten naturales.
Reservar consulta