Blog
12 de abril de 2026Research6 min

Más que un chatbot

Cómo construí un Breathing Agent que observa, comprende y actúa por sí mismo

AG-UI · A2A · MCP · React · FastAPI · Bedrock

Imagina que estás sentado en un estudio de grabación. A tu lado hay una productora de audiolibros experimentada. Siempre está ahí. Casi siempre en silencio. Cuando trabajas concentrado y todo va bien, no dice nada. Pero sabes que está ahí. Y cuando ve algo — una repetición, una ruptura de estilo, un error — habla. Directa, constructiva, nunca condescendiente.

El problema con los agentes clásicos

Agente Clásico

  • Espera en la habitación de al lado
  • El usuario debe llamar
  • Panel de chat como prisión
  • Sin contexto entre páginas
  • O encendido o apagado

Breathing Agent (Aria)

  • Se sienta a tu lado
  • Observa y actúa autónomamente
  • Vive en la aplicación
  • Contexto persistente en todas partes
  • 4 estados de respiración fluidos

Todas las aplicaciones de IA que conozco hacen lo mismo: una ventana de chat, un campo de entrada, un botón. Eso no es un asistente — es un mostrador de servicio. Con AudioLoom quería algo diferente. La pregunta nunca fue: ¿Dónde colocamos el agente? La pregunta era: ¿Cómo se comporta una colega competente?

Aria respira

REPOSO

Todo funciona. Solo su avatar con un pulso suave. Como una respiración tranquila.

ATENTA

Nota algo. Un toast en el borde — sin cambio de layout, solo una observación concreta.

EN CONVERSACIÓN

El usuario se dirige a ella. Se abre el diálogo. Contexto completo, historial persistente.

ORQUESTANDO

'Hazlo.' Los campos se llenan, las páginas cambian, barras de progreso. Todo interrumpible.

Navegación y Aria respiran en sentido contrario. Aria se expande → Navegación colapsa a iconos. Transición de 300ms. Pérdida neta: 60 píxeles. Nadie lo nota.

5 paradojas de un buen asistente

Las reglas no hacen un buen asistente. Las tensiones entre reglas hacen un buen asistente.

Segura ↔ Humilde

Suficiente fuerza para discrepar — suficiente grandeza para equivocarse.

Proactiva ↔ Contenida

Ayuda antes de preguntar — nunca molesta.

Autónoma ↔ Transparente

Trabaja independientemente — devuelve el control en cualquier momento.

Honesta ↔ Diplomática

Nombra problemas — protege el proceso creativo.

Competente ↔ Aprendiendo

Cuando Aria admite equivocarse, su siguiente desacuerdo gana peso.

El modo director

20Sub-agentes trabajando tras bambalinas12 agentes de historia + 8 agentes core

'Tengo un PDF con mi novela. Haz una serie de audiolibros de 5 partes. Noir, Hamburgo, primera persona.' Lo que pasa: Aria lee, analiza, crea la serie, construye la biblia, genera 5 episodios — todo visible, todo interrumpible. El usuario no tocó un formulario. Habló, Aria trabajó.

Esto no es un modo separado. Es Aria respondiendo a una instrucción verbal en lugar de esperar entrada de formulario.

Cómo Aria controla la página: AG-UI

1
AG-UIEstado & Eventos
2
A2AAgent Cards
3
MCPAcceso a Tools
4
OrquestadorEnrutamiento

Aria no es un agente de chat aislado. Controla la aplicación directamente vía el protocolo AG-UI. 'Crea un nuevo episodio' → Aria navega a la página, abre el diálogo, rellena los campos, confirma. El usuario ve cada paso. Aria no trabaja en segundo plano — trabaja ante tus ojos.

Aria en conversación con el usuario
Aria en estado EN CONVERSACIÓN — diálogo con contexto completo

Tres capas de percepción

1
Tier 1Browser — instantáneo
2
Tier 2Server — 5s debounce
3
Tier 3LLM — al final de fase

Tier 1: Browser

Repeticiones, campos vacíos, violaciones ACX. Instantáneo, gratis.

Tier 2: Server

Consistencia entre episodios, alineación con biblia. Debounced, 5s después del último cambio.

Tier 3: LLM

Análisis de estilo, agujeros de trama, feedback de género. Solo al completar fases o bajo petición.

El usuario no experimenta a Aria como omnisciente, sino como atenta. Algunas cosas las ve inmediatamente, otras necesitan un momento. Como un humano.

Por qué esto funciona

122Tests E2E aseguran el sistema9 fases de desarrollo, 4 estados de respiración, 5 paradojas, 1 protocolo de desacuerdo

La mejor interacción con IA no se siente como IA. Se siente como una buena colega.

Aria en estado de reposo
Aria en estado REPOSO — solo un pulso suave señala su presencia

La filosofía del Breathing Agent no es una característica de AudioLoom. Es una filosofía de diseño para cada producto con asistente de IA. La pregunta central siempre permanece: no dónde coloco el agente — sino cómo se comporta una persona en la habitación.

— Philipp

¿Breathing Agent para tu producto? Hablemos de asistentes de IA que se sienten naturales.

Reservar consulta