H2A — Human to Agent: The Missing Piece
A2A conecta agentes. MCP conecta herramientas. Pero ¿quién conecta al humano?
H2A · A2A · MCP · AG-UI · Modality Negotiation · NIST 800-63
Un cliente llama desde su smartphone. El agente de IA lee la cita en voz alta y simultáneamente envía un enlace de reserva por SMS. Mismo agente, mismo cliente — ahora desde un teléfono fijo. No hay SMS posible. Así que el agente reserva completamente por voz. Luego en el vehículo: dos frases cortas, pregunta de sí o no, un mapa en la pantalla. El agente sabe lo que su interlocutor puede hacer. Eso es H2A — Human to Agent.
Tres protocolos, un vacío
Google construyó A2A para agente-a-agente: Cards, Tasks, Delegación. Anthropic desarrolló MCP para agente-a-herramienta: Discovery, Schemas, Backend. CopilotKit llenó el vacío frontend con AG-UI: SSE Events, Shared State. Pero ¿qué pasa cuando el agente no sabe si es posible enviar SMS? ¿Si el conductor está distraído? ¿Si la pantalla puede renderizar tres botones — o solo voz?
El Capability Envelope
{
"channel": "headunit",
"static": {
"maxButtons": 3,
"markdown": false,
"driverDistraction": true
},
"situational": {
"driving": true,
"maxSentences": 2,
"yesNoOnly": true
}
}La solución: un JSON estructurado que cada canal envía al establecer conexión. ¿Qué soy? ¿Qué puedo hacer? ¿Qué está pasando? Dos capas — estática y situacional. Estática nunca cambia dentro de una sesión. Situacional se actualiza en vivo por eventos. El agente se adapta en tiempo real.
Estática
- Head unit: 3 botones, sin markdown
- Webchat: contenido rico, imágenes
- Fijo: solo voz, sin SMS
- Nunca cambia por sesión
Situacional
- Vehículo en marcha → 2 frases, sí/no
- Vehículo detenido → respuestas más largas
- Vista de mapa posible al estar parado
- Actualizaciones en vivo por eventos
Un agente, cada punto de contacto
Lo revolucionario: el agente en sí no cambia. Mismo orquestador, mismos agentes especializados, misma lógica. Solo el formato de respuesta se adapta al envelope. ¿WhatsApp? Nuevo adapter, nuevo envelope. Listo.
Orquestador
Coordina todos los agentes especializados vía A2A. Los descubre automáticamente en el Agent Garden.
Agente de Identidad
Autenticación y verificación vía AI Confidence Scoring.
Agente de Reservas
Reserva de citas adaptada a las capacidades del canal.
Agente de Vehículo
Datos y control del vehículo vía One MCP Gateway.
Agente de Servicio
Solicitudes de servicio con contexto CRM completo.
One MCP Gateway
Acceso central al backend: CRM, calendario, APIs de vehículos, KB.
AI Confidence Scoring
En lugar de autenticación rígida: fusión de señales paralela. Once métodos, priorizados según NIST 800-63, asegurados regulatoriamente según RGPD Art. 22. La biometría de voz no es un factor independiente — NIST lo prohíbe explícitamente. FIDO2 y passkeys tienen prioridad.
El sistema está construido sobre siete marcos regulatorios simultáneamente: RGPD, eIDAS 2.0, PSD2, EU AI Act, NIST 800-63, ISO 21434, UNECE R155.
El stack de protocolos completo
AG-UI
Frontend ↔ Agente: Eventos, Estado, Renderizado. Estándar CopilotKit.
A2A
Agente ↔ Agente: Tareas, Delegación, Federación. Estándar Google.
MCP
Agente ↔ Herramientas: Descubrimiento, Esquemas, Backend. Estándar Anthropic.
SIP/WebSocket
Mundo de voz: audio que ningún otro protocolo maneja nativamente.
El Capability Envelope es el puente que le falta a AG-UI. Extiende frontend-a-agente con negociación de modalidad, restricciones situacionales y contexto de autenticación.
Por qué nadie construye esto
Status Quo
- Un bot por canal
- Cada uno conoce solo su contexto
- El cliente se repite ante cada uno
- Sin transferencia de auth entre canales
- Islas aisladas
Arquitectura H2A
- Un agente, todos los canales
- El envelope entrega contexto
- Customer journey sin fisuras
- AI Confidence entre canales
- Sistema conectado
“Quien escatima en los protocolos entre humano y agente construye islas aisladas en vez de un sistema conectado.”
Ninguna empresa del sector ha preparado una arquitectura EUDI-Wallet-Ready. Nadie combina AI Confidence Scoring con diseño regulatorio de primeros principios. Eso requiere un replanteamiento arquitectónico que va más allá de equipos individuales.
— Philipp
¿H2A para tu organización? Hablemos de arquitectura de IA omnicanal.
Reservar consulta