19 de abril de 2026Enterprise AI7 min

H2A — Human to Agent: The Missing Piece

A2A conecta agentes. MCP conecta herramientas. Pero ¿quién conecta al humano?

H2A · A2A · MCP · AG-UI · Modality Negotiation · NIST 800-63

Un cliente llama desde su smartphone. El agente de IA lee la cita en voz alta y simultáneamente envía un enlace de reserva por SMS. Mismo agente, mismo cliente — ahora desde un teléfono fijo. No hay SMS posible. Así que el agente reserva completamente por voz. Luego en el vehículo: dos frases cortas, pregunta de sí o no, un mapa en la pantalla. El agente sabe lo que su interlocutor puede hacer. Eso es H2A — Human to Agent.

Tres protocolos, un vacío

A2AAgente ↔ Agente

MCPAgente ↔ Tool

AG-UIFrontend ↔ Agente

H2AHuman ↔ Agent

Google construyó A2A para agente-a-agente: Cards, Tasks, Delegación. Anthropic desarrolló MCP para agente-a-herramienta: Discovery, Schemas, Backend. CopilotKit llenó el vacío frontend con AG-UI: SSE Events, Shared State. Pero ¿qué pasa cuando el agente no sabe si es posible enviar SMS? ¿Si el conductor está distraído? ¿Si la pantalla puede renderizar tres botones — o solo voz?

El Capability Envelope

json

{
  "channel": "headunit",
  "static": {
    "maxButtons": 3,
    "markdown": false,
    "driverDistraction": true
  },
  "situational": {
    "driving": true,
    "maxSentences": 2,
    "yesNoOnly": true
  }
}

La solución: un JSON estructurado que cada canal envía al establecer conexión. ¿Qué soy? ¿Qué puedo hacer? ¿Qué está pasando? Dos capas — estática y situacional. Estática nunca cambia dentro de una sesión. Situacional se actualiza en vivo por eventos. El agente se adapta en tiempo real.

Estática

Head unit: 3 botones, sin markdown
Webchat: contenido rico, imágenes
Fijo: solo voz, sin SMS
Nunca cambia por sesión

Situacional

Vehículo en marcha → 2 frases, sí/no
Vehículo detenido → respuestas más largas
Vista de mapa posible al estar parado
Actualizaciones en vivo por eventos

Un agente, cada punto de contacto

0Cambios en los agentes para un nuevo canalSolo un nuevo channel adapter + Capability Envelope

Lo revolucionario: el agente en sí no cambia. Mismo orquestador, mismos agentes especializados, misma lógica. Solo el formato de respuesta se adapta al envelope. ¿WhatsApp? Nuevo adapter, nuevo envelope. Listo.

Orquestador

Coordina todos los agentes especializados vía A2A. Los descubre automáticamente en el Agent Garden.

Agente de Identidad

Autenticación y verificación vía AI Confidence Scoring.

Agente de Reservas

Reserva de citas adaptada a las capacidades del canal.

Agente de Vehículo

Datos y control del vehículo vía One MCP Gateway.

Agente de Servicio

Solicitudes de servicio con contexto CRM completo.

One MCP Gateway

Acceso central al backend: CRM, calendario, APIs de vehículos, KB.

AI Confidence Scoring

HIGHmTLS / Connected Car

MEDIUMNúmero conocido

LOWDesconocido → Humano

En lugar de autenticación rígida: fusión de señales paralela. Once métodos, priorizados según NIST 800-63, asegurados regulatoriamente según RGPD Art. 22. La biometría de voz no es un factor independiente — NIST lo prohíbe explícitamente. FIDO2 y passkeys tienen prioridad.

El sistema está construido sobre siete marcos regulatorios simultáneamente: RGPD, eIDAS 2.0, PSD2, EU AI Act, NIST 800-63, ISO 21434, UNECE R155.

El stack de protocolos completo

AG-UI

Frontend ↔ Agente: Eventos, Estado, Renderizado. Estándar CopilotKit.

A2A

Agente ↔ Agente: Tareas, Delegación, Federación. Estándar Google.

MCP

Agente ↔ Herramientas: Descubrimiento, Esquemas, Backend. Estándar Anthropic.

SIP/WebSocket

Mundo de voz: audio que ningún otro protocolo maneja nativamente.

El Capability Envelope es el puente que le falta a AG-UI. Extiende frontend-a-agente con negociación de modalidad, restricciones situacionales y contexto de autenticación.

Por qué nadie construye esto

Status Quo

Un bot por canal
Cada uno conoce solo su contexto
El cliente se repite ante cada uno
Sin transferencia de auth entre canales
Islas aisladas

Arquitectura H2A

Un agente, todos los canales
El envelope entrega contexto
Customer journey sin fisuras
AI Confidence entre canales
Sistema conectado

55referencias regulatorias validadas cruzadamente7 dominios de investigación profunda · PRD + TAD totalizando 2.500 líneas

“Quien escatima en los protocolos entre humano y agente construye islas aisladas en vez de un sistema conectado.”

Ninguna empresa del sector ha preparado una arquitectura EUDI-Wallet-Ready. Nadie combina AI Confidence Scoring con diseño regulatorio de primeros principios. Eso requiere un replanteamiento arquitectónico que va más allá de equipos individuales.

— Philipp

¿H2A para tu organización? Hablemos de arquitectura de IA omnicanal.

Reservar consulta