Blog
19 de abril de 2026Enterprise AI7 min

H2A — Human to Agent: The Missing Piece

A2A conecta agentes. MCP conecta herramientas. Pero ¿quién conecta al humano?

H2A · A2A · MCP · AG-UI · Modality Negotiation · NIST 800-63

Un cliente llama desde su smartphone. El agente de IA lee la cita en voz alta y simultáneamente envía un enlace de reserva por SMS. Mismo agente, mismo cliente — ahora desde un teléfono fijo. No hay SMS posible. Así que el agente reserva completamente por voz. Luego en el vehículo: dos frases cortas, pregunta de sí o no, un mapa en la pantalla. El agente sabe lo que su interlocutor puede hacer. Eso es H2A — Human to Agent.

Tres protocolos, un vacío

1
A2AAgente ↔ Agente
2
MCPAgente ↔ Tool
3
AG-UIFrontend ↔ Agente
4
H2AHuman ↔ Agent

Google construyó A2A para agente-a-agente: Cards, Tasks, Delegación. Anthropic desarrolló MCP para agente-a-herramienta: Discovery, Schemas, Backend. CopilotKit llenó el vacío frontend con AG-UI: SSE Events, Shared State. Pero ¿qué pasa cuando el agente no sabe si es posible enviar SMS? ¿Si el conductor está distraído? ¿Si la pantalla puede renderizar tres botones — o solo voz?

El Capability Envelope

json
{
  "channel": "headunit",
  "static": {
    "maxButtons": 3,
    "markdown": false,
    "driverDistraction": true
  },
  "situational": {
    "driving": true,
    "maxSentences": 2,
    "yesNoOnly": true
  }
}

La solución: un JSON estructurado que cada canal envía al establecer conexión. ¿Qué soy? ¿Qué puedo hacer? ¿Qué está pasando? Dos capas — estática y situacional. Estática nunca cambia dentro de una sesión. Situacional se actualiza en vivo por eventos. El agente se adapta en tiempo real.

Estática

  • Head unit: 3 botones, sin markdown
  • Webchat: contenido rico, imágenes
  • Fijo: solo voz, sin SMS
  • Nunca cambia por sesión

Situacional

  • Vehículo en marcha → 2 frases, sí/no
  • Vehículo detenido → respuestas más largas
  • Vista de mapa posible al estar parado
  • Actualizaciones en vivo por eventos

Un agente, cada punto de contacto

0Cambios en los agentes para un nuevo canalSolo un nuevo channel adapter + Capability Envelope

Lo revolucionario: el agente en sí no cambia. Mismo orquestador, mismos agentes especializados, misma lógica. Solo el formato de respuesta se adapta al envelope. ¿WhatsApp? Nuevo adapter, nuevo envelope. Listo.

Orquestador

Coordina todos los agentes especializados vía A2A. Los descubre automáticamente en el Agent Garden.

Agente de Identidad

Autenticación y verificación vía AI Confidence Scoring.

Agente de Reservas

Reserva de citas adaptada a las capacidades del canal.

Agente de Vehículo

Datos y control del vehículo vía One MCP Gateway.

Agente de Servicio

Solicitudes de servicio con contexto CRM completo.

One MCP Gateway

Acceso central al backend: CRM, calendario, APIs de vehículos, KB.

AI Confidence Scoring

1
HIGHmTLS / Connected Car
2
MEDIUMNúmero conocido
3
LOWDesconocido → Humano

En lugar de autenticación rígida: fusión de señales paralela. Once métodos, priorizados según NIST 800-63, asegurados regulatoriamente según RGPD Art. 22. La biometría de voz no es un factor independiente — NIST lo prohíbe explícitamente. FIDO2 y passkeys tienen prioridad.

El sistema está construido sobre siete marcos regulatorios simultáneamente: RGPD, eIDAS 2.0, PSD2, EU AI Act, NIST 800-63, ISO 21434, UNECE R155.

El stack de protocolos completo

AG-UI

Frontend ↔ Agente: Eventos, Estado, Renderizado. Estándar CopilotKit.

A2A

Agente ↔ Agente: Tareas, Delegación, Federación. Estándar Google.

MCP

Agente ↔ Herramientas: Descubrimiento, Esquemas, Backend. Estándar Anthropic.

SIP/WebSocket

Mundo de voz: audio que ningún otro protocolo maneja nativamente.

El Capability Envelope es el puente que le falta a AG-UI. Extiende frontend-a-agente con negociación de modalidad, restricciones situacionales y contexto de autenticación.

Por qué nadie construye esto

Status Quo

  • Un bot por canal
  • Cada uno conoce solo su contexto
  • El cliente se repite ante cada uno
  • Sin transferencia de auth entre canales
  • Islas aisladas

Arquitectura H2A

  • Un agente, todos los canales
  • El envelope entrega contexto
  • Customer journey sin fisuras
  • AI Confidence entre canales
  • Sistema conectado
55referencias regulatorias validadas cruzadamente7 dominios de investigación profunda · PRD + TAD totalizando 2.500 líneas

Quien escatima en los protocolos entre humano y agente construye islas aisladas en vez de un sistema conectado.

Ninguna empresa del sector ha preparado una arquitectura EUDI-Wallet-Ready. Nadie combina AI Confidence Scoring con diseño regulatorio de primeros principios. Eso requiere un replanteamiento arquitectónico que va más allá de equipos individuales.

— Philipp

¿H2A para tu organización? Hablemos de arquitectura de IA omnicanal.

Reservar consulta