La industria de IA agéntica tiene un problema de arquitectura, pero la mayoría de las personas están resolviendo lo incorrecto. Todos están construyendo agentes. Prompts más inteligentes, mejores modelos, sin embargo, muchos de estos proyectos nunca llegan a producción.
La Brecha de Realidad en Producción
Los agentes son lo suficientemente inteligentes, pero la arquitectura se queda corta. Después de observar 1.7 mil millones de workflows agénticos ejecutarse este año en clientes empresariales, el patrón es claro: la brecha no es la inteligencia. Es la arquitectura.
Estado Actual: Dónde se Quedó Estancada la Industria
Hace dos años, la pregunta era "¿Son los agentes incluso reales?". Hoy, todos los están construyendo, todo tipo de proveedores están rebrandeando sus herramientas de automatización como "agentes inteligentes". Sin embargo, esto es lo que consistentemente falla:
Cadenas de Prompts como Agentes
LLMs + herramientas en un loop. Llamar a un LLM, parsear salida, encadenar otra llamada, llamar a una API, formatear respuesta. Agregar 'agéntico' a la documentación y enviarlo.
Estas son llamadas a API scripteadas con un LLM en el medio. Son geniales si eso es todo lo que tu caso de uso necesita, pero colapsan cuando realmente necesitas agencia.
DAGs/Grafos sobre Mantenibilidad
Nodos, bordes, máquinas de estado, todo visualmente impresionante y conceptualmente sólido. Pero en producción se convierte en depurar el grafo en lugar de resolver el problema de negocio.
Cuando los cambios que rompen se envían semanalmente, estás manteniendo el framework, no tu lógica de negocio.
Agentes Autónomos sin Restricciones Arquitectónicas
Darle herramientas, establecer un objetivo, dejarlo correr. Esto es por lo que vemos predicciones como 'X% de los despliegues de IA agéntica se cancelan'.
Agencia sin límites sin arquitectura no da la confianza requerida para que las empresas desplieguen flujos de trabajo críticos.
El patrón parece ser que todos están optimizando para la inteligencia del agente, pero casi nadie está construyendo para la arquitectura del sistema. Los ganadores no tendrán los agentes más inteligentes, sino la arquitectura que hace a los agentes confiables, desplegables y gobernables.
¿Qué son los Sistemas Agénticos?
Comienza con lo que la producción realmente requiere, no lo que se ve impresionante en un demo, sino lo que necesitas cuando flujos de trabajo reales y dinero real están en juego.
Necesitas sistemas que como mínimo sean:
- Observables: Rastrear cada decisión
- Gobernables: Hacer cumplir políticas
- Control de costos: Gasto predecible a escala
- Auditables: Satisfacer reguladores
- Mantenibles: No convertirse en pesadillas al escalar
Backbone Determinista
Define qué pasos se ejecutan, en qué orden, con qué guardrails. Flows son una capa de código muy delgada con casi ninguna abstracción, solo decoradores altamente flexibles, gestión de estado y otras primitivas esenciales.
- Control programático completo
- Misma entrada, misma ruta de ejecución
- Predecible por diseño
- Todo event-driven
- Modificable en tiempo de ejecución
- Maneja branching condicional, gestión de estado, lógica de negocio personalizada
Inteligencia Desplegada
Un espectro desde llamadas LLM ad-hoc hasta Crews completos con múltiples agentes colaborando. Se invocan intencionalmente por el Flow en pasos específicos.
- Baja agencia: una sola llamada LLM ad-hoc o un solo agente
- Alta agencia: un Crew completo con múltiples agentes colaborando
- Operan dentro de límites definidos por el Flow
- El control siempre regresa al backbone cuando terminan
- Adaptabilidad y razonamiento sin impredecibilidad
Estructura donde la necesitas, inteligencia donde importa.
Esta arquitectura es lo que empresas como DocuSign, KT, Konecta, el Departamento de Defensa de EE.UU., Ab Inbev y muchas más están usando en producción para entregar resultados de negocio a escala.
Construyendo Sistemas Agénticos
La arquitectura es simple, pero necesitas saber dónde dibujar las líneas.
Sin Inteligencia
Validación de datos, formateo, llamadas a API con parámetros conocidos
Solo código en tu Flow. No sobrecompliques con agentes.
Llamada LLM Simple
Una sola completación o llamada de función simple: 'resumir este documento', 'extraer estos campos', 'clasificar esta entrada'
Una sola llamada LLM es suficiente, no necesitas overhead de agencia.
Agente Único
Una tarea inteligente con uso de herramientas: 'investigar esta empresa y obtener datos financieros', 'verificar estas credenciales'
Un solo agente puede ser suficiente, puede razonar, usar herramientas y manejar la tarea.
Crew Multi-Agente
Razonamiento complejo, colaboración, o inteligencia multi-paso: 'realizar due diligence', 'investigar y escribir un reporte completo'
Múltiples agentes trabajando juntos, cada uno con roles definidos, delegando y validando el trabajo del otro, aprendiendo de sus propias ejecuciones.
Qué Se Rompe Cuando Obtienes la Arquitectura Incorrecta
Poner todo en agentes cuando parte debería ser código
No puedes depurarlo apropiadamente, los costos se disparan, el comportamiento es impredecible y cada cambio requiere 'probar el agente' en lugar de cambiar lógica.
Apretar demasiado en un agente
Las ventanas de contexto explotan, demasiadas herramientas lo confunden, y las alucinaciones aumentan.
Construir flujos complejos sin arquitectura
Cuando tienes procesos multi-paso con branching real y gestión de estado, encadenar agentes o llamadas LLM no es suficiente. Necesitas un backbone.
No probar diferentes modelos
Lo que funciona en un modelo falla en otro. Tu arquitectura debería permitirte intercambiar modelos sin reescribir tu sistema.
El Patrón Ganador:
Un backbone determinista dictando parte de la lógica central (Flow), luego ciertos pasos individuales aprovechando diferentes niveles de agentes: desde una llamada LLM ad-hoc, un agente único, hasta un Crew completo.
Cómo lo Construyó DocuSign
El Desafío
DocuSign—una empresa pública con miles de millones en ingresos cuya plataforma es usada por el 90% de las empresas Fortune 500—enfrentó una pregunta fundamental: ¿cómo personalizas el engagement del cliente a escala sin convertir a cada representante de ventas en un investigador de tiempo completo?
Los representantes de ventas no podían pasar horas investigando clientes, leyendo reportes de empresas, verificando últimas noticias y posicionando productos antes de poder redactar un email.
La Arquitectura
El Flow implementa el backbone determinista central y delega a un conjunto de agentes especializados trabajando juntos. Estos agentes pueden acceder a datos de Salesforce, Snowflake y aplicar reglas de negocio para decidir sobre calificación y ajustes.
- El Flow gestiona estado, branching y validación en todo momento
- Cada agente obtiene contexto de pasos anteriores
- El Researcher alimenta al Composer. El Composer alimenta al Validator
- El control central siempre regresa al Flow
- Guardrails de alucinación reaccionan en tiempo de ejecución a ciertas condiciones
Los Resultados
↑
Tasas de apertura de email aumentaron
↑
Tasas de respuesta aumentaron
↑
Tasas de conversión mejoraron
Lo que tomaba a los representantes horas, tomó al sistema minutos. DocuSign probó esto rigurosamente con AB testing. Mismos clientes, mismo período, algunos recibieron outreach generado por crew, algunos generado por representantes, y los agentes igualaron o superaron a los representantes humanos en métricas de engagement mientras reducían dramáticamente el tiempo de respuesta.
Por Qué Funciona
- Los agentes son reutilizables: DocuSign ahora usa la misma arquitectura de agentes para diferentes casos de uso en toda la organización.
- El Flow hace cumplir lógica de negocio: Los agentes no deciden si hacer estos pasos. Proporcionan inteligencia dentro de esos pasos.
- Cada agente opera dentro de límites claros: No son de libre circulación, sino inteligencia especializada invocada en pasos específicos.
Por Qué Esto Importa
Diferentes partes de tu sistema evolucionarán a diferentes ritmos:
Piezas Estables
Procesos bien entendidos con reglas claras. Pueden nunca necesitar mucha agencia. Manténlos simples, rápidos y baratos.
Partes Experimentales
Nuevos casos de uso, requisitos inciertos. Comienza con más agencia para explorar qué funciona, solidifica en Flows estructurados cuando surjan patrones.
Pasos Críticos de Cumplimiento
Requisitos regulatorios, trails de auditoría. La estructura permanece constante incluso cuando los modelos mejoran. No estás apostando el cumplimiento al comportamiento del modelo.
Volúmenes Sensibles al Costo
Aumenta la agencia cuando los costos caen, disminuye cuando aumentan. Misma arquitectura, diferentes configuraciones.
Costos Predecibles
Cuando controlas dónde vive la agencia, controlas el gasto. Aumenta para flujos de alto valor, disminuye para rutinarios.
Iteración Más Rápida
Sistemas mantenibles significan enviar nuevos casos de uso en semanas, no trimestres.
Riesgo Reducido
Sistemas observables y gobernables significan que puedes desplegar en industrias reguladas.
Ventaja Competitiva
Cuando tus sistemas se vuelven más inteligentes con cada ejecución, los competidores no pueden solo copiar tus prompts.
Conclusión: El Futuro Pertenece a los Backbones Fuertes
Las decisiones arquitectónicas de las que estamos hablando tienen impacto directo en el negocio. Los equipos que ganan a largo plazo no son los que persiguen las últimas capacidades del modelo o las características más llamativas del framework. Son los que construyen sistemas que aún pueden mantener, depurar y evolucionar rápidamente, mientras mantienen las cosas sanas dos años desde ahora.
Hay dos formas en que las empresas abordan los agentes:
Como Proyecto de Ingeniería
Evaluando primitivas, comparando herramientas de desarrollador, midiendo éxito por trazas y métricas.
Como Transformacional
Midiendo éxito por casos de uso en producción, resultados de negocio entregados, sistemas que funcionan a escala.
El futuro no pertenece a los equipos con los agentes más inteligentes. Pertenece a los equipos con los backbones más fuertes.
Recursos Adicionales
- CrewAI Signal Conference - Presentación de DocuSign
- Guías sobre arquitectura de sistemas agénticos
- Mejores prácticas para producción con agentes de IA