Temario del curso
Fundamentos de los sistemas agentivos en producción
- Arquitecturas agentivas: bucles, herramientas, memoria y capas de orquestación
- Ciclo de vida de los agentes: desarrollo, despliegue y operación continua
- Desafíos de la gestión de agentes a escala de producción
Modelos de infraestructura y despliegue
- Despliegue de agentes en entornos contenedorizados y en la nube
- Patrones de escalado: escalado horizontal frente a vertical, concurrencia y limitación de velocidad (throttling)
- Orquestación multi-agente y equilibrio de cargas de trabajo
Monitoreo y observabilidad
- Métricas clave: latencia, tasa de éxito, uso de memoria y profundidad de llamadas del agente
- Seguimiento de la actividad del agente y gráficos de llamadas
- Instrumentación de observabilidad utilizando Prometheus, OpenTelemetry y Grafana
Registro de eventos, auditoría y cumplimiento
- Registro centralizado de eventos y recolección estructurada de datos
- Cumplimiento y capacidad de auditoría en flujos de trabajo agentivos
- Diseño de rastro de auditoría y mecanismos de reproducción para la depuración
Ajuste de rendimiento y optimización de recursos
- Reducción de la sobrecarga de inferencia y optimización de los ciclos de orquestación del agente
- Caché de modelos y embeddings ligeros para una recuperación más rápida
- Pruebas de carga y escenarios de estrés para pipelines de IA
Control de costos y gobernanza
- Comprensión de los impulsores de costos del agente: llamadas a la API, memoria, capacidad de cómputo e integraciones externas
- Seguimiento de los costos por nivel de agente e implementación de modelos de asignación de costos
- Políticas de automatización para prevenir la dispersión de agentes y el consumo de recursos inactivos
CI/CD y estrategias de despliegue para agentes
- Integración de pipelines agentivos en sistemas CI/CD
- Estrategias de prueba, versionado y reversión para actualizaciones iterativas de agentes
- Despliegues progresivos y mecanismos seguros de lanzamiento
Recuperación ante fallos e ingeniería de confiabilidad
- Diseño para tolerancia a fallos y degradación graceful
- Patrones de reintento, tiempo de espera y circuito abierto (circuit breaker) para la confiabilidad del agente
- Respuesta ante incidentes y marcos de análisis posterior al incidente para operaciones de IA
Proyecto final
- Construir y desplegar un sistema de IA agentiva con monitoreo completo y seguimiento de costos
- Simular carga, medir el rendimiento y optimizar el uso de recursos
- Presentar la arquitectura final y el panel de monitoreo a los compañeros
Resumen y próximos pasos
Requerimientos
- Sólida comprensión de MLOps y sistemas de aprendizaje automático en producción
- Experiencia con despliegues en contenedores (Docker/Kubernetes)
- Familiaridad con herramientas de optimización de costos en la nube y observabilidad
Audiencia
- Ingenieros MLOps
- Ingenieros de Confiabilidad del Sitio (SREs)
- Gerentes de ingeniería que supervisán la infraestructura de IA
Testimonios (3)
El instructor es paciente y muy útil. Conoce bien el tema.
CLIFFORD TABARES - Universal Leaf Philippines, Inc.
Curso - Agentic AI for Business Automation: Use Cases & Integration
Traducción Automática
Buena mezcla de conocimiento y práctica
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Agentic AI for Enterprise Applications
Traducción Automática
La mezcla de teoría y práctica, así como de perspectivas de alto y bajo nivel
Ion Mironescu - Facultatea S.A.I.A.P.M.
Curso - Autonomous Decision-Making with Agentic AI
Traducción Automática