Contacta con nosotros

Temario del curso

Fundamentos de los sistemas agentivos en producción

  • Arquitecturas agentivas: bucles, herramientas, memoria y capas de orquestación
  • Ciclo de vida de los agentes: desarrollo, despliegue y operación continua
  • Desafíos de la gestión de agentes a escala de producción

Modelos de infraestructura y despliegue

  • Despliegue de agentes en entornos contenedorizados y en la nube
  • Patrones de escalado: escalado horizontal frente a vertical, concurrencia y limitación de velocidad (throttling)
  • Orquestación multi-agente y equilibrio de cargas de trabajo

Monitoreo y observabilidad

  • Métricas clave: latencia, tasa de éxito, uso de memoria y profundidad de llamadas del agente
  • Seguimiento de la actividad del agente y gráficos de llamadas
  • Instrumentación de observabilidad utilizando Prometheus, OpenTelemetry y Grafana

Registro de eventos, auditoría y cumplimiento

  • Registro centralizado de eventos y recolección estructurada de datos
  • Cumplimiento y capacidad de auditoría en flujos de trabajo agentivos
  • Diseño de rastro de auditoría y mecanismos de reproducción para la depuración

Ajuste de rendimiento y optimización de recursos

  • Reducción de la sobrecarga de inferencia y optimización de los ciclos de orquestación del agente
  • Caché de modelos y embeddings ligeros para una recuperación más rápida
  • Pruebas de carga y escenarios de estrés para pipelines de IA

Control de costos y gobernanza

  • Comprensión de los impulsores de costos del agente: llamadas a la API, memoria, capacidad de cómputo e integraciones externas
  • Seguimiento de los costos por nivel de agente e implementación de modelos de asignación de costos
  • Políticas de automatización para prevenir la dispersión de agentes y el consumo de recursos inactivos

CI/CD y estrategias de despliegue para agentes

  • Integración de pipelines agentivos en sistemas CI/CD
  • Estrategias de prueba, versionado y reversión para actualizaciones iterativas de agentes
  • Despliegues progresivos y mecanismos seguros de lanzamiento

Recuperación ante fallos e ingeniería de confiabilidad

  • Diseño para tolerancia a fallos y degradación graceful
  • Patrones de reintento, tiempo de espera y circuito abierto (circuit breaker) para la confiabilidad del agente
  • Respuesta ante incidentes y marcos de análisis posterior al incidente para operaciones de IA

Proyecto final

  • Construir y desplegar un sistema de IA agentiva con monitoreo completo y seguimiento de costos
  • Simular carga, medir el rendimiento y optimizar el uso de recursos
  • Presentar la arquitectura final y el panel de monitoreo a los compañeros

Resumen y próximos pasos

Requerimientos

  • Sólida comprensión de MLOps y sistemas de aprendizaje automático en producción
  • Experiencia con despliegues en contenedores (Docker/Kubernetes)
  • Familiaridad con herramientas de optimización de costos en la nube y observabilidad

Audiencia

  • Ingenieros MLOps
  • Ingenieros de Confiabilidad del Sitio (SREs)
  • Gerentes de ingeniería que supervisán la infraestructura de IA
 21 Horas

Número de participantes


Precio por participante

Testimonios (3)

Próximos cursos

Categorías Relacionadas