Contacta con nosotros

Temario del curso

Introducción a AIOps con herramientas de código abierto

  • Panorama general de los conceptos y beneficios de AIOps
  • Prometheus y Grafana en el stack de observabilidad
  • El lugar del aprendizaje automático en AIOps: análisis predictivo vs. reactivo

Configuración de Prometheus y Grafana

  • Instalación y configuración de Prometheus para la recopilación de series temporales
  • Creación de dashboards en Grafana utilizando métricas en tiempo real
  • Exploración de exporters, reetiquetado (relabeling) y descubrimiento de servicios

Preprocesamiento de datos para aprendizaje automático

  • Extracción y transformación de métricas de Prometheus
  • Preparación de conjuntos de datos para detección de anomalías y predicción
  • Uso de las transformaciones de Grafana o pipelines de Python

Aplicación del aprendizaje automático para la detección de anomalías

  • Modelos básicos de ML para detección de valores atípicos (por ejemplo, Isolation Forest, One-Class SVM)
  • Entrenamiento y evaluación de modelos en datos de series temporales
  • Visualización de anomalías en dashboards de Grafana

Predicción de métricas con aprendizaje automático

  • Construcción de modelos simples de predicción (introducción a ARIMA, Prophet y LSTM)
  • Predicción de la carga del sistema o el uso de recursos
  • Uso de predicciones para alertas tempranas y decisiones de escalado

Integración de ML con alertas y automatización

  • Definición de reglas de alerta basadas en la salida de ML o umbrales
  • Uso de Alertmanager y enrutamiento de notificaciones
  • Activación de scripts o flujos de trabajo de automatización al detectar anomalías

Escalado y operacionalización de AIOps

  • Integración de herramientas externas de observabilidad (por ejemplo, ELK stack, Moogsoft, Dynatrace)
  • Puesta en producción de modelos de ML en pipelines de observabilidad
  • Mejores prácticas para AIOps a gran escala

Resumen y próximos pasos

Requerimientos

  • Comprensión de los conceptos de monitoreo de sistemas y observabilidad
  • Experiencia utilizando Grafana o Prometheus
  • Familiaridad con Python y principios básicos de aprendizaje automático

Público objetivo

  • Ingenieros de observabilidad
  • Equipos de infraestructura y DevOps
  • Arquitectos de plataformas de monitoreo e ingenieros de fiabilidad del sitio (SRE)
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas