Contacta con nosotros

Temario del curso

Conceptos esenciales de la administración de Kafka

  • Cómo se integra Kafka en una plataforma de datos moderna y las responsabilidades típicas en producción.
  • Conceptos clave para operadores: brokers, temas (topics), particiones, desplazamientos (offsets) y grupos de consumidores.
  • Fundamentos de la replicación: líderes y seguidores, réplicas en sincronización y compensaciones en la disponibilidad.
  • Aspectos operativos destacados de Kafka y terminología común utilizada en los libros de ejecución (runbooks).

Modo KRaft y diseño del clúster

  • Conceptos básicos de KRaft: controladores, cuórum de metadatos, elecciones y por qué es importante operativamente.
  • Planificación del despliegue: dimensionamiento para el throughput, particiones, retención y crecimiento.
  • Roles de los nodos y distribuciones: controladores combinados frente a dedicados, consideraciones de dominio de falla.
  • Laboratorio: inspeccionar metadatos de KRaft, validar la salud del cuórum e interpretar los registros del controlador.

Instalación, configuración y operaciones diarias

  • Enfoques de instalación (paquetes, archivos tarball, contenedores) y qué estandarizar en entornos empresariales.
  • Configuración principal del broker que impacta la confiabilidad: listeners, replicación, directorios de registros y retención.
  • Operaciones seguras del servicio: orden de inicio, apagado graceful y validaciones de verificación.
  • Laboratorio: desplegar un clúster multi-nodo, verificar el registro del broker y confirmar la producción y consumo iniciales.

Gestión de temas (topics), particiones y colocación de datos

  • Ciclo de vida de los temas usando la CLI de Kafka: crear, describir, actualizar configuraciones y eliminar.
  • Elección de particiones y factores de replicación para cargas de trabajo reales, incluyendo antipatrones comunes.
  • Reasignaciones y equilibrio: cuándo mover particiones y cómo verificar el progreso de forma segura.
  • Laboratorio: crear temas, desencadenar una reasignación de particiones, simular una falla de broker y confirmar la recuperación.

Aseguramiento de Kafka para producción

  • TLS para tráfico de clientes e inter-broker: certificados, cadenas de confianza y pasos de validación.
  • Autenticación con SASL: selección de mecanismos comunes y evitar configuraciones incorrectas.
  • Autorización con ACLs: patrones de privilegio mínimo para administradores, productores y consumidores.
  • Laboratorio: habilitar TLS y SASL, validar la conectividad del cliente y aplicar ACLs para roles de aplicación.

Observabilidad, confiabilidad y resolución de problemas

  • Elementos esenciales de monitoreo: salud del controlador, particiones con replicación insuficiente, latencia de solicitudes, saturación de disco y red.
  • Registros y métricas: lectura de registros del broker y exposición de métricas a través del exportador JMX a pilas de observabilidad comunes.
  • Manuales operativos (playbooks): reinicios graduales, cambios seguros de configuración y manejo de problemas de disco lleno e ISR.
  • Laboratorio: construir un conjunto mínimo de alertas, diagnosticar un clúster degradado y restaurar la replicación saludable.

Actualizaciones y preparación para recuperación ante desastres

  • Planificación de actualizaciones para Kafka: verificaciones de compatibilidad, etapas previas y enfoque de retroceso (rollback).
  • Expectativas de copias de seguridad y recuperación: qué se puede respaldar, qué no, y conceptos básicos de recuperación de configuración.
  • Descripción general de la replicación entre clústeres y cuándo usar MirrorMaker 2 para recuperación ante desastres (DR) y migraciones.
  • Cierre: lista de verificación operativa, documentos de entrega y próximos pasos para el despliegue en producción.

Requerimientos

  • Comprensión de la administración básica de Linux (usuarios, servicios, archivos y permisos).
  • Experiencia con conceptos de red TCP/IP (DNS, puertos, firewalls y balanceadores de carga).
  • Experiencia básica en scripting (Bash, PowerShell o similar) para tareas operativas rutinarias.

Público objetivo

  • Administradores de Kafka e ingenieros de plataforma responsables de operar clústeres de Kafka.
  • Ingenieros de confiabilidad del sitio (SRE) e ingenieros DevOps que apoyan plataformas de streaming.
  • Equipos de infraestructura y operaciones que despliegan nuevos clústeres de Kafka basados en KRaft o migran desde ZooKeeper.
 21 Horas

Número de participantes


Precio por participante

Testimonios (5)

Próximos cursos

Categorías Relacionadas