Temario del curso
Conceptos esenciales de la administración de Kafka
- Cómo se integra Kafka en una plataforma de datos moderna y las responsabilidades típicas en producción.
- Conceptos clave para operadores: brokers, temas (topics), particiones, desplazamientos (offsets) y grupos de consumidores.
- Fundamentos de la replicación: líderes y seguidores, réplicas en sincronización y compensaciones en la disponibilidad.
- Aspectos operativos destacados de Kafka y terminología común utilizada en los libros de ejecución (runbooks).
Modo KRaft y diseño del clúster
- Conceptos básicos de KRaft: controladores, cuórum de metadatos, elecciones y por qué es importante operativamente.
- Planificación del despliegue: dimensionamiento para el throughput, particiones, retención y crecimiento.
- Roles de los nodos y distribuciones: controladores combinados frente a dedicados, consideraciones de dominio de falla.
- Laboratorio: inspeccionar metadatos de KRaft, validar la salud del cuórum e interpretar los registros del controlador.
Instalación, configuración y operaciones diarias
- Enfoques de instalación (paquetes, archivos tarball, contenedores) y qué estandarizar en entornos empresariales.
- Configuración principal del broker que impacta la confiabilidad: listeners, replicación, directorios de registros y retención.
- Operaciones seguras del servicio: orden de inicio, apagado graceful y validaciones de verificación.
- Laboratorio: desplegar un clúster multi-nodo, verificar el registro del broker y confirmar la producción y consumo iniciales.
Gestión de temas (topics), particiones y colocación de datos
- Ciclo de vida de los temas usando la CLI de Kafka: crear, describir, actualizar configuraciones y eliminar.
- Elección de particiones y factores de replicación para cargas de trabajo reales, incluyendo antipatrones comunes.
- Reasignaciones y equilibrio: cuándo mover particiones y cómo verificar el progreso de forma segura.
- Laboratorio: crear temas, desencadenar una reasignación de particiones, simular una falla de broker y confirmar la recuperación.
Aseguramiento de Kafka para producción
- TLS para tráfico de clientes e inter-broker: certificados, cadenas de confianza y pasos de validación.
- Autenticación con SASL: selección de mecanismos comunes y evitar configuraciones incorrectas.
- Autorización con ACLs: patrones de privilegio mínimo para administradores, productores y consumidores.
- Laboratorio: habilitar TLS y SASL, validar la conectividad del cliente y aplicar ACLs para roles de aplicación.
Observabilidad, confiabilidad y resolución de problemas
- Elementos esenciales de monitoreo: salud del controlador, particiones con replicación insuficiente, latencia de solicitudes, saturación de disco y red.
- Registros y métricas: lectura de registros del broker y exposición de métricas a través del exportador JMX a pilas de observabilidad comunes.
- Manuales operativos (playbooks): reinicios graduales, cambios seguros de configuración y manejo de problemas de disco lleno e ISR.
- Laboratorio: construir un conjunto mínimo de alertas, diagnosticar un clúster degradado y restaurar la replicación saludable.
Actualizaciones y preparación para recuperación ante desastres
- Planificación de actualizaciones para Kafka: verificaciones de compatibilidad, etapas previas y enfoque de retroceso (rollback).
- Expectativas de copias de seguridad y recuperación: qué se puede respaldar, qué no, y conceptos básicos de recuperación de configuración.
- Descripción general de la replicación entre clústeres y cuándo usar MirrorMaker 2 para recuperación ante desastres (DR) y migraciones.
- Cierre: lista de verificación operativa, documentos de entrega y próximos pasos para el despliegue en producción.
Requerimientos
- Comprensión de la administración básica de Linux (usuarios, servicios, archivos y permisos).
- Experiencia con conceptos de red TCP/IP (DNS, puertos, firewalls y balanceadores de carga).
- Experiencia básica en scripting (Bash, PowerShell o similar) para tareas operativas rutinarias.
Público objetivo
- Administradores de Kafka e ingenieros de plataforma responsables de operar clústeres de Kafka.
- Ingenieros de confiabilidad del sitio (SRE) e ingenieros DevOps que apoyan plataformas de streaming.
- Equipos de infraestructura y operaciones que despliegan nuevos clústeres de Kafka basados en KRaft o migran desde ZooKeeper.
Testimonios (5)
Posibilidad de realizar ejercicios independientes en el entorno de formación.
Tomasz - PKO Zycie Towarzystwo Ubezpieczen S.A.
Curso - Kafka for Administrators
Traducción Automática
Concreto y a un ritmo adecuado (se requieren conocimientos básicos de bash)
Krzysztof - Agora SA
Curso - Kafka for Administrators
Traducción Automática
El formador acepta preguntas en cualquier momento de la sesión, incluso si el tema se trató hace unos días.
GOODLUCK MASHIMBA - Tanzania Revenue Authority
Curso - Kafka for Administrators
Traducción Automática
Buenas habilidades de presentación
Md Maruf Hossain - ATOS PGS sp. z o.o.
Curso - Kafka for Administrators
Traducción Automática
Excelentes habilidades, ejemplos muy buenos, ejercicios muy buenos
Marek Konieczny - G2A.COM Limited
Curso - Kafka for Administrators
Traducción Automática