Programa del Curso
Introducción a Apache Spark
- El papel de Spark en el procesamiento de big data
- Arquitectura de Spark y sus componentes
Configuración Apache Spark
- Requisitos de hardware y software
- Procedimientos de instalación para los modos autónomo y de clúster
- Prácticas recomendadas de configuración para administradores de sistemas
Administración de clústeres de Spark
- Herramientas y técnicas de gestión de clústeres
- Supervisión de aplicaciones de Spark y recursos de clúster
- Configuraciones de seguridad y gestión de usuarios
Ajuste y optimización del rendimiento
- Asignación y programación de recursos
- Tuning Spark para un rendimiento óptimo
- Identificación y resolución de cuellos de botella comunes
Solución de problemas y resolución de problemas
- Desafíos comunes de la administración de Spark
- Herramientas y técnicas de diagnóstico para la resolución de problemas
- Enfoque paso a paso para resolver problemas comunes
- Procedimientos recomendados para mantener un entorno de Spark saludable
Temas de Administración Avanzada
- Integración con otras herramientas de big data
- Garantizar la alta disponibilidad y la recuperación ante desastres
- Actualización y escalado de clústeres de Spark
Resumen y próximos pasos
Requerimientos
- Conocimientos básicos de configuración y gestión de redes
- Familiaridad con el sistema operativo Linux y la interfaz de línea de comandos
- Interés en aprender sobre sistemas de computación distribuida y gestión de big data
Audiencia
- Administradores de sistemas
Testimonios (9)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Un montón de ejemplos prácticos, diferentes formas de abordar un mismo problema, y a veces trucos no tan obvios de cómo mejorar la solución actual
Rafał - Nordea
Curso - Apache Spark MLlib
Traducción Automática
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Curso - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
La combinación de teoría y práctica con herramientas como databricks
Graciela Saud - Servicio de Impuestos Internos
Curso - Spark for Developers
Sufficient hands on, trainer is knowledgable
Chris Tan
Curso - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Curso - Big Data Analytics in Health
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Curso - Apache Spark in the Cloud
very interactive...
Richard Langford
Curso - SMACK Stack for Data Science
Compromiso y disposición para explicar temas secundarios.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Curso - Apache Spark Fundamentals
Traducción Automática