Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción
- Vista general de Databricks y Apache Spark.
- Comprensión de la arquitectura de Databricks.
Primeros pasos
- Configuración del entorno.
- Configuración y personalización de Databricks.
- Navegación por la interfaz de usuario de Databricks.
- Creación de un espacio de trabajo de Databricks.
Trabajo con datos en Databricks
- Conexión a una fuente de datos de Apache Spark.
- Comprensión de los conceptos básicos sobre columnas y tipos de datos.
- Gestión del sistema de archivos en los cuadernos (Notebooks).
Gestión de trabajos y clústeres
- Creación y personalización de clústeres.
- Creación de trabajos mediante cuadernos (Notebooks).
- Ejecución de trabajos.
- Visualización de trabajos y sus detalles.
Uso de Delta Lake en Databricks
- Carga de datos en Delta Lake.
- Gestión de los datos en Delta Lake.
Seguridad de Databricks
- Gestión de la seguridad de Databricks.
- Gestión de copias de seguridad y recuperación.
Solución de problemas
Resumen y próximos pasos
Requerimientos
- Comprensión básica del análisis de datos.
- Conocimientos sobre Apache Spark.
Público objetivo
- Ingenieros de datos.
- Científicos de datos.
- Desarrolladores.
14 Horas
Testimonios (1)
Todos los temas que abarca, aunque muchos fueron muy rápidos, nos da una idea de lo que necesitaremos ahondar. Además me gustó que pudimos hacer practicas, aunque insisto, creo que el curso amerita mas.