Contacta con nosotros

Temario del curso

Introducción

  • Vista general de Databricks y Apache Spark.
  • Comprensión de la arquitectura de Databricks.

Primeros pasos

  • Configuración del entorno.
  • Configuración y personalización de Databricks.
  • Navegación por la interfaz de usuario de Databricks.
  • Creación de un espacio de trabajo de Databricks.

Trabajo con datos en Databricks

  • Conexión a una fuente de datos de Apache Spark.
  • Comprensión de los conceptos básicos sobre columnas y tipos de datos.
  • Gestión del sistema de archivos en los cuadernos (Notebooks).

Gestión de trabajos y clústeres

  • Creación y personalización de clústeres.
  • Creación de trabajos mediante cuadernos (Notebooks).
  • Ejecución de trabajos.
  • Visualización de trabajos y sus detalles.

Uso de Delta Lake en Databricks

  • Carga de datos en Delta Lake.
  • Gestión de los datos en Delta Lake.

Seguridad de Databricks

  • Gestión de la seguridad de Databricks.
  • Gestión de copias de seguridad y recuperación.

Solución de problemas

Resumen y próximos pasos

Requerimientos

  • Comprensión básica del análisis de datos.
  • Conocimientos sobre Apache Spark.

Público objetivo

  • Ingenieros de datos.
  • Científicos de datos.
  • Desarrolladores.
 14 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas