Programa del Curso

Introducción

  • Visión general de Databricks y Apache Spark
  • Comprensión de la arquitectura de Databricks

Comenzando

  • Configuración del entorno
  • Configuración e instalación de Databricks
  • Navegación en la interfaz de usuario de Databricks
  • Creación de un espacio de trabajo de Databricks

Trabajando con datos en Databricks

  • Conexión a una fuente de datos de Apache Spark
  • Comprensión de las columnas y tipos de datos básicos
  • Gestión del sistema de archivos en Notebooks

Gestión de trabajos y clústeres

  • Creación y configuración de clústeres
  • Creación de trabajos usando Notebooks
  • Ejecución de trabajos
  • Visualización de trabajos y detalles de los trabajos

Uso de Delta Lake en Databricks

  • Carga de datos en Delta Lake
  • Gestión de datos en Delta Lake

Seguridad en Databricks

  • Gestión de la seguridad de Databricks
  • Gestión de copias de seguridad y recuperación

Solución de problemas

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de análisis de datos
  • Conocimiento de Apache Spark

Audiencia

  • Ingenieros de Datos
  • Científicos de Datos
  • Desarrolladores
 14 Horas

Número de participantes


Precio por Participante​

Testimonios (1)

Próximos cursos

Categorías Relacionadas