Cursos de Spark para Desarrolladores

Algunos de nuestros clientes

Código del Curso

sparkdev

Duración

21 horas (usualmente 3 días, incluidas las pausas)

Requerimientos

Familiaridad con el lenguaje Java / Scala / Python (nuestros laboratorios en Scala y Python)
Entendimiento básico del entorno de desarrollo de Linux (navegación de línea de comandos / edición de archivos utilizando VI o nano)

Descripción General

OBJETIVO:

Este curso presentará Apache Spark . Los estudiantes aprenderán cómo Spark encaja en el ecosistema de Big Data y cómo usar Spark para el análisis de datos. El curso cubre el shell de Spark para análisis de datos interactivos, componentes internos de Spark, API de Spark, Spark SQL , transmisión de Spark y aprendizaje automático y graphX.

AUDIENCIA

Desarrolladores / Analistas de datos

Machine Translated

Programa del Curso

1. Scala primer

  • Una breve introducción a Scala
  • Laboratorios: Conocimiento Scala

2. Spark Basics

  • Antecedentes e historia
  • Spark y Hadoop
  • Spark conceptos y arquitectura
  • Spark sistema ecológico (núcleo, spark sql, mlib, streaming)
  • Labs: Instalación y funcionamiento de Spark

3. Primera mirada a la chispa

  • Ejecutar Spark en modo local
  • Interfaz web de Spark web
  • Cáscara de chispa
  • Análisis del conjunto de datos - parte 1
  • Inspección de RDDs
  • Labs: Exploratio de la cáscara de la chispa

4. RDDs

  • Conceptos de RDDs
  • Particiones
  • Operaciones / transformaciones RDD
  • Tipos de RDD
  • Par de valores clave y RDDs
  • MapReduce en RDD
  • Almacenamiento en caché y persistencia
  • Labs: creación e inspección de RDDs; Caching de RDDs

5. Programación de Spark API

  • Introducción al API Spark API / RDD
  • Enviar el primer programa a Spark
  • Depuración / registro
  • Propiedades de configuración
  • Labs: Programación en Spark API, Envío de trabajos
  • Google Translate for Business:Translator ToolkitWebsite Translator

6. Spark SQL

  • Soporte de SQL en Spark
  • Dataframes
  • Definición de tablas e importación de conjuntos de datos
  • Consultar marcos de datos con SQL
  • Formatos de almacenamiento: JSON / Parquet
  • Labs: Creación y consulta de marcos de datos; Evaluación de formatos de datos

7. MLlib

  • Introducción de MLlib
  • Algoritmos MLlib
  • Labs: Escritura de aplicaciones MLib

8. GraphX

  • Descripción de la biblioteca GraphX
  • API de GraphX
  • Labs: Procesamiento de datos de gráficos utilizando Spark

9. Spark Streaming

  • Descripción general de la transmisión
  • Evaluación de plataformas de transmisión
  • Operaciones de streaming
  • Operaciones de ventana deslizante
  • Labs: Escribir aplicaciones de chispa en streaming

10. Spark y Hadoop

  • Hadoop Intro (HDFS / YARN)
  • Arquitectura de Hadoop + Spark
  • Ejecutar Spark en Hadoop YARN
  • Procesamiento de archivos HDFS con Spark

11. Rendimiento y optimización de la chispa

  • Variables de difusión
  • Acumuladores
  • Gestión de memoria y caché

12. Operaciones de chispa

  • Implementación de Spark en producción
  • Ejemplos de plantillas de implementación
  • Configuraciones
  • Supervisión
  • Solución de problemas

Testimonios

★★★★★
★★★★★

Categorías Relacionadas

Promociones

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No transmitiremos ni venderemos su dirección a otras personas.
En cualquier momento puede cambiar sus preferencias o cancelar su suscripción por completo.

is growing fast!

We are looking to expand our presence in Chile!

As a Business Development Manager you will:

  • expand business in Chile
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!