Programa del Curso
- Introducción
- Hadoop Historia, Conceptos
- Ecosistema
- Distribuciones
- Arquitectura de alto nivel
- Hadoop Mitos
- Hadoop Desafíos (hardware / software)
- Labs: discuta sus proyectos y problemas de Big Data
- Operaciones de HDFS
- Conceptos (escalado horizontal, replicación, localidad de datos, reconocimiento de rack)
- Nodos y daemons (NameNode, Secondary NameNode, HA Standby NameNode, DataNode)
- Supervisión de la salud
- Administración basada en explorador y línea de comandos
- Adición de almacenamiento, sustitución de unidades defectuosas
- Labs: familiarizarse con las líneas de comandos de HDFS
- Operaciones y administración de MapReduce
- Computación paralela antes de mapreduce: comparación de la administración de HPC con Hadoop
- Cargas de clúster de MapReduce
- Nodos y demonios (JobTracker, TaskTracker)
- Tutorial de la interfaz de usuario de MapReduce
- Configuración de Mapreduce
- Configuración del trabajo
- Optimización de MapReduce
- RM infalible: qué decirle a tus programadores
- Labs: ejecución de ejemplos de MapReduce
- Temas avanzados
- Monitoreo de hardware
- Supervisión de clústeres
- Adición y eliminación de servidores, actualización Hadoop
- Planificación de copias de seguridad, recuperación y continuidad del negocio
- Flujos de trabajo de Oozie
- Hadoop alta disponibilidad (HA)
- Hadoop Federación
- Protección del clúster con Kerberos
- Laboratorios: configurar la supervisión
Requerimientos
- Cómodo con la administración básica del sistema Linux
- Habilidades básicas de scripting
No se requieren conocimientos de Hadoop y Computación Distribuida, pero se introducirán y explicarán en el curso.
Entorno de laboratorio
Instalación cero: ¡No es necesario instalar el software hadoop en las máquinas de los estudiantes! Se proporcionará a los estudiantes un clúster de hadoop en funcionamiento.
Los estudiantes necesitarán lo siguiente
- un cliente SSH (Linux y Mac ya tienen clientes ssh, para Windows se recomienda Utty )
- Un explorador para acceder al clúster. Recomendamos el navegador Firefox con la extensión FoxyProxy instalada
Testimonios (4)
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Curso - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Curso - Administrator Training for Apache Hadoop
practical things of doing, also theory was served good by Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curso - Hadoop Administration on MapR
Muy poco, se me dificulto mucho y mas por que entre desfasado, no tome los primeras sesiones.