Programa del Curso
Arquitectura de Greenplum
- Procesamiento paralelo y multiprocesamiento simétrico
- Roles de segmentos y configuración del clúster
- Escala y movimiento de datos
- Arquitectura de Greenplum Data Warehouse
Estructuras de Tablas en Greenplum
- Tablas distribuidas vs. asignadas aleatoriamente
- Tablas heap vs. tablas solo de apendizaje
- Formatos de almacenamiento por fila vs. por columna
- Tablas particionadas y agrupadas
Distribución de Datos y Hashing
- Lógica de hashing y claves de distribución
- Gestionar sesgo y su impacto en el rendimiento
- Mapas hash y estrategias de ubicación de filas
Índices y Optimización del Rendimiento
- Índices agrupados vs. no agrupados
- Casos de uso de índices B-tree y bitmap
- Escanear índices y comportamiento de almacenamiento
Diseño Físico Database
- Normalización y diseño del modelo lógico
- Estrategias de acceso al usuario y análisis de distribución
- Demografía de datos e indicaciones de indexación
Técnicas de Denormalización
- Datos derivados, tablas resumidas y pre-joins
- Tablas columnar como particionamiento vertical
- Data marts y vistas materializadas
Avanzado SQL y Ejecución de Consultas
- Estrategias de unión y redistribución
- Funciones OLAP y de ventana
- Tablas temporales, subconsultas y tablas derivadas
Planificación EXPLAIN y Afinación de Consultas
- Lectura e interpretación de la salida EXPLAIN
- Análisis de costos y optimización del plan
- Movimiento de uniones y operaciones locales en segmentos
Herramientas y Mejores Prácticas de Greenplum
- ANALYZE y VACUUM
- Carga y movimiento de datos con Nexus
- Seguridad, permisos y consejos de rendimiento
Resumen y Próximos Pasos
Requerimientos
- Comprensión de bases de datos relacionales y SQL
- Experiencia con almacenes de datos o sistemas analíticos
- Familiaridad con operaciones de línea de comandos Linux
Público objetivo
- Arquitectos y ingenieros de datos
- Administradores y líderes técnicos de Database
- Desarrolladores BI y especialistas en análisis que trabajan con Greenplum
Testimonios (5)
los ejercicios y la resolucion de problemas
Mario Humberto Serrano Gutierrez - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
La teoria fue lo mas interesante
Luis Antonio Jimenez Gil - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
los ejercicios practicos y la disposicion para contestar las preguntas
Edith Vichua Solis - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
la explicacion, creo que uso terminos quee para todos fue demasiado entendible
Moises Jafet Hernandez Fuentes - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
the practices