Contacta con nosotros

Temario del curso

Introducción a los ecosistemas de Big Data

  • Vista general de las tecnologías y arquitecturas de big data.
  • Procesamiento por lotes frente a procesamiento en tiempo real.
  • Estrategias de almacenamiento de datos para escalabilidad.

Procesamiento avanzado de datos con Apache Spark

  • Optimización de trabajos de Spark para rendimiento.
  • Transformaciones y acciones avanzadas.
  • Uso de transmisión estructurada (structured streaming).

Machine learning a escala

  • Técnicas de entrenamiento de modelos distribuidos.
  • Ajuste de hiperparámetros en grandes conjuntos de datos.
  • Despliegue de modelos en entornos de big data.

Aprendizaje profundo para Big Data

  • Integración de TensorFlow y PyTorch con Spark.
  • Pipelines de entrenamiento de aprendizaje profundo distribuido.
  • Casos de uso en análisis de imágenes, texto y series temporales.

Analítica en tiempo real y transmisión de datos

  • Apache Kafka para ingesta de datos en streaming.
  • Marcos de procesamiento de flujos (stream processing frameworks).
  • Monitoreo y alertas en sistemas en tiempo real.

Gobernanza, seguridad y ética de datos

  • Requisitos de privacidad y cumplimiento normativo.
  • Control de acceso y cifrado en sistemas de big data.
  • Consideraciones éticas en la analítica a gran escala.

Integración de Big Data con Inteligencia Empresarial (BI)

  • Visualización de datos y elaboración de paneles para big data.
  • Conexión de canales de big data con herramientas de BI.
  • Impulso de resultados empresariales mediante analítica avanzada.

Resumen y próximos pasos

Requerimientos

  • Sólida comprensión de conceptos de análisis de datos y modelado estadístico.
  • Experiencia con herramientas de procesamiento de datos y lenguajes de programación como Python, R o Scala.
  • Conocimiento de marcos de computación distribuida como Hadoop o Spark.

Público objetivo

  • Científicos de datos que buscan dominar el procesamiento de datos a gran escala y el análisis predictivo.
  • Analistas senior que desean diseñar e implementar flujos de trabajo analíticos avanzados.
  • Profesionales de I+D enfocados en soluciones innovadoras basadas en datos.
 42 Horas

Número de participantes


Precio por participante

Testimonios (2)

Próximos cursos

Categorías Relacionadas