Programa del Curso

Principios de la computación distribuida

  • Apache Spark
  • Hadoop

Principios de serialización de datos

  • Cómo se pasa el objeto de datos por la red
  • Serialización de objetos
  • Enfoques de serialización
    • Ahorro
    • Buffers de protocolo
    • Apache Avro
      • estructura de datos
      • tamaño, velocidad, características de formato
      • almacenamiento persistente de datos
      • integración con lenguajes dinámicos
      • tipeo dinámico
      • esquemas
        • datos sin etiquetar
        • gestión del cambio

Serialización de datos y computación distribuida

  • Avro como un subproyecto de Hadoop
    • Serialización de Java
    • Serialización Hadoop
    • Serialización Avro

Usando Avro con

  • Colmena (AvroSerDe)
  • Cerdo (AvroStorage)

Portar marcos de RPC existentes

Requerimientos

Una familiaridad general con la informática distribuida

  14 horas
 

Número de participantes


Comienza

Termina


Dates are subject to availability and take place between 09:30 and 16:30.
Los cursos de formación abiertos requieren más de 5 participantes.

Testimonios (3)

Cursos Relacionados

Categorías Relacionadas