Programa del Curso
Desglose de temas diarios: (Cada sesión es de 2 horas)
Día-1: Sesión -1: Visión general del negocio de por qué Big Data Business Intelligence en las telecomunicaciones.
- Estudios de casos de T-Mobile, Verizon, etc.
- Tasa de adaptación de Big Data en las empresas de telecomunicaciones de América del Norte y cómo están alineando su futuro modelo de negocio y operación en torno a Big Data BI
- Área de aplicación a gran escala
- Gestión de redes y servicios
- Abandono de clientes Management
- Integración de datos y visualización de cuadros de mando
- Gestión del fraude
- Generación de reglas de negocio
- Elaboración de perfiles de clientes
- Envío de anuncios localizados
Día-1: Sesión-2 : Introducción de Big Data-1
- Principales características del Big Data: volumen, variedad, velocidad y veracidad. Arquitectura MPP para el volumen.
- Almacenes de datos: esquema estático, conjunto de datos que evoluciona lentamente
- Bases de datos MPP como Greenplum, Exadata, Teradata, Netezza, Vertica, etc.
- Soluciones basadas en Hadoop: no hay condiciones en la estructura del conjunto de datos.
- Patrón típico: HDFS, MapReduce (crunch), recuperar de HDFS
- Por lotes: adecuado para análisis / no interactivo
- Volumen : Datos de transmisión de CEP
- Opciones típicas: productos CEP (por ejemplo, Infostreams, Apama, MarkLogic, etc.)
- Menos producción lista – Storm/S4
- Bases de datos NoSQL (en columnas y clave-valor): Más adecuadas como complemento analítico para el almacén de datos/base de datos
Día-1 : Sesión -3 : Introducción a Big Data-2
NoSQL soluciones
- KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
- Tienda KV - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
- Almacén KV (Jerárquico) - GT.m, Caché
- Tienda KV (Ordenada) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
- KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua
- Tienda de tuplas - Gigaspaces, Coord, Apache River
- Base de datos de objetos: ZopeDB, DB40, Shoal
- Almacén de documentos: CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
- Amplio almacén en columnas: BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI
Variedades de datos: Introducción al tema Data Cleaning en Big Data
- RDBMS: estructura/esquema estático, no promueve un entorno ágil y exploratorio.
- NoSQL – semiestructurado, estructura suficiente para almacenar datos sin un esquema exacto antes de almacenar datos
- Problemas de limpieza de datos
Día-1 : Sesión-4 : Introducción a Big Data-3 : Hadoop
- ¿Cuándo seleccionar Hadoop?
- ESTRUCTURADO: los almacenes/bases de datos empresariales pueden almacenar datos masivos (a un costo) pero imponer una estructura (no es bueno para la exploración activa)
- Datos ESTRUCTURADOS SEMI: difíciles de hacer con las soluciones tradicionales (DW/DB)
- Datos de almacenamiento = ENORME esfuerzo y estática incluso después de la implementación
- Para variedad y volumen de datos, procesados en hardware básico – HADOOP
- Commodity H/W necesario para crear un Hadoop clúster
Introducción a Map Reduce /HDFS
- MapReduce: distribuya la informática en varios servidores
- HDFS: hacer que los datos estén disponibles localmente para el proceso informático (con redundancia)
- Datos: pueden ser no estructurados o sin esquema (a diferencia de RDBMS)
- Responsabilidad del desarrollador para dar sentido a los datos
- Programming MapReduce = trabajar con Java (pros/contras), carga manual de datos en HDFS
Día 2: Sesión 1.1: Spark : Base de datos distribuida en memoria
- ¿Qué es el procesamiento "en memoria"?
- Chispa SQL
- Spark SDK
- Spark API
- RDD
- Liberación de chispas
- Hanna
- Cómo migrar un sistema Hadoop existente a Spark
Día-2 Sesión -1.2: Tormenta -Procesamiento en tiempo real en Big Data
- Arroyos
- Brotes
- Pernos
- Topologías
Día-2: Sesión-2: Sistema Big Data Management
- Piezas móviles, nodos de cómputo de inicio/fallo: ZooKeeper: para servicios de configuración/coordinación/nomenclatura
- Canalización/flujo de trabajo complejo: Oozie: gestiona el flujo de trabajo, las dependencias y la conexión en cadena
- Implementar, configurar, administrar clústeres, actualizar, etc. (administrador de sistemas): Ambari
- En la nube : Whirr
- Evolución Big Data de las herramientas de la plataforma para el seguimiento
- Problemas de aplicación de la capa ETL
Día-2: Sesión-3: Analítica predictiva en Business Intelligence -1: Técnicas fundamentales y BI basado en aprendizaje automático:
- Introducción al aprendizaje automático
- Aprendizaje de técnicas de clasificación
- Archivo de entrenamiento de preparación de predicción bayesiana
- Campo aleatorio de Markov
- Aprendizaje supervisado y no supervisado
- Extracción de características
- Máquina de vectores de soporte
- Red neuronal
- Aprendizaje por refuerzo
- Big Data Problema de variable grande -Bosque aleatorio (RF)
- Aprendizaje de la representación
- Aprendizaje profundo
- Big Data Problema de automatización: RF de conjunto multimodelo
- Automatización a través de Soft10-M
- LDA y modelado de temas
- Aprendizaje ágil
- Aprendizaje basado en agentes: ejemplo de operación de telecomunicaciones
- Aprendizaje distribuido: ejemplo de funcionamiento de la empresa de telecomunicaciones
- Introducción a las herramientas de código abierto para el análisis predictivo : R, Rapidminer, Mahut
- Laboratorio de análisis de Hama, Spark y CMU Graph más escalable
Día-2: Sesión-4 Ecosistema de analítica predictiva-2: Problemas comunes de analítica predictiva en Telecom
- Analítica de información
- Analítica de visualización
- Análisis predictivo estructurado
- Analítica predictiva no estructurada
- Elaboración de perfiles de clientes
- Motor de recomendaciones
- Detección de patrones
- Descubrimiento de reglas/escenarios: fallo, fraude, optimización
- Descubrimiento de la causa raíz
- Análisis de sentimiento
- Analítica de CRM
- Análisis de redes
- Análisis de texto
- Revisión asistida por tecnología
- Análisis de fraude
- Analítica en tiempo real
Día-3 : Sesión-1 : Análisis de la operación de la red: análisis de la causa raíz de las fallas de la red, interrupción del servicio a partir de metadatos, IPDR y CRM:
- Uso de CPU
- Uso de memoria
- Uso de la cola de QoS
- Temperatura del dispositivo
- Error de interfaz
- Versiones de IoS
- Eventos de enrutamiento
- Variaciones de latencia
- Análisis de Syslog
- Pérdida de paquetes
- Simulación de carga
- Inferencia de topología
- Umbral de rendimiento
- Trampas de dispositivos
- Recopilación y procesamiento de IPDR (registro detallado de IP)
- Uso de datos IPDR para el consumo de ancho de banda del suscriptor, la utilización de la interfaz de red, el estado del módem y el diagnóstico
- Información sobre HFC
Día-3: Sesión-2: Herramientas para el análisis de fallos del servicio de red:
- Panel de resumen de red: supervise las implementaciones generales de la red y realice un seguimiento de los indicadores clave de rendimiento de su organización
- Panel de análisis de período pico: comprenda las tendencias de la aplicación y los suscriptores que impulsan la utilización máxima, con granularidad específica de la ubicación
- Panel de eficiencia de enrutamiento: controle los costos de la red y cree casos de negocio para proyectos de capital con una comprensión completa de las relaciones de interconexión y tránsito
- Panel de entretenimiento en tiempo real: acceda a las métricas que importan, incluidas las visualizaciones de vídeo, la duración y la calidad de la experiencia de vídeo (QoE)
- Panel de control de transición a IPv6: investigue la adopción continua de IPv6 en su red y obtenga información sobre las aplicaciones y los dispositivos que impulsan las tendencias
- Caso práctico 1: El minero de datos Big Network Analytics (BNA) de Alcatel-Lucent
- Inteligencia móvil multidimensional (m.IQ6)
Día-3 : Sesión 3: Big Data BI para Marketing/Ventas –Comprensión de las ventas/marketing a partir de los datos de ventas: (Todos ellos se mostrarán con una demostración analítica predictiva en vivo)
- Para identificar los clientes de mayor velocidad
- Identificar clientes para un determinado producto
- Identificar el conjunto correcto de productos para un cliente (motor de recomendación)
- Técnica de segmentación de mercado
- Técnica de venta cruzada y venta adicional
- Técnica de segmentación de clientes
- Técnica de previsión de ingresos por ventas
Día-3: Sesión 4: BI necesario para la oficina del CFO de telecomunicaciones:
- Descripción general de Business Trabajos de análisis necesarios en una oficina de CFO
- Análisis de riesgos en nuevas inversiones
- Previsión de ingresos y beneficios
- Previsión de adquisición de nuevos clientes
- Previsión de pérdidas
- Análisis de fraude en las finanzas ( detalles próxima sesión )
Día-4 : Sesión-1: BI de prevención de fraude desde Big Data en Telco-Fraud analytic:
- Fuga de ancho de banda / Fraude de ancho de banda
- Fraude de proveedores/cobro excesivo por proyectos
- Fraudes de reembolsos/reclamaciones de clientes
- Fraudes en el reembolso de viajes
Día-4 : Sesión-2: De la predicción de la pérdida de clientes a la prevención de la pérdida de clientes:
- 3 tipos de abandono: activo/deliberado, rotativo/incidental, pasivo involuntario
- 3 Clasificación de clientes abandonados: Total, Oculto, Parcial
- Descripción de las variables de CRM para la pérdida de clientes
- Recopilación de datos sobre el comportamiento del cliente
- Recopilación de datos de percepción del cliente
- Recopilación de datos demográficos de los clientes
- Limpieza de datos de CRM
- Datos no estructurados de CRM (llamadas de clientes, tickets, correos electrónicos) y su conversión en datos estructurados para el análisis de Churn
- Social Media CRM: nueva forma de extraer el índice de satisfacción del cliente
- Estudio de caso-1 : T-Mobile USA: Reducción de la pérdida de clientes en un 50%
Día-4 : Sesión-3: Cómo utilizar el análisis predictivo para el análisis de la causa raíz de la insatisfacción del cliente:
- Estudio de caso -1 : Vinculación de la insatisfacción con los problemas - Contabilidad, Fallas de ingeniería como interrupción del servicio, servicio de ancho de banda deficiente
- Estudio de caso 2: Big Data Panel de control de calidad para realizar un seguimiento del índice de satisfacción del cliente a partir de varios parámetros, como escalamientos de llamadas, criticidad de problemas, eventos pendientes de interrupción del servicio, etc.
Día-4: Sesión-4: Big Data Panel de control para un rápido acceso a diversos datos y visualización:
- Integración de la plataforma de aplicaciones existente con Big Data Dashboard
- Gestión de Big Data
- Estudio de caso de Big Data Dashboard: Tableau y Pentaho
- Utilice la aplicación Big Data para impulsar la publicidad basada en la ubicación
- Sistema de seguimiento y gestión
Día-5 : Sesión-1: Cómo justificar Big Data la implementación de BI dentro de una organización:
- Definición del ROI para la implementación Big Data
- Casos prácticos para ahorrar tiempo a los analistas en la recopilación y preparación de datos: aumento de la productividad
- Casos prácticos de aumento de ingresos por abandono de clientes
- Aumento de ingresos de anuncios basados en la ubicación y otros anuncios dirigidos
- Un enfoque de hoja de cálculo integrado para calcular aprox. gastos frente a ganancias/ahorros de ingresos de Big Data implementación.
Día-5 : Sesión-2: Procedimiento paso a paso para reemplazar el sistema de datos heredado a Big Data Sistema:
- Comprensión práctica Big Data de la hoja de ruta de la migración
- ¿Cuál es la información importante que se necesita antes de diseñar una implementación Big Data
- ¿Cuáles son las diferentes formas de calcular el volumen, la velocidad, la variedad y la veracidad de los datos?
- Cómo estimar el crecimiento de los datos
- Casos de estudio en 2 Telco
Día-5: Sesión 3 y 4: Revisión de Big Data Proveedores y revisión de sus productos. Sesión de preguntas y respuestas:
- AccentureAlcatel-Lucent
- Amazonas –A9
- APTEAN (anteriormente software de los CDC)
- Sistemas Cisco
- Cloudera
- Dell
- EMC
- Corporación GoodData
- Guavus
- Sistemas de datos de Hitachi
- Hortonworks
- Huawei
- HP
- IBM
- Informatica
- Intel
- Jaspersoft
- Microsoft
- MongoDB (anteriormente 10Gen)
- MU Sigma
- Netapp
- Soluciones de Opera
- Oráculo
- Pentaho
- Platfora
- Qliktech
- Cuanto
- Espacio en rack
- Análisis de Revolution
- Ventas de ventas
- SAVIA
- Instituto SAS
- Sisense
- Software AG/Terracotta
- Automatización de Soft10
- Splunk
- Sqrrl
- Supermicro
- Tableau Software
- Teradata
- Piensa en grande en analítica
- Sistemas de señalización de mareas
- VMware (Parte de EMC)
Requerimientos
- Debe tener conocimientos básicos de funcionamiento empresarial y sistemas de datos en Telecom en su dominio
- Debe tener conocimientos básicos de SQL/Oracle o bases de datos relacionales
- Conocimientos básicos de Estadística (en niveles de Excel)
Testimonios (3)
Todos los ejemplos utilizados y el estilo de enseñanza estaban perfectamente adaptados, incluso para un principiante como yo. Fui capaz de entender todo y la formación fue muy paciente, siempre dispuesta a ir el extra milla cuando se necesitaba ayuda.
Mathipa Chepape - Vodacom
Curso - Big Data Business Intelligence for Telecom and Communication Service Providers
Traducción Automática
Todos los ejemplos utilizados y el estilo de enseñanza estaban muy bien, incluso para un principiante como yo. Fui capaz de entender y la formación fue muy paciente, siempre dispuesta a ir el extra milla cuando se necesitaba ayuda.
Mathipa Chepape - Vodacom
Curso - Big Data Business Intelligence for Telecom and Communication Service Providers
Traducción Automática
Comprender mejor los datos masivos
Shaune Dennis - Vodacom
Curso - Big Data Business Intelligence for Telecom and Communication Service Providers
Traducción Automática