Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Cimientos de la Clasificación Auditiva
- Tipos de eventos sonoros: ambientales, mecánicos, generados por humanos
- Resumen de casos de uso: vigilancia, monitoreo, automatización
- Clasificación auditiva vs detección vs segmentación
Datos Auditivos y Extracción de Características
- Tipos de archivos de audio y formatos
- Tasa de muestreo, ventaneo, consideraciones del tamaño de marco
- Extracción de MFCCs, características cromáticas, mel-espectrogramas
Preparación y Anotación de Datos
- UrbanSound8K, ESC-50 y conjuntos de datos personalizados
- Anotación de eventos sonoros y límites temporales
- Balancado de conjuntos de datos y aumentación del audio
Construcción de Modelos de Clasificación Auditiva
- Uso de redes neuronales convolucionales (CNNs) para audio
- Entrada del modelo: onda sonora cruda vs características
- Funciones de pérdida, métricas de evaluación y sobreajuste
Detección de Eventos y Localización Temporal
- Estrategias de detección basadas en marcos y segmentos
- Post-procesamiento de detecciones usando umbrales y suavizado
- Visualización de predicciones sobre líneas temporales del audio
Tópicos Avanzados y Procesamiento en Tiempo Real
- Aprendizaje por transferencia para escenarios con pocos datos
- Implementación de modelos con TensorFlow Lite o ONNX
- Procesamiento de audio en streaming y consideraciones sobre latencia
Desarrollo del Proyecto y Escenarios de Aplicación
- Diseño de un pipeline completo: desde ingesta hasta clasificación
- Desarrollo de una prueba de concepto para vigilancia, control de calidad o monitoreo
- Registro, alertas e integración con paneles o APIs
Resumen y Próximos Pasos
Requerimientos
- Comprender los conceptos de aprendizaje automático y el entrenamiento de modelos
- Experiencia en programación con Python y preprocesamiento de datos
- Familiaridad con los fundamentos del audio digital
Audience
- Científicos de datos
- Ingenieros de aprendizaje automático
- Investigadores y desarrolladores en procesamiento de señales de audio
21 Horas