Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Descripción general de las tecnologías de reconocimiento de voz
- Historia y evolución del reconocimiento de voz
- Modelos acústicos, modelos lingüísticos y decodificación
- Arquitecturas modernas: RNNs, transformers y Whisper
Bases de preprocesamiento de audio y transcripción
- Manejo de formatos de audio y tasas de muestreo
- Limpieza, recorte y segmentación del audio
- Generación de texto a partir de audio: en tiempo real vs por lotes
Práctica con Whisper y otras API
- Instalación y uso de OpenAI Whisper
- Llamadas a API en la nube (Google, Azure) para transcripción
- Comparación de rendimiento, latencia y costo
Idioma, acentos y adaptación por dominio
- Trabajo con múltiples idiomas y acentos
- Vocabularios personalizados y tolerancia al ruido
- Manejo de lenguaje legal, médico o técnico
Formateo de la salida e integración
- Agregado de marcas de tiempo, puntuación y etiquetas de hablante
- Exportación a formatos de texto, SRT o JSON
- Integración de transcripciones en aplicaciones o bases de datos
Laboratorios de implementación de casos de uso
- Transcripción de reuniones, entrevistas o podcasts
- Sistemas de comandos de voz a texto
- Leyendas en tiempo real para flujos de video/audio
Evaluación, limitaciones y ética
- Métricas de precisión y evaluación de modelos
- Sesgo e imparcialidad en los modelos de voz
- Consideraciones sobre privacidad y cumplimiento normativo
Resumen y próximos pasos
Requerimientos
- Comprensión de los conceptos generales de IA y aprendizaje automático
- Conocimiento de formatos y herramientas de archivos de audio o multimedia
Público objetivo
- Científicos de datos e ingenieros de IA que trabajan con datos de voz
- Desarrolladores de software que crean aplicaciones basadas en transcripción
- Organizaciones que exploran el reconocimiento de voz para automatización
14 Horas