Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Programa del Curso
Introducción a los modelos de lenguaje pequeño (SLM)
- Información general sobre los modelos de lenguaje
- Evolución de modelos lingüísticos grandes a pequeños
- Arquitectura y diseño de SLMs
- Ventajas y limitaciones de los SLM
Fundamentos Técnicos
- Comprensión de las redes neuronales y los parámetros
- Procesos de formación para MST
- Requisitos de datos y optimización de modelos
- Métricas de evaluación para modelos de lenguaje
SLMs en el Procesamiento del Lenguaje Natural
- Generación de texto con SLM
- Traducción y localización de idiomas
- Análisis de sentimiento y clasificación de texto
- Respuesta a preguntas y chatbots
Aplicaciones de SLM en el mundo real
- Aplicaciones móviles: procesamiento de lenguaje en el dispositivo
- Sistemas embebidos: SLMs en dispositivos IoT
- IA que preserva la privacidad: procesamiento local de datos
- Edge computing: SLM en entornos de baja latencia
Casos de estudio
- Análisis de implementaciones correctas de SLM
- Aplicaciones específicas de la industria (atención médica, Finance, etc.)
- Estudio comparativo: SLMs vs. grandes modelos en producción
Direcciones futuras
- Tendencias de la investigación en MST
- Desafíos en el escalado y la implementación
- Consideraciones éticas e IA responsable
- El camino a seguir: SLM de próxima generación
Talleres prácticos
- Creación de un SLM sencillo para la generación de texto
- Integración de SLM en aplicaciones móviles
- Ajuste fino de SLM para tareas específicas
- Análisis de rendimiento e interpretabilidad del modelo
Proyecto final
- Identificación de un espacio problemático para la aplicación de SLM
- Diseño e implementación de una solución de SLM
- Probar e iterar en el modelo
- Presentación del proyecto y resultados
Resumen y próximos pasos
Requerimientos
- Comprensión básica de los conceptos de aprendizaje automático
- Familiaridad con Python programación
- Conocimiento de redes neuronales y aprendizaje profundo
Audiencia
- Científicos de datos
- Desarrolladores de software
- Entusiastas de la IA
14 horas