Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Introducción
- ¿Qué son Large Language Models (LLMs)?
- LLMs vs modelos tradicionales de NLP
- Descripción general de las características y la arquitectura de los LLM
- Desafíos y limitaciones de los LLM
Comprensión de los LLM
- El ciclo de vida de un LLM
- Cómo funcionan los LLM
- Los componentes principales de un LLM: codificador, decodificador, atención, incrustaciones, etcétera.
Empezar
- Configuración del entorno de desarrollo
- Instalar un LLM como herramienta de desarrollo, por ejemplo, Google Colab, Hugging Face
Trabajar con LLM
- Explorando las opciones de LLM disponibles
- Creación y uso de un LLM
- Ajuste de un LLM en un conjunto de datos personalizado
Resumen de texto
- Comprender la tarea del resumen de textos y sus aplicaciones
- Uso de un LLM para el resumen de textos extractivos y abstractos
- Evaluar la calidad de los resúmenes generados utilizando métricas como ROUGE, BLEU, etcétera.
Respuesta a preguntas
- Comprender la tarea de responder preguntas y sus aplicaciones
- Uso de un LLM para responder preguntas de dominio abierto y dominio cerrado
- Evaluar la precisión de las respuestas generadas utilizando métricas como F1, EM, etcétera.
Generación de texto
- Comprender la tarea de la generación de texto y sus aplicaciones
- Uso de un LLM para la generación de texto condicional e incondicional
- Controlar el estilo, el tono y el contenido de los textos generados mediante parámetros como temperatura, top-k, top-p, etcétera.
Integración de LLM con otros marcos y plataformas
- Uso de LLM con PyTorch o TensorFlow
- Uso de LLM con Flask o Streamlit
- Uso de LLM con Google Cloud o AWS
Solución de problemas
- Descripción de los errores y fallos comunes en los LLM
- Uso de TensorBoard para monitorear y visualizar el proceso de capacitación
- Uso de PyTorch Lightning para simplificar el código de entrenamiento y mejorar el rendimiento
- Uso de Hugging Face conjuntos de datos para cargar y preprocesar los datos
Resumen y próximos pasos
Requerimientos
- Comprensión del procesamiento del lenguaje natural y el aprendizaje profundo
- Experiencia con Python y PyTorch o TensorFlow
- Experiencia básica en programación
Audiencia
- Desarrolladores
- Entusiastas de la PNL
- Científicos de datos
14 Horas