Skip to content

albertotb/curso-ml-python

Repository files navigation

Introducción al Machine Learning con Python

Requisitos

  • Instalación de Anaconda3. Como mínimo son necesarias las librerías:

    • numpy
    • pandas
    • matplotlib
    • seaborn
    • scikit-learn
  • Conocimientos de Python 3.9+

Temario

1. Introducción a Python para Data Science (aprox. 1h)

  1. Entorno de trabajo
  2. Repaso conceptos básicos
  3. Estructuras de datos: listas, tuplas y diccionarios

2. EDA con Pandas (aprox. 7 horas)

  1. Estructuras de datos: DataFrame y Series
  2. Importar datos
  3. Filtrado de filas y columnas
  4. Estadísticas descriptivas
  5. Operaciones agrupadas
  6. Visualización

3. Machine Learning práctico con scikit-learn (aprox. 10 horas)

  1. Introducción al Machine Learning [presentación]
  2. Introducción a scikit-learn
  3. Conjuntos de datos
  4. Preproceso
  5. Modelos lineales de regresión: Ridge, Lasso, Elastic Net.
  6. Modelos lineales de clasificación: regresión logística
  7. K-Vecinos próximos
  8. Árboles de decisión
  9. Ensembles: bagging y boosting
    • Random Forest
    • Gradient Boosting
  10. Métricas para evaluar modelos
  11. Introducción a modelos no supervisados: K-means

4.Introducción a transformers (aprox. 2 horas)

  1. Clasificación de texto
  2. Clasificación de texto zero-shot

5. Despliegue de modelos (aprox. 3 horas)

  1. Combinación de modelos
  2. Persistencia de modelos
  3. Gestión de ciclo vida de modelos:
    • Despliegue de modelos con FastAPI y Docker [repositorio]
    • Registro y análisis de parámetros y métricas
    • Caso práctico guiado: Kaggle

Referencias

General

Transformers