Repositorio construido para almacenar los recursos compartidos por Factored durante el training octubre 2021 (#DataChallenge365FEM 2020-2021).
Darte una gu铆a de como ser铆a un desarrollo b谩sico de un modelo de machine learning.
Desde IMPORTAR y ANALIZAR datos; DESARROLLAR y EVALUAR MODELOS predictivos; HASTA realizar el DEPLOYMENT DE una API usando FastAPI
y Docker
.
- Link del gitbook del training
- Link del video del training
- Link de la data del training "New York City Taxi Trip Duration"
- Comandos basicos de Docker
Recurso :
Temario:
Gr谩ficas y Storytelling 馃挰
Flujo de trabajo colaborativo en GitHub 馃惐馃悪
- Crear un repositorio
- C贸mo crear una rama
- Hacer y registrar cambios
- C贸mo crear un Pull Request
Importaci贸n y Manejo de datos con pandas.
- Carga de datasets desde un `bucket de S3 (AWS)`
- Procesamiento con pandas
Visualizar datos con `matplotlib` y `seaborn`.馃 馃攳
- Diferentes tipos de gr谩ficos.
- C贸mo manejar formatos de gr谩ficas con axes y figures.
Recurso :
Temario:
Flujos de preprocesamiento en `scikit-learn`:
- C贸mo escribir transformaciones personalizadas.
- C贸mo aplicar transformaciones de datos a ciertas variables con `ColumnTransformer`.
- C贸mo usar `Pipeline` y `FeatureUnion` para unir diferentes transformaciones.
MLflow con modelos de scikit-learn:
- C贸mo usar la API de scikit-learn para entrenar modelos.
- C贸mo usar `MLflow` para guardar experimentos con modelos de scikit-learn.
Recurso :
Temario:
Escribir una `API` de un modelo usando `FastAPI`.
- Generaci贸n de endpoints.
- Correr aplicaci贸n localmente y probar con datos de entrada.
Construir un contenedor de Docker para desplegar API.
- C贸mo escribir un `Dockerfile`.
- C贸mo crear y correr `Docker containers`.