Skip to content

Latest commit

 

History

History
27 lines (18 loc) · 1.59 KB

File metadata and controls

27 lines (18 loc) · 1.59 KB

Nombre del Postwork: Correlaciones y Regresión Linear Simple

OBJETIVO

  • Realizar análisis bivariado con variables numéricas
  • Identificar valores atípicos y decidir qué hacer con ellos
  • Explorar las relaciones existentes entre nuestras variables numéricas
  • Entrenar modelos de regresión lineal para realizar predicciones

REQUISITOS

  • Tener un dataset que contenga variables numéricas

DESARROLLO

En este Postwork vamos a hacer análisis bivariado de nuestras variables numéricas. Si tu dataset sólo tiene variables categóricas o datos no estructurados (texto libre), entonces puedes pedirle a tu experta que te comparta algún dataset con el que puedas realizar estos ejercicios.

Utilizando tu dataset, realiza las siguientes actividades:

  1. Identifica cuáles son las variables numéricas en tu dataset.
  2. Asegúrate de que tengan el tipo de dato correcto y que no haya NaNs por ahí escondidos.
  3. Genera una matriz de correlaciones y un pairplot para visualizar de manera general las relaciones entre tus variables numéricas.
  4. Utilizando gráficas de dispersión y tus medidas de locación y dispersión, identifica dónde hay valores atípicos y decide qué hacer con ellos.
  5. Revisa si tu revisión de valores atípicos cambió de alguna manera las relaciones existentes.
  6. Donde consideres necesario, entrena modelos de Regresión Lineal con un o más pares de variables. Incluso si no te parece que realizar predicciones entre pares de variables tiene sentido para tu proyecto, prueba realizar un par de regresiones para que practiques el procedimiento.

¡Mucha suerte!