# Proyecto de Día 11 - Análisis Predictivo para una Tienda Minorista

### Objetivo
Tu tarea consiste en desarrollar un **modelo predictivo** para una **tienda minorista** que desea pronosticar las ventas basándose en diversas características. La tienda ha estado recopilando datos sobre las ventas diarias y quiere utilizar esta información para tomar decisiones informadas sobre la *gestión de inventario*, *promociones* y *programación de personal*.

Tu objetivo es construir un modelo que pueda **predecir el total de ventas para el próximo mes**, utilizando datos de los meses anteriores.

### Tarea
**1. Preparación de Datos**
- Carga el conjunto de datos y realiza cualquier preprocesamiento necesario, como manejar **valores faltantes**, selección de **variables dependientes e independientes**, y dividir los datos en **conjuntos de entrenamiento** y **prueba**.


**2. Análisis Exploratorio de Datos (EDA)**
- Realiza un EDA para entender la distribución de las ventas y la relación entre las ventas y otras características. Esto podría incluir trazar las ventas a lo largo del tiempo, analizar las ventas en *festivos* vs. *no festivos* y el impacto de las promociones.

**3. Selección de Modelo**
- Utiliza el conocimiento que has adquirido sobre diferentes algoritmos para elegir el modelo más adecuado para esta tarea. Considera la **Regresión Lineal**, los **Árboles de Decisión**, y los **Bosques Aleatorios**.

**4. Entrenamiento y Evaluación del Modelo**
- Entrena tu modelo seleccionado en el conjunto de entrenamiento y evalúa su rendimiento utilizando el conjunto de prueba. Utiliza gráficos para visualizar las *ventas reales* vs. *las predichas*.

**5. Conclusión**

- Basado en los resultados iniciales, resume tus hallazgos y realiza recomendaciones para la tienda minorista sobre cómo utilizar el análisis predictivo para una mejor toma de decisiones.


### Nota
* Enfócate en la claridad y simplicidad de tu código.

¡Mucha Suerte!

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor

# =============================================================
# 1.
# =============================================================
sells_csv_url = "./Ventas.csv"
sells_df = pd.read_csv(sells_csv_url)
sells_df.head()

sells_df["Fecha"] = pd.to_datetime(sells_df["Fecha"])

# normalize data
sells_scaler = MinMaxScaler(feature_range=(0, 1))
sells_columns_to_scale = sells_df.drop(["Ventas", "Fecha"], axis=1).columns
print(sells_columns_to_scale)
colums_scaled = sells_scaler.fit_transform(sells_df[sells_columns_to_scale])
df_normalize = pd.DataFrame(data=colums_scaled, columns=sells_columns_to_scale)
df_normalize["Ventas"] = sells_df["Ventas"]
df_normalize["Fecha"] = sells_df["Fecha"]

# divide to train and test
X = df_normalize.drop(["Ventas", "Fecha"], axis=1)
Y = df_normalize["Ventas"]
x_train, x_test, y_train, y_test = train_test_split(X, Y, train_size=0.8, random_state=42)

Index(['DíaDeLaSemana', 'Promociones', 'Festivo'], dtype='object')


Unnamed: 0,DíaDeLaSemana,Promociones,Festivo,Ventas,Fecha
0,0.833333,0.0,0.0,4033,2022-01-01
1,1.0,0.0,1.0,4012,2022-01-02
2,0.0,0.0,0.0,1608,2022-01-03
3,0.166667,1.0,0.0,2046,2022-01-04
4,0.333333,0.0,0.0,2484,2022-01-05
