<a href="https://colab.research.google.com/github/Jenga04/AB17/blob/main/Colab_AB17.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Cargar datos y preparar el entorno

In [None]:
# Importar las librerías necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.preprocessing import StandardScaler

# Simulación de un conjunto de datos para demanda de productos
np.random.seed(42)

# Simulamos datos de ventas, tráfico, clima y tiempo de entrega
data = {
    'fecha': pd.date_range(start='2023-01-01', periods=100, freq='D'),
    'temperatura_Cº': np.random.randint(15, 31, 100),  # Temperatura entre 15 y 30 grados
    'tráfico': np.random.choice(['bajo', 'medio', 'alto'], 100),  # Tráfico con 3 categorías
    'tiempo_entrega': np.random.randint(30, 120, 100),  # Tiempo de entrega entre 30 y 120 minutos
    'distancia_km': np.random.randint(5, 100, 100),  # Distancia entre 5 y 100 km
    'numero_paradas': np.random.randint(1, 10, 100),  # Número de paradas entre 1 y 10
    'productos_solicitados': np.random.randint(10, 200, 100),  # Productos solicitados entre 10 y 200
    'demanda_prevista': np.random.randint(50, 300, 100)  # Demanda prevista entre 50 y 300 unidades
}

# Convertir tráfico a números: bajo = 0, medio = 1, alto = 2
traffic_map = {'bajo': 0, 'medio': 1, 'alto': 2}
data['tráfico'] = [traffic_map[t] for t in data['tráfico']]

# Convertir el diccionario en un DataFrame
df = pd.DataFrame(data)

# Mostrar las primeras filas del DataFrame
df.head()


Unnamed: 0,fecha,temperatura_Cº,tráfico,tiempo_entrega,distancia_km,numero_paradas,productos_solicitados,demanda_prevista
0,2023-01-01,21,2,57,36,8,170,264
1,2023-01-02,18,1,57,13,1,198,270
2,2023-01-03,27,1,73,23,9,188,284
3,2023-01-04,29,1,113,52,6,180,124
4,2023-01-05,25,1,59,84,7,110,195


Preparación de datos

In [None]:
# Seleccionar características y variable objetivo
X = df[['temperatura_Cº', 'tráfico', 'tiempo_entrega', 'distancia_km', 'numero_paradas', 'productos_solicitados']]
y = df['demanda_prevista']

# Dividir en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalar las características
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)


Entrenamiento del modelo

In [None]:
# Crear el modelo de regresión lineal
model = LinearRegression()

# Entrenar el modelo
model.fit(X_train_scaled, y_train)

# Realizar las predicciones
y_pred = model.predict(X_test_scaled)

# Redondear las predicciones a enteros
y_pred_int = np.round(y_pred).astype(int)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred_int)
rmse = np.sqrt(mse)
r2 = r2_score(y_test, y_pred_int)
r2_rounded = round(r2, 3)


# Mostrar los resultados

print(f"Mean Squared Error: {mse}")
print(f"R-squared: {r2_rounded}")


Mean Squared Error: 3938.0
R-squared: -0.102


Guardar los resultados en un csv

In [None]:
# Extraer las fechas correctas del conjunto de prueba
df_test = df.iloc[X_test.index]

# Crear el DataFrame con las predicciones
results_df = pd.DataFrame({
    'Fecha': df_test['fecha'],  # Fechas del conjunto de prueba
    'Demanda Real': y_test,
    'Demanda Predicha': y_pred_int,  # Demanda predicha con valores enteros
    'Temperatura (ºC)': df_test['temperatura_Cº'],
    'Tráfico': df_test['tráfico'],
    'Tiempo de Entrega': df_test['tiempo_entrega'],
    'Distancia (km)': df_test['distancia_km'],
    'Número de Paradas': df_test['numero_paradas'],
    'Productos Solicitados': df_test['productos_solicitados']
})

# Guardar el archivo CSV con las predicciones
results_df.to_csv('/content/predicciones_demanda.csv', index=False)

# Mostrar las primeras filas del archivo CSV
results_df.head()



Unnamed: 0,Fecha,Demanda Real,Demanda Predicha,Temperatura (ºC),Tráfico,Tiempo de Entrega,Distancia (km),Número de Paradas,Productos Solicitados
83,2023-03-25,222,182,22,2,40,22,4,34
53,2023-02-23,244,178,26,2,104,32,5,32
70,2023-03-12,141,156,16,2,65,41,9,156
45,2023-02-15,231,187,26,1,82,42,1,161
44,2023-02-14,157,198,26,0,31,34,3,105


Descargar csv

In [None]:
from google.colab import files

# Descargar el archivo CSV generado
files.download('/content/predicciones_demanda.csv')


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>