# Modelo de machine learning para predecir cantidad de personal necesario (Regresion Polinomial)
En este documento se presenta un modelo de machine learning para predecir la cantidad de personal necesario en una empresa. El modelo se basa en una regresión polinomial y se implementa en Python.

In [1]:
# Librerias
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

from sklearn.linear_model import LinearRegression

In [2]:
# Cagar datos
df = pd.read_csv('personal_necesario.csv')

In [3]:
# Eliminar columnas que no se usaran
# Seleccionar las características relevantes
features = ['Suc_Id', 'Dia_Semana', 'Hora', 'Cantidad_Transacciones', 'Personal_Necesario']
df = df[features]

In [4]:
X = df[['Suc_Id', 'Dia_Semana', 'Hora', 'Cantidad_Transacciones']]
y = df['Personal_Necesario']
# cantidad de datos
print(X.shape)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

(118249, 4)


In [5]:


# Creación del modelo y entrenamiento
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Hacer predicciones
y_pred = model.predict(X_test)

# Evaluación del modelo
mse = mean_squared_error(y_test, y_pred)
print(f'Error cuadrático medio (MSE): {mse}')


Error cuadrático medio (MSE): 1.4498942917547564e-05


In [6]:
# Crear un DataFrame para comparar valores reales vs. predichos
df_result = X_test.copy()
df_result['Personal_Necesario_Real'] = y_test
df_result['Personal_Necesario_Predicho'] = y_pred
print(df_result.head())



       Suc_Id  Dia_Semana  Hora  Cantidad_Transacciones  \
72625     183           5    11                       8   
7623       20           5     8                       4   
96942     260           5    16                      13   
64150     162           3    11                       6   
64090     162           2    11                       4   

       Personal_Necesario_Real  Personal_Necesario_Predicho  
72625                      1.0                          1.0  
7623                       1.0                          1.0  
96942                      2.0                          2.0  
64150                      1.0                          1.0  
64090                      1.0                          1.0  


In [None]:
# Función para hacer predicciones con el modelo entrenado
def predecir_personal_necesario(model, datos_nuevos):
    """
    Realiza predicciones de la cantidad de personal necesario con el modelo entrenado.
    
    Args:
    - model: Modelo entrenado de RandomForestRegressor.
    - datos_nuevos (DataFrame o array-like): Datos de entrada con las mismas columnas que se usaron para el entrenamiento.

    Returns:
    - predicciones: Array con las predicciones de personal necesario.
    """
    predicciones = model.predict(datos_nuevos)
    return predicciones

datos_nuevos = [[79, 7, 15, 30]]  
predicciones = predecir_personal_necesario(model, datos_nuevos)
print("Predicción de personal necesario para los datos nuevos:", predicciones)

Predicción de personal necesario para los datos nuevos: [4.]


