In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor

# 1️⃣ Cargar el dataset
df = pd.read_excel("PrediccionSalarios.xlsx")

# 2️⃣ Limpiar nombres de columnas (por si tienen espacios)
df.columns = df.columns.str.strip()
df.columns = df.columns.str.replace(" ", "_")  # Evita problemas con espacios

# 3️⃣ Verificar los nombres correctos de columnas
print("Nombres de columnas:", df.columns.tolist())

# 4️⃣ Definir variables correctas según las columnas reales
variables_numericas = ['Age', 'Apps', 'Caps']  # Columnas numéricas
variables_categoricas = ['Club', 'League', 'Nation', 'Position']  # Variables categóricas
variable_objetivo = 'Wage'  # Salario como variable objetivo

# 5️⃣ Verificar que todas las columnas existan antes de usarlas
for col in variables_numericas + variables_categoricas + [variable_objetivo]:
    if col not in df.columns:
        raise KeyError(f"❌ La columna '{col}' no existe en el dataset. Revisa los nombres.")

# 6️⃣ Convertir variables categóricas en números
df = pd.get_dummies(df, columns=variables_categoricas, drop_first=True)

# 7️⃣ Separar características (X) y variable objetivo (y)
X = df.drop(columns=[variable_objetivo])
y = df[variable_objetivo]

# 8️⃣ Dividir en datos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 9️⃣ Entrenar el modelo
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# 🔟 Función para predecir salario de un nuevo jugador
def predecir_salario(nuevo_jugador):
    df_nuevo = pd.DataFrame([nuevo_jugador])
    df_nuevo = pd.get_dummies(df_nuevo, columns=variables_categoricas, drop_first=True)

    # Asegurar que tenga las mismas columnas que el modelo
    for col in X_train.columns:
        if col not in df_nuevo:
            df_nuevo[col] = 0

    df_nuevo = df_nuevo[X_train.columns]
    return model.predict(df_nuevo)[0]

# 🔥 Prueba de predicción
nuevo_jugador = {
    'Age': 25,
    'Apps': 30,
    'Caps': 5,
    'Club': 'Real Madrid',
    'League': 'La Liga',
    'Nation': 'Argentina',
    'Position': 'Forward'
}

salario_predicho = predecir_salario(nuevo_jugador)
print(f"💰 Salario Predicho: {salario_predicho}")


Nombres de columnas: ['Wage', 'Age', 'Club', 'League', 'Nation', 'Position', 'Apps', 'Caps']
💰 Salario Predicho: 527735.0


  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
  df_nuevo[col] = 0
