In [44]:
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsRegressor
from sklearn.preprocessing import StandardScaler

# Criando um dataset fictício
data = {
    "Idade": [22, 25, 30, 35, 40, 45, 50, 55, 60, 65],
    "Altura (cm)": [175, 180, 170, 160, 165, 158, 162, 170, 175, 168],
    "Peso (kg)": [70, 80, 68, 60, 65, 58, 62, 72, 75, 68],
    "Salário (€)": [25000, 30000, 32000, 40000, 50000, 52000, 55000, 60000, 65000, 70000],
}

df = pd.DataFrame(data)

# Variável independente (X) e dependente (y)
X = df[["Idade", "Altura (cm)", "Peso (kg)"]]
y = df["Salário (€)"]

df


Unnamed: 0,Idade,Altura (cm),Peso (kg),Salário (€)
0,22,175,70,25000
1,25,180,80,30000
2,30,170,68,32000
3,35,160,60,40000
4,40,165,65,50000
5,45,158,58,52000
6,50,162,62,55000
7,55,170,72,60000
8,60,175,75,65000
9,65,168,68,70000


In [45]:
# Escalando os dados para melhorar o desempenho do KNN
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

X_scaled

array([[-1.47253588,  0.9899076 ,  0.33882261],
       [-1.25912488,  1.72864461,  1.87892537],
       [-0.90343989,  0.25117058,  0.03080206],
       [-0.54775489, -1.22630344, -1.20128015],
       [-0.1920699 , -0.48756643, -0.43122877],
       [ 0.1636151 , -1.52179824, -1.5093007 ],
       [ 0.51930009, -0.93080864, -0.8932596 ],
       [ 0.87498509,  0.25117058,  0.64684316],
       [ 1.23067009,  0.9899076 ,  1.10887399],
       [ 1.58635508, -0.04432422,  0.03080206]])

In [46]:
# Criando e treinando o modelo KNN
knn_regressor = KNeighborsRegressor(n_neighbors=3)
knn_regressor.fit(X_scaled, y)

0,1,2
,n_neighbors,3
,weights,'uniform'
,algorithm,'auto'
,leaf_size,30
,p,2
,metric,'minkowski'
,metric_params,
,n_jobs,


In [47]:
# Definindo um novo jogador fictício para prever seu salário
jogador_desconhecido = {"Idade": 28, "Altura (cm)": 178, "Peso (kg)": 74}
jogador_df = pd.DataFrame([jogador_desconhecido])

# Transformando os dados do jogador desconhecido
jogador_scaled = scaler.transform(jogador_df)
jogador_scaled

array([[-1.04571389,  1.4331498 ,  0.95486371]])

In [48]:
# Fazendo a previsão
salario_predito = knn_regressor.predict(jogador_scaled)

print("Dados do jogador desconhecido:")
print(jogador_df)
print(f"Salário predito (€): {salario_predito[0]:.2f}")

Dados do jogador desconhecido:
   Idade  Altura (cm)  Peso (kg)
0     28          178         74
Salário predito (€): 29000.00


# Markdown das coisas tiradas

Além disso, temos que levar em conta que cada posição valoriza certos tipos de atributos mais do que outros. Um goleiro fazer gols não é muito comum, e durante a execução do modelo isso pode influenciar muito, o que não era pra acontecer. Teremos que aplicar certos pesos baseado na coluna de "position encoded", o que será essencial para uma predição mais precisa.

Lista de parâmetros que irão valer mais para cada PosiçãoEncoded:

1 - Goleiro:
 - Gols Concedidos (quanto menor, melhor)
 - "Clean Sheets"
 - Altura

2 - Defensor:
 - Cartão Amarelo (quanto menor, melhor)
 - 2o Cartão Amarelo (quanto menor, melhor)
 - Cartão Vermelho (quanto menor, melhor)
 - Altura

3 - Meio Campista:
 - Assistências
 - Cartão Vermelho (quanto menor, melhor)

4 - Atacante:
 - Gols
 - Assistências