In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error

# Carregar os dados
file_path = 'gym_members_exercise_tracking.csv'
data = pd.read_csv(file_path)

# Limpar e preparar os dados
data_cleaned = data.copy()

# Convertendo variáveis categóricas em numéricas
data_cleaned['Gender'] = data_cleaned['Gender'].map({'Male': 1, 'Female': 0})
data_cleaned['Workout_Type'] = data_cleaned['Workout_Type'].astype('category').cat.codes

# Selecionando as features e o target
X = data_cleaned[['Age', 'Gender', 'Weight (kg)', 'Height (m)', 'Max_BPM', 'Avg_BPM', 'Resting_BPM',
                  'Session_Duration (hours)', 'Workout_Type', 'Experience_Level']]
y = data_cleaned['Calories_Burned']

# Dividindo os dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Treinando o modelo RandomForestRegressor
model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)

# Fazendo previsões
y_pred = model.predict(X_test)

# Avaliando o modelo
mae = mean_absolute_error(y_test, y_pred)

# Exibindo os resultados
print(f"Erro Médio Absoluto (MAE): {mae}")
print("Previsões (Primeiros 5 exemplos):")
for i in range(5):
    print(f"Previsão: {y_pred[i]:.2f}, Valor Real: {y_test.values[i]:.2f}")


Erro Médio Absoluto (MAE): 33.858051282051285
Previsões (Primeiros 5 exemplos):
Previsão: 913.41, Valor Real: 929.00
Previsão: 1447.38, Valor Real: 1401.00
Previsão: 898.53, Valor Real: 925.00
Previsão: 1091.66, Valor Real: 1155.00
Previsão: 1424.58, Valor Real: 1587.00
