In [None]:
import pandas as pd # Biblioteca para manipulação de dados.
import matplotlib.pyplot as plt # Bibliotecas para visualização de dados.
import seaborn as sns # Bibliotecas para visualização de dados.
from xgboost import XGBRegressor # Classe do XGBoost para tarefas de regressão.
from sklearn.model_selection import train_test_split, cross_val_score # Função para realizar validação cruzada.
from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_error  # Erros
import numpy as np # Biblioteca para operações matemáticas adicionais.


# Carrega o dataset do caminho especificado usando pandas.
dataset_path = '/content/Jubarte_Line20_1_concat.csv'
data = pd.read_csv(dataset_path)


data = data[['AmpMod','PhaseMod', 'Vert.Res']]

X = data[['AmpMod','PhaseMod']]  # Features -  (AmpMod e PhaseMod).
y = data['Vert.Res']                  # Target - (Freq).

# Divisão em conjuntos de treino (80%) e teste (20%), # shuffle=True embaralha os dados antes de dividir.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=10, shuffle=True) #shuffle=True

model = XGBRegressor(random_state=13) # Inicializa o modelo de regressão do XGBoost.

# Treina o modelo XGBRegressor com os dados de treino.
model.fit(X_train, y_train)

In [None]:
y_pred = model.predict(X_test)

fig, ax = plt.subplots(1,2 , figsize=(15, 8))

ax[0].plot(y_test.values[:100], label='Real')
ax[0].plot(y_pred[:100], label='Predito')
ax[0].set_xlabel('Amostras')
ax[0].set_ylabel('Frequência')

ax[1].hist(y_test.values, label='Real')
ax[1].hist(y_pred, label='Predito', fill=False)
ax[1].set_xlabel('Amostras')
ax[1].set_ylabel('Frequência')
plt.legend()

In [None]:
# Calcula o erro quadrático médio (MSE) das previsões.
mse = mean_squared_error(y_test, y_pred)
print(f"Mean Squared Error: {mse}")

# Calcula o erro quadrático médio (RMSE) das previsões.
rmse = np.sqrt(mse)
print(f"Root Mean Squared Error: {rmse}")

# Calcular métricas
mse = mean_squared_error(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
rmse = np.sqrt(mse)

print(f"Mean Squared Error (MSE): {mse}")
print(f"Mean Absolute Error (MAE): {mae}")
print(f"R-squared (R²): {r2}")
print(f"Root Mean Squared Error (RMSE): {rmse}")

In [None]:
# codigo 2.1 - MinMaxScaler - XGBRegressor

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
from xgboost import XGBRegressor
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score, median_absolute_error, explained_variance_score, roc_curve
from sklearn.preprocessing import MinMaxScaler, RobustScaler, StandardScaler, QuantileTransformer, PowerTransformer, MaxAbsScaler, OneHotEncoder

# Carregar o dataset
dataset_path = '/content/Jubarte_SEx_Ex_Ez_EW01_2002_Poly_AIH_30_1V_40_0_MCD.csv'


#data = pd.read_csv(dataset_path)
data = pd.read_csv(dataset_path)
data = data[['AmpMod','PhaseMod', 'Vert.Res', 'SourceElev']]

names = data.dtypes[~(data.dtypes == 'object')].index.values #filtra colunas com valures textuais
#data = data[names]

y = data['Vert.Res']                 # Target

#X = MinMaxScaler().fit_transform(data.drop(columns=['Freq']))  # Features
X = MinMaxScaler().fit_transform(data.drop(columns=['SourceElev']))  # Features

# Divisão em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=13, shuffle=True)

# Criação do modelo
model_st = XGBRegressor(random_state=42, n_estimators=1000)

# Treinamento do modelo
model_st.fit(X_train, y_train)

In [None]:
y_pred = model_st.predict(X_test)

fig, ax = plt.subplots(1,2 , figsize=(15, 8))

ax[0].plot(y_test.values[:100], label='Real')
ax[0].plot(y_pred[:100], label='Predito', marker='x', alpha=.5)
ax[0].set_xlabel('Amostras')
ax[0].set_ylabel('Frequência')

ax[1].hist(y_test.values, label='Real')
ax[1].hist(y_pred, label='Predito', fill=False)
ax[1].set_xlabel('Amostras')
ax[1].set_ylabel('Frequência')
plt.legend()

In [None]:
# Calcula o erro quadrático médio (MSE) das previsões.
mse = mean_squared_error(y_test, y_pred)
print(f"Mean Squared Error: {mse}")

# Calcula o erro quadrático médio (RMSE) das previsões.
rmse = np.sqrt(mse)
print(f"Root Mean Squared Error: {rmse}")

# Calcular métricas
mse = mean_squared_error(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
rmse = np.sqrt(mse)

print(f"Mean Squared Error (MSE): {mse}")
print(f"Mean Absolute Error (MAE): {mae}")
print(f"R-squared (R²): {r2}")
print(f"Root Mean Squared Error (RMSE): {rmse}")