In [13]:
from google.colab import drive
drive.mount('/content/drive')
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.preprocessing import StandardScaler
from sklearn.impute import SimpleImputer

file_path = '/content/drive/My Drive/ML/tabela_join.csv'
df = pd.read_csv(file_path)

# Definição de variáveis independentes (X) e variável dependente (y)
X = df[['latitude', 'longitude', 'numero_dias_sem_chuva', 'precipitacao', 'temperatura', 'umidade_ar', 'vento_velocidade']]
y = df['risco_fogo']

# Preenchimento dos valores NaN em X e y com mediana
imputer_X = SimpleImputer(strategy='median')
imputer_y = SimpleImputer(strategy='median')

X = pd.DataFrame(imputer_X.fit_transform(X), columns=X.columns)
y = pd.Series(imputer_y.fit_transform(y.values.reshape(-1, 1)).flatten())

# Divisão em treino e teste
X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, test_size=0.2, random_state=42)

# Normalização dos dados
scaler = StandardScaler()
X_treino = scaler.fit_transform(X_treino)
X_teste = scaler.transform(X_teste)

# Criação do modelo de Random Forest
modelo = RandomForestRegressor(n_estimators=100, random_state=42)

# Treino
modelo.fit(X_treino, y_treino)

# Previsões
y_previsto = modelo.predict(X_teste)

# Avaliação do modelo
mse = mean_squared_error(y_teste, y_previsto)
r2 = r2_score(y_teste, y_previsto)
print(f'MSE: {mse:.2f}')
print(f'R²: {r2:.2f}')

# Importância das variáveis
importancia = pd.DataFrame({'variavel': X.columns, 'importancia': modelo.feature_importances_})
print(importancia.sort_values('importancia', ascending=False))

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


  df = pd.read_csv(file_path)


MSE: 0.00
R²: 0.75
                variavel  importancia
2  numero_dias_sem_chuva     0.282696
1              longitude     0.264080
0               latitude     0.253298
3           precipitacao     0.168893
5             umidade_ar     0.030980
4            temperatura     0.000032
6       vento_velocidade     0.000022
