# Global Solution - FIAP - 1º Semestre de 2025

Desenvolvido por:

Grupo LLM:

- Gabriel Marques de Lima Sousa - RM 554889 - 2TDSPW
- Leonardo Matheus Teixeira - RM 556629 - 2TDSPW
- Leonardo Menezes Parpinelli Ribas - RM 557908 - 2TDSPW

## Análise de Dados e Modelo de Classificação

Este notebook contém a análise de dados e o modelo de classificação para o problema proposto. O objetivo é prever a probabilidade de um evento climático extremo ocorrer com base em dados históricos.

### Hipótese

A hipótese é que eventos climáticos extremos podem ser previstos com base em padrões históricos de dados climáticos, como temperatura, umidade, pressão atmosférica e outros fatores meteorológicos. A análise de dados e o modelo de classificação serão utilizados para identificar esses padrões e prever a probabilidade de eventos extremos.


In [150]:
# Importando bibliotecas necessárias

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, accuracy_score
import joblib

In [151]:
# Carregar dados
df = pd.read_csv("dataset_climatico.csv")
df = df.drop(columns=["nome_local", "data_hora"])

In [152]:
# Análise inicial
df.head()

Unnamed: 0,latitude,longitude,temperatura,umidade,precipitacao,pressao_ar,velocidade_vento,classificacao
0,-15.7939,-47.8828,27.986857,82.0,7.563621,1012.308678,4.010968,nenhum
1,-8.0476,-34.877,26.0,95.0,80.0,1005.0,15.0,enchente
2,-3.119,-60.0217,24.0,90.0,60.0,990.0,80.0,ciclone
3,-15.7939,-47.8828,40.0,20.0,0.0,1008.0,10.0,onda_calor
4,-15.7939,-47.8828,5.0,60.0,2.0,1025.0,5.0,onda_frio


In [153]:
# Análise inicial
df.shape

(500, 8)

In [154]:
# Análise inicial
df.describe()

Unnamed: 0,latitude,longitude,temperatura,umidade,precipitacao,pressao_ar,velocidade_vento
count,500.0,500.0,500.0,500.0,500.0,500.0,500.0
mean,-13.460641,-48.29721,26.060337,61.540781,11.338607,1012.163515,11.586813
std,9.530312,9.747448,6.280038,18.863839,24.794394,6.821536,11.951902
min,-30.0346,-67.8243,0.770583,5.887674,0.0,984.662335,-6.820478
25%,-23.5505,-51.2177,23.337278,50.0,1.420568,1007.99102,6.754284
50%,-9.9747,-47.8828,26.265216,61.0,3.37414,1012.240669,9.994791
75%,-3.7172,-38.5433,29.110814,75.0,8.286935,1016.336626,13.402126
max,-1.4558,-34.877,44.152852,99.289931,180.30259,1035.524337,99.364413


In [155]:
# Separar features e alvo
X = df.drop(columns=["classificacao"])
y = df["classificacao"]

In [156]:
# Codificar rótulos
label_encoder = LabelEncoder()
y_encoded = label_encoder.fit_transform(y)

In [157]:
# Divisão treino/teste
X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size=0.3, random_state=42)

Escolhemos o modelo Random Forest para a classificação, pois ele é robusto e eficaz para problemas de classificação com dados complexos.

In [158]:
# Modelo
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)

0,1,2
,n_estimators,100
,criterion,'gini'
,max_depth,
,min_samples_split,2
,min_samples_leaf,1
,min_weight_fraction_leaf,0.0
,max_features,'sqrt'
,max_leaf_nodes,
,min_impurity_decrease,0.0
,bootstrap,True


In [None]:
# Avaliação
y_pred = model.predict(X_test)
print("Acurácia:", accuracy_score(y_test, y_pred))
print("Relatório de Classificação:\n", classification_report(y_test, y_pred, target_names=label_encoder.classes_))

Acurácia: 1.0
Relatório de Classificação:
                   precision    recall  f1-score   support

chuva_torrencial       1.00      1.00      1.00         1
         ciclone       1.00      1.00      1.00         5
        enchente       1.00      1.00      1.00         6
          nenhum       1.00      1.00      1.00       133
      onda_calor       1.00      1.00      1.00         2
       onda_frio       1.00      1.00      1.00         2
            seca       1.00      1.00      1.00         1

        accuracy                           1.00       150
       macro avg       1.00      1.00      1.00       150
    weighted avg       1.00      1.00      1.00       150



In [160]:
# Salvar modelo
joblib.dump(model, "modelo_climatico.pkl")
joblib.dump(label_encoder, "label_encoder.pkl")

['label_encoder.pkl']

## Conclusões

Após a análise dos dados e a construção do modelo de classificação, podemos concluir que:
- O modelo de classificação foi capaz de identificar padrões nos dados históricos e prever a probabilidade de eventos climáticos extremos.
- A acurácia do modelo foi satisfatória, indicando que ele é capaz de generalizar bem para novos dados.
