In [5]:
import pandas as pd

# 1. Carregar a base de queimadas
df_queimadas = pd.read_csv('C:/Users/Allyson/ENG4040/base_dados/queimadas_amazonas_2023.csv', encoding='utf-8')

print("Dimensões iniciais:", df_queimadas.shape)

# 2. Converter DataHora para datetime
df_queimadas['DataHora'] = pd.to_datetime(df_queimadas['DataHora'], format='%Y/%m/%d %H:%M:%S', errors='coerce')

# 3. Criar colunas auxiliares: ano, mês, dia, hora
df_queimadas['ano'] = df_queimadas['DataHora'].dt.year
df_queimadas['mes'] = df_queimadas['DataHora'].dt.month
df_queimadas['dia'] = df_queimadas['DataHora'].dt.day
df_queimadas['hora'] = df_queimadas['DataHora'].dt.hour

# 4. Corrigir tipos numéricos
colunas_float = ['Precipitacao', 'RiscoFogo', 'Latitude', 'Longitude', 'FRP']
for col in colunas_float:
    df_queimadas[col] = pd.to_numeric(df_queimadas[col], errors='coerce')

df_queimadas['DiaSemChuva'] = pd.to_numeric(df_queimadas['DiaSemChuva'], errors='coerce', downcast='integer')

# 5. Padronizar colunas de texto
for col in ['Satelite', 'Pais', 'Estado', 'Municipio', 'Bioma']:
    df_queimadas[col] = df_queimadas[col].str.strip().str.upper()

# 6. Remover registros com dados essenciais ausentes
df_queimadas = df_queimadas.dropna(subset=['DataHora', 'Municipio', 'Latitude', 'Longitude'])

# 7. Visualizar resultado
print("\n✅ Dados de queimadas tratados:")
print(df_queimadas.head())

print("\n🔍 Valores faltantes após tratamento:")
print(df_queimadas.isna().sum()[df_queimadas.isna().sum() > 0])


Dimensões iniciais: (410517, 12)

✅ Dados de queimadas tratados:
             DataHora  Satelite    Pais    Estado    Municipio     Bioma  \
0 2023-01-02 17:15:00  AQUA_M-T  BRASIL  AMAZONAS  ITACOATIARA  AMAZÔNIA   
1 2023-01-02 17:30:00   NPP-375  BRASIL  AMAZONAS     CANUTAMA  AMAZÔNIA   
2 2023-01-02 17:30:00   NPP-375  BRASIL  AMAZONAS     CANUTAMA  AMAZÔNIA   
3 2023-01-03 18:00:00  AQUA_M-T  BRASIL  AMAZONAS    FONTE BOA  AMAZÔNIA   
4 2023-01-03 18:00:00   NOAA-20  BRASIL  AMAZONAS         APUÍ  AMAZÔNIA   

   DiaSemChuva  Precipitacao  RiscoFogo  Latitude  Longitude   FRP   ano  mes  \
0            0          0.80        0.0  -3.29169  -58.65920  19.1  2023    1   
1            3          0.10        0.0  -8.76197  -64.16180   9.8  2023    1   
2            3          0.10        0.0  -8.76593  -64.16123  28.0  2023    1   
3            1          2.23     -999.0  -2.51782  -66.09596   7.2  2023    1   
4            2          8.26        0.0  -8.56682  -59.62691   0.7  2023 