TRATAMENTO DOS DADOS

In [15]:
import pandas as pd

# --- Arquivos diretos ---
desmatamento_file = 'base_dados/desmatamento/desmatamento.csv'
mortalidade_file = 'base_dados/mortalidade/mortalidade_unificada.csv'
queimadas_file = 'base_dados/queimadas/queimadas_unificadas.csv'


# --- Carregar desmatamento ---
print("📄 Carregando desmatamento...")
desmatamento = pd.read_csv(desmatamento_file, sep=';')
desmatamento['municipality'] = desmatamento['municipality'].str.upper()
desmatamento['geocode_ibge'] = desmatamento['geocode_ibge'].astype(str).str[:6]
desmatamento['year'] = desmatamento['year'].astype(int)

# --- Carregar mortalidade ---
print("📄 Carregando mortalidade unificada...")
mortalidade = pd.read_csv(mortalidade_file)
mortalidade['Mes'] = mortalidade['Mes'].map({
    'Janeiro': 1, 'Fevereiro': 2, 'Março': 3, 'Abril': 4, 'Maio': 5, 'Junho': 6,
    'Julho': 7, 'Agosto': 8, 'Setembro': 9, 'Outubro': 10, 'Novembro': 11, 'Dezembro': 12
})
mortalidade = mortalidade.rename(columns={
    'Ano': 'year',
    'Mes': 'month',
    'Codigo_IBGE': 'geocode_ibge',
    'Municipio_Nome': 'municipality',
    'Obitos': 'deaths'
})
mortalidade['geocode_ibge'] = mortalidade['geocode_ibge'].astype(str).str[:6]
mortalidade['municipality'] = mortalidade['municipality'].str.upper()

# --- Carregar queimadas ---
print("📄 Carregando queimadas unificadas...")
queimadas = pd.read_csv(queimadas_file)
queimadas = queimadas.rename(columns={
    'Ano': 'year',
    'Mes': 'month',
    'Municipio': 'municipality'
})
queimadas['municipality'] = queimadas['municipality'].str.upper()

# --- Garantir tipos consistentes ---
mortalidade['month'] = mortalidade['month'].astype(int)
queimadas['month'] = queimadas['month'].astype(int)

# --- Unir mortalidade e queimadas ---
print("🔗 Unindo mortalidade e queimadas...")
merged = pd.merge(mortalidade, queimadas, how='left',
                  on=['year', 'month', 'municipality'])

# --- Unir desmatamento ---
print("🔗 Unindo desmatamento...")
merged = pd.merge(merged, desmatamento, how='left',
                  left_on=['year', 'geocode_ibge'],
                  right_on=['year', 'geocode_ibge'])

# --- Organizar resultado final ---
final = merged[['year', 'month', 'municipality_x', 'deaths', 
                'DiaSemChuva', 'Precipitacao', 'RiscoFogo', 'FRP', 'areakm']]

# Renomear para nomes finais bonitos
final = final.rename(columns={
    'municipality_x': 'municipality',
    'areakm': 'area_desmatada_km2'
})


# --- Salvar CSV final ---
final.to_csv('planilha_unificada.csv', index=False, encoding='utf-8')
print("✅ Planilha unificada salva como 'planilha_unificada.csv'")


📄 Carregando desmatamento...
📄 Carregando mortalidade unificada...
📄 Carregando queimadas unificadas...
🔗 Unindo mortalidade e queimadas...
🔗 Unindo desmatamento...
✅ Planilha unificada salva como 'planilha_unificada.csv'


In [10]:
import pandas as pd
import glob

# --- Mortalidade ---
print("📄 Checando mortalidade...")
mortalidade_path = 'base_dados/mortalidade'
for file in glob.glob(f'{mortalidade_path}/mortalidade_*.csv'):
    year = int(file[-8:-4])
    print(f"\n➡ Lendo arquivo: {file} (ano {year})")
    df = pd.read_csv(file, sep=';', encoding='latin1')
    print(f"Colunas encontradas: {list(df.columns)}")


📄 Checando mortalidade...

➡ Lendo arquivo: base_dados/mortalidade\mortalidade_2020.csv (ano 2020)
Colunas encontradas: ['Municipio', 'Janeiro', 'Fevereiro', 'Marco', 'Abril', 'Maio', 'Junho', 'Julho', 'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro', 'Total']

➡ Lendo arquivo: base_dados/mortalidade\mortalidade_2021.csv (ano 2021)
Colunas encontradas: [' "Municipio"', 'Janeiro', 'Fevereiro', 'Marco', 'Abril', 'Maio', 'Junho', 'Julho', 'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro', 'Total']

➡ Lendo arquivo: base_dados/mortalidade\mortalidade_2022.csv (ano 2022)
Colunas encontradas: ['Municipio', 'Janeiro', 'Fevereiro', 'Marco', 'Abril', 'Maio', 'Junho', 'Julho', 'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro', 'Total']

➡ Lendo arquivo: base_dados/mortalidade\mortalidade_2023.csv (ano 2023)
Colunas encontradas: ['Municipio', 'Janeiro', 'Fevereiro', 'Marco', 'Abril', 'Maio', 'Junho', 'Julho', 'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro', 'Total']
