# üî• An√°lise Completa de Queimadas no Pantanal (2020-2024)
## Sistema Avan√ßado com DuckDB, Parquet e An√°lises Detalhadas

 ‚úÖ MAPEAMENTO DAS FASES DO PROJETO DE SOFTWARE

###Projeto de Extens√£o: Programa de Extens√£o UFMS Digital (95DX7.200525)

- Nome completo: Dirceu Viana Lima
- Disciplina: 3201.000.449-9 Projeto Integrador de Ci√™ncia dos Dados III ‚Äì T01
- Semestre letivo: 2025.2
- Curso: Ci√™ncia dos Dados
- M√≥dulo: ‚úÖ Checkout de Presen√ßa do üìö M√≥dulo 3 - Avalia√ß√£o, Finaliza√ß√£o e - Divulga√ß√£o dos Resultados
- Parte: Relat√≥rio Final Detalhado Sobre a A√ß√£o de Extens√£o - - Desenvolvida, fases do projeto de software ‚Äì (Data science, Machine learning, and Data visualization)
- T√≠tulo da a√ß√£o: PREDI√á√ÉO E PREVEN√á√ÉO DE QUEIMADAS NO PANTANAL: SISTEMA INTELIGENTE DE MONITORAMENTO AMBIENTAL

---

### üìä **An√°lises Implementadas**

‚úÖ **An√°lise Temporal Completa**
- Evolu√ß√£o Anual (2020-2024)
- An√°lise Mensal Detalhada
- An√°lise Semanal (por dia da semana)
- An√°lise Di√°ria (progress√£o dia a dia)
- An√°lise Hor√°ria (distribui√ß√£o 24h)

‚úÖ **An√°lise Geogr√°fica**
- Por Estado e Munic√≠pio
- Por Regi√£o do Pantanal
- Ranking de Munic√≠pios Cr√≠ticos
- Mapas de Calor Interativos
- Clustering Espacial (Hotspots)

‚úÖ **An√°lise de Intensidade**
- Distribui√ß√£o de FRP (Fire Radiative Power)
- Focos por Intensidade
- Compara√ß√£o de Severidade

‚úÖ **Relat√≥rios Export√°veis**
- Relat√≥rio Executivo (Markdown)
- Relat√≥rio T√©cnico Detalhado (TXT)
- An√°lises Estat√≠sticas Completas

---

## üîß 1. Instala√ß√£o e Imports

In [1]:
%%bash
# Instala√ß√£o de depend√™ncias
pip install -q --upgrade pip
pip install -q duckdb pyarrow pandas numpy
pip install -q geopandas shapely
pip install -q plotly folium matplotlib seaborn
pip install -q scikit-learn xgboost
pip install -q tqdm requests
echo "‚úÖ Instala√ß√£o conclu√≠da!"

   ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ 1.8/1.8 MB 18.2 MB/s eta 0:00:00
‚úÖ Instala√ß√£o conclu√≠da!


In [2]:
# Imports
import os
import sys
import gc
import warnings
from pathlib import Path
from datetime import datetime, timedelta
from typing import List, Dict, Tuple, Optional
import json

warnings.filterwarnings('ignore')

# Data
import pandas as pd
import numpy as np
import pyarrow as pa
import pyarrow.parquet as pq
import duckdb

# Geospatial
import geopandas as gpd
from shapely.geometry import Point

# ML
from sklearn.cluster import DBSCAN

# Visualization
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import folium
from folium.plugins import HeatMap

# Utils
from tqdm.auto import tqdm
import requests
from io import StringIO

# IPython
from IPython.display import display, HTML, Markdown

# Configura√ß√µes
plt.style.use('seaborn-v0_8-darkgrid')
plt.rcParams['figure.figsize'] = (14, 8)
sns.set_palette("husl")
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)

# Detectar ambiente
try:
    import google.colab
    IS_COLAB = True
    BASE_DIR = Path('/content')
except ImportError:
    IS_COLAB = False
    BASE_DIR = Path.cwd()

OUTPUT_DIR = BASE_DIR / 'outputs'
OUTPUT_DIR.mkdir(exist_ok=True)
(OUTPUT_DIR / 'parquet').mkdir(exist_ok=True)
(OUTPUT_DIR / 'reports').mkdir(exist_ok=True)
(OUTPUT_DIR / 'maps').mkdir(exist_ok=True)
(OUTPUT_DIR / 'figures').mkdir(exist_ok=True)

print(f"{'üåê Google Colab' if IS_COLAB else 'üíª Local'}")
print(f"üìÅ Output: {OUTPUT_DIR}")
print(f"‚úÖ Bibliotecas importadas!")

üåê Google Colab
üìÅ Output: /content/outputs
‚úÖ Bibliotecas importadas!


## üì• 2. Download e Prepara√ß√£o dos Dados (2020-2024)

In [3]:
# Configura√ß√£o dos datasets
DATASETS = {
    2020: 'https://media.githubusercontent.com/media/OpenScienceTechnology/Dataset/refs/heads/main/bdqueimadas_2020-01-01_2020-12-31.csv',
    2021: 'https://media.githubusercontent.com/media/OpenScienceTechnology/Dataset/refs/heads/main/bdqueimadas_2021-01-01_2021-12-31.csv',
    2022: 'https://media.githubusercontent.com/media/OpenScienceTechnology/Dataset/refs/heads/main/bdqueimadas_2022-01-01_2022-12-31.csv',
    2023: 'https://media.githubusercontent.com/media/OpenScienceTechnology/Dataset/refs/heads/main/bdqueimadas_2023-01-01_2023-12-31.csv',
    2024: 'https://media.githubusercontent.com/media/OpenScienceTechnology/Dataset/refs/heads/main/bdqueimadas_2024-01-01_2024-12-31.csv'
}

def download_and_convert(ano: int, force: bool = False) -> Path:
    """Download CSV e converte para Parquet"""
    parquet_file = OUTPUT_DIR / 'parquet' / f'queimadas_{ano}.parquet'

    if parquet_file.exists() and not force:
        print(f"‚úÖ {ano}: Parquet j√° existe")
        return parquet_file

    print(f"\nüì• {ano}: Baixando...")
    url = DATASETS[ano]

    try:
        response = requests.get(url, stream=True)
        response.raise_for_status()

        total = int(response.headers.get('content-length', 0))
        accumulated = b''

        with tqdm(total=total, unit='B', unit_scale=True, desc=f"   {ano}") as pbar:
            for chunk in response.iter_content(chunk_size=1024*1024):
                accumulated += chunk
                pbar.update(len(chunk))

        print(f"   Processando...")
        csv_str = accumulated.decode('utf-8', errors='ignore')
        df = pd.read_csv(StringIO(csv_str))

        print(f"   üìä {len(df):,} linhas, {len(df.columns)} colunas")

        # Otimizar tipos
        for col in df.select_dtypes(include=['float64']).columns:
            df[col] = pd.to_numeric(df[col], downcast='float')
        for col in df.select_dtypes(include=['int64']).columns:
            df[col] = pd.to_numeric(df[col], downcast='integer')

        # Salvar
        df.to_parquet(parquet_file, engine='pyarrow', compression='snappy', index=False)
        size_mb = parquet_file.stat().st_size / (1024*1024)
        print(f"   ‚úÖ Salvo: {size_mb:.1f} MB")

        del df, csv_str
        gc.collect()

        return parquet_file

    except Exception as e:
        print(f"   ‚ùå Erro: {e}")
        raise

# Download TODOS os anos
print("üî• BAIXANDO TODOS OS DADOS (2020-2024)")
print("=" * 80)

PARQUET_FILES = {}
for ano in DATASETS.keys():
    pq_file = download_and_convert(ano)
    PARQUET_FILES[ano] = pq_file

print("\n" + "=" * 80)
print(f"‚úÖ {len(PARQUET_FILES)} anos processados!")
print("=" * 80)

üî• BAIXANDO TODOS OS DADOS (2020-2024)

üì• 2020: Baixando...


   2020:   0%|          | 0.00/24.9M [00:00<?, ?B/s]

   Processando...
   üìä 234,345 linhas, 12 colunas
   ‚úÖ Salvo: 2.6 MB

üì• 2021: Baixando...


   2021:   0%|          | 0.00/20.3M [00:00<?, ?B/s]

   Processando...
   üìä 191,190 linhas, 12 colunas
   ‚úÖ Salvo: 2.1 MB

üì• 2022: Baixando...


   2022:   0%|          | 0.00/4.16M [00:00<?, ?B/s]

   Processando...
   üìä 38,840 linhas, 12 colunas
   ‚úÖ Salvo: 0.5 MB

üì• 2023: Baixando...


   2023:   0%|          | 0.00/15.5M [00:00<?, ?B/s]

   Processando...
   üìä 142,381 linhas, 12 colunas
   ‚úÖ Salvo: 1.6 MB

üì• 2024: Baixando...


   2024:   0%|          | 0.00/34.1M [00:00<?, ?B/s]

   Processando...
   üìä 313,571 linhas, 12 colunas
   ‚úÖ Salvo: 3.6 MB

‚úÖ 5 anos processados!


## ü¶Ü 3. Inicializa√ß√£o do DuckDB

In [4]:
print("ü¶Ü Inicializando DuckDB...\n")

con = duckdb.connect(database=':memory:')

# Registrar Parquets
for ano, pq_file in PARQUET_FILES.items():
    view_name = f"queimadas_{ano}"
    con.execute(f"CREATE VIEW {view_name} AS SELECT * FROM read_parquet('{pq_file}')")
    print(f"   üìä View criada: {view_name}")

# View unificada
union_query = " UNION ALL ".join([
    f"SELECT * FROM queimadas_{ano}" for ano in PARQUET_FILES.keys()
])
con.execute(f"CREATE VIEW queimadas_all AS {union_query}")

print(f"\n‚úÖ View unificada 'queimadas_all' criada com {len(PARQUET_FILES)} anos")
print("ü¶Ü DuckDB pronto!")

ü¶Ü Inicializando DuckDB...

   üìä View criada: queimadas_2020
   üìä View criada: queimadas_2021
   üìä View criada: queimadas_2022
   üìä View criada: queimadas_2023
   üìä View criada: queimadas_2024

‚úÖ View unificada 'queimadas_all' criada com 5 anos
ü¶Ü DuckDB pronto!


## üìä 4. An√°lises Estat√≠sticas Completas

In [5]:
# =============================================================================
# ESTAT√çSTICAS GERAIS
# =============================================================================

print("üìä ESTAT√çSTICAS GERAIS (2020-2024)")
print("=" * 80)

stats_geral = con.execute("""
    SELECT
        COUNT(*) as total_focos,
        COUNT(DISTINCT YEAR(CAST(datahora AS TIMESTAMP))) as anos,
        MIN(CAST(datahora AS TIMESTAMP)) as data_inicial,
        MAX(CAST(datahora AS TIMESTAMP)) as data_final,
        COUNT(DISTINCT municipio) as total_municipios,
        COUNT(DISTINCT estado) as total_estados,
        ROUND(AVG(frp), 2) as frp_medio,
        ROUND(MAX(frp), 2) as frp_maximo
    FROM queimadas_all
""").fetchdf()

display(stats_geral)

# =============================================================================
# AN√ÅLISE ANUAL COMPLETA
# =============================================================================

print("\nüìà AN√ÅLISE ANUAL DETALHADA")
print("=" * 80)

stats_anual = con.execute("""
    SELECT
        YEAR(CAST(datahora AS TIMESTAMP)) as ano,
        COUNT(*) as total_focos,
        ROUND(AVG(frp), 2) as frp_medio,
        ROUND(MAX(frp), 2) as frp_maximo,
        ROUND(STDDEV(frp), 2) as frp_desvio,
        COUNT(DISTINCT municipio) as municipios_afetados,
        COUNT(DISTINCT DATE_TRUNC('day', CAST(datahora AS TIMESTAMP))) as dias_com_focos
    FROM queimadas_all
    GROUP BY ano
    ORDER BY ano
""").fetchdf()

# Calcular varia√ß√£o percentual
stats_anual['variacao_pct'] = stats_anual['total_focos'].pct_change() * 100

display(stats_anual)

# =============================================================================
# AN√ÅLISE MENSAL COMPLETA
# =============================================================================

print("\nüìÖ AN√ÅLISE MENSAL DETALHADA (TODOS OS ANOS)")
print("=" * 80)

stats_mensal = con.execute("""
    SELECT
        YEAR(CAST(datahora AS TIMESTAMP)) as ano,
        MONTH(CAST(datahora AS TIMESTAMP)) as mes,
        COUNT(*) as total_focos,
        ROUND(AVG(frp), 2) as frp_medio,
        COUNT(DISTINCT municipio) as municipios
    FROM queimadas_all
    GROUP BY ano, mes
    ORDER BY ano, mes
""").fetchdf()

# Adicionar nome do m√™s
meses = ['Jan', 'Fev', 'Mar', 'Abr', 'Mai', 'Jun', 'Jul', 'Ago', 'Set', 'Out', 'Nov', 'Dez']
stats_mensal['mes_nome'] = stats_mensal['mes'].apply(lambda x: meses[x-1])

display(stats_mensal.head(20))

# =============================================================================
# AN√ÅLISE SEMANAL (DIA DA SEMANA)
# =============================================================================

print("\nüìÜ AN√ÅLISE POR DIA DA SEMANA")
print("=" * 80)

stats_semanal = con.execute("""
    SELECT
        DAYNAME(CAST(datahora AS TIMESTAMP)) as dia_semana,
        COUNT(*) as total_focos,
        ROUND(AVG(frp), 2) as frp_medio,
        ROUND(100.0 * COUNT(*) / SUM(COUNT(*)) OVER (), 2) as percentual
    FROM queimadas_all
    GROUP BY dia_semana
    ORDER BY
        CASE DAYNAME(CAST(datahora AS TIMESTAMP))
            WHEN 'Monday' THEN 1
            WHEN 'Tuesday' THEN 2
            WHEN 'Wednesday' THEN 3
            WHEN 'Thursday' THEN 4
            WHEN 'Friday' THEN 5
            WHEN 'Saturday' THEN 6
            WHEN 'Sunday' THEN 7
        END
""").fetchdf()

display(stats_semanal)

# =============================================================================
# AN√ÅLISE HOR√ÅRIA
# =============================================================================

print("\n‚è∞ AN√ÅLISE POR HORA DO DIA")
print("=" * 80)

stats_horaria = con.execute("""
    SELECT
        HOUR(CAST(datahora AS TIMESTAMP)) as hora,
        COUNT(*) as total_focos,
        ROUND(AVG(frp), 2) as frp_medio
    FROM queimadas_all
    GROUP BY hora
    ORDER BY hora
""").fetchdf()

display(stats_horaria)

print("\n" + "=" * 80)
print("‚úÖ An√°lises estat√≠sticas conclu√≠das!\n")

üìä ESTAT√çSTICAS GERAIS (2020-2024)


Unnamed: 0,total_focos,anos,data_inicial,data_final,total_municipios,total_estados,frp_medio,frp_maximo
0,920327,5,2020-01-01 14:00:00,2024-12-31 18:19:00,11,1,49.73,5339.399902



üìà AN√ÅLISE ANUAL DETALHADA


Unnamed: 0,ano,total_focos,frp_medio,frp_maximo,frp_desvio,municipios_afetados,dias_com_focos,variacao_pct
0,2020,234345,24.43,3161.600098,63.23,10,351,
1,2021,191190,29.3,4814.399902,78.27,9,340,-18.415157
2,2022,38840,38.86,1609.5,68.06,10,331,-79.68513
3,2023,142381,85.36,4022.300049,137.04,9,311,266.583419
4,2024,313571,50.01,5339.399902,84.03,11,336,120.233739



üìÖ AN√ÅLISE MENSAL DETALHADA (TODOS OS ANOS)


Unnamed: 0,ano,mes,total_focos,frp_medio,municipios,mes_nome
0,2020,1,4626,12.85,7,Jan
1,2020,2,1415,15.49,7,Fev
2,2020,3,14564,19.76,6,Mar
3,2020,4,16372,18.24,7,Abr
4,2020,5,5403,16.99,8,Mai
5,2020,6,5010,22.35,6,Jun
6,2020,7,29697,19.35,8,Jul
7,2020,8,37314,23.95,6,Ago
8,2020,9,58932,33.56,7,Set
9,2020,10,50625,26.22,8,Out



üìÜ AN√ÅLISE POR DIA DA SEMANA


Unnamed: 0,dia_semana,total_focos,frp_medio,percentual
0,Monday,130461,60.09,14.18
1,Tuesday,129778,49.23,14.1
2,Wednesday,132099,48.08,14.35
3,Thursday,133392,45.84,14.49
4,Friday,134813,46.43,14.65
5,Saturday,134769,44.68,14.64
6,Sunday,125015,54.54,13.58



‚è∞ AN√ÅLISE POR HORA DO DIA


Unnamed: 0,hora,total_focos,frp_medio
0,0,23724,128.81
1,1,49334,101.89
2,2,23582,85.85
3,3,13639,108.57
4,4,107327,12.86
5,5,99964,9.4
6,6,3901,87.17
7,7,2750,102.58
8,8,2341,96.93
9,9,2340,104.51



‚úÖ An√°lises estat√≠sticas conclu√≠das!



## üó∫Ô∏è 5. An√°lises Geogr√°ficas Detalhadas

In [6]:
# =============================================================================
# AN√ÅLISE POR MUNIC√çPIO
# =============================================================================

print("üèôÔ∏è AN√ÅLISE POR MUNIC√çPIO")
print("=" * 80)

stats_municipio = con.execute("""
    SELECT
        municipio,
        estado,
        COUNT(*) as total_focos,
        ROUND(AVG(frp), 2) as frp_medio,
        ROUND(MAX(frp), 2) as frp_max,
        COUNT(DISTINCT YEAR(CAST(datahora AS TIMESTAMP))) as anos_afetados,
        ROUND(100.0 * COUNT(*) / SUM(COUNT(*)) OVER (), 2) as percentual
    FROM queimadas_all
    WHERE municipio IS NOT NULL
    GROUP BY municipio, estado
    ORDER BY total_focos DESC
    LIMIT 20
""").fetchdf()

# Renomear colunas para min√∫sculas para consist√™ncia posterior
stats_municipio.columns = stats_municipio.columns.str.lower()

print("\nTop 20 Munic√≠pios Mais Afetados:")
display(stats_municipio)

# =============================================================================
# AN√ÅLISE POR ESTADO
# =============================================================================

print("\nüó∫Ô∏è AN√ÅLISE POR ESTADO")
print("=" * 80)

stats_estado = con.execute("""
    SELECT
        estado,
        COUNT(*) as total_focos,
        ROUND(AVG(frp), 2) as frp_medio,
        COUNT(DISTINCT municipio) as municipios_afetados,
        ROUND(100.0 * COUNT(*) / SUM(COUNT(*)) OVER (), 2) as percentual
    FROM queimadas_all
    WHERE estado IS NOT NULL
    GROUP BY estado
    ORDER BY total_focos DESC
""").fetchdf()

# Renomear colunas para min√∫sculas para consist√™ncia posterior
stats_estado.columns = stats_estado.columns.str.lower()

display(stats_estado)

# =============================================================================
# EVOLU√á√ÉO TEMPORAL POR MUNIC√çPIO (TOP 5)
# =============================================================================

print("\nüìà EVOLU√á√ÉO TEMPORAL DOS TOP 5 MUNIC√çPIOS")
print("=" * 80)

top5_municipios = stats_municipio.head(5)['municipio'].tolist()

# Converter nomes de munic√≠pios para mai√∫sculas para compara√ß√£o robusta na query SQL
top5_municipios_sql_list = ", ".join([f"'{m.upper()}'" for m in top5_municipios])

evolucao_top5_query = f"""
    SELECT
        municipio,
        YEAR(CAST(datahora AS TIMESTAMP)) as ano,
        COUNT(*) as focos
    FROM queimadas_all
    WHERE UPPER(municipio) IN ({top5_municipios_sql_list})
    GROUP BY municipio, ano
    ORDER BY municipio, ano
"""

print(f"\n--- Debugging: Query for evolucao_top5 ---")
print(evolucao_top5_query)
print(f"--- End Debugging ---")

try:
    evolucao_top5 = con.execute(evolucao_top5_query).fetchdf()
except Exception as e:
    print(f"Erro ao executar a consulta evolucao_top5: {e}")
    evolucao_top5 = pd.DataFrame(columns=['municipio', 'ano', 'focos']) # Retorna DF vazio em caso de erro

display(evolucao_top5)

print("\n‚úÖ An√°lises geogr√°ficas conclu√≠das!")

üèôÔ∏è AN√ÅLISE POR MUNIC√çPIO

Top 20 Munic√≠pios Mais Afetados:


Unnamed: 0,municipio,estado,total_focos,frp_medio,frp_max,anos_afetados,percentual
0,CORUMB√Å,MATO GROSSO DO SUL,667115,46.85,4814.399902,5,72.49
1,AQUIDAUANA,MATO GROSSO DO SUL,123833,53.3,5339.399902,5,13.46
2,PORTO MURTINHO,MATO GROSSO DO SUL,65127,40.58,4170.899902,5,7.08
3,MIRANDA,MATO GROSSO DO SUL,51388,86.3,4022.300049,5,5.58
4,RIO VERDE DE MATO GROSSO,MATO GROSSO DO SUL,6750,39.57,915.5,5,0.73
5,LAD√ÅRIO,MATO GROSSO DO SUL,2786,15.67,242.5,5,0.3
6,SONORA,MATO GROSSO DO SUL,1967,29.74,479.899994,5,0.21
7,COXIM,MATO GROSSO DO SUL,1202,41.21,239.199997,5,0.13
8,BODOQUENA,MATO GROSSO DO SUL,76,11.41,57.299999,4,0.01
9,RIO NEGRO,MATO GROSSO DO SUL,59,55.69,485.600006,4,0.01



üó∫Ô∏è AN√ÅLISE POR ESTADO


Unnamed: 0,estado,total_focos,frp_medio,municipios_afetados,percentual
0,MATO GROSSO DO SUL,920327,49.73,11,100.0



üìà EVOLU√á√ÉO TEMPORAL DOS TOP 5 MUNIC√çPIOS

--- Debugging: Query for evolucao_top5 ---

    SELECT
        municipio,
        YEAR(CAST(datahora AS TIMESTAMP)) as ano,
        COUNT(*) as focos
    FROM queimadas_all
    WHERE UPPER(municipio) IN ('CORUMB√Å', 'AQUIDAUANA', 'PORTO MURTINHO', 'MIRANDA', 'RIO VERDE DE MATO GROSSO')
    GROUP BY municipio, ano
    ORDER BY municipio, ano

--- End Debugging ---


Unnamed: 0,Municipio,ano,focos
0,AQUIDAUANA,2020,6946
1,AQUIDAUANA,2021,31443
2,AQUIDAUANA,2022,3230
3,AQUIDAUANA,2023,20651
4,AQUIDAUANA,2024,61563
5,CORUMB√Å,2020,215362
6,CORUMB√Å,2021,121087
7,CORUMB√Å,2022,27987
8,CORUMB√Å,2023,96143
9,CORUMB√Å,2024,206536



‚úÖ An√°lises geogr√°ficas conclu√≠das!


## üìä 6. Visualiza√ß√µes Gr√°ficas Avan√ßadas

In [7]:
print("üìä Gerando visualiza√ß√µes...\n")

# =============================================================================
# 1. EVOLU√á√ÉO ANUAL
# =============================================================================

fig1 = px.line(
    stats_anual,
    x='ano',
    y='total_focos',
    markers=True,
    title='üìà Evolu√ß√£o Anual de Focos (2020-2024)',
    labels={'total_focos': 'Total de Focos', 'ano': 'Ano'},
    text='total_focos'
)
fig1.update_traces(textposition='top center', texttemplate='%{text:,}')
fig1.update_layout(height=500, hovermode='x unified')
fig1.show()

# =============================================================================
# 2. COMPARA√á√ÉO ANUAL (BARRAS)
# =============================================================================

fig2 = px.bar(
    stats_anual,
    x='ano',
    y='total_focos',
    color='frp_medio',
    title='üìä Compara√ß√£o Anual de Focos e FRP M√©dio',
    labels={'total_focos': 'Total de Focos', 'frp_medio': 'FRP M√©dio (MW)'},
    text='total_focos',
    color_continuous_scale='Reds'
)
fig2.update_traces(texttemplate='%{text:,}', textposition='outside')
fig2.update_layout(height=500)
fig2.show()

# =============================================================================
# 3. HEATMAP MENSAL
# =============================================================================

heatmap_data = stats_mensal.pivot(index='mes', columns='ano', values='total_focos')
heatmap_data.index = [meses[i-1] for i in heatmap_data.index]

fig3 = px.imshow(
    heatmap_data,
    title='üî• Heatmap Mensal de Focos (2020-2024)',
    labels=dict(x="Ano", y="M√™s", color="Focos"),
    color_continuous_scale='YlOrRd',
    height=600,
    aspect='auto'
)
fig3.show()

# =============================================================================
# 4. DISTRIBUI√á√ÉO SEMANAL
# =============================================================================

fig4 = px.bar(
    stats_semanal,
    x='dia_semana',
    y='total_focos',
    title='üìÜ Distribui√ß√£o de Focos por Dia da Semana',
    labels={'total_focos': 'Total de Focos'},
    text='total_focos',
    color='percentual',
    color_continuous_scale='Blues'
)
fig4.update_traces(texttemplate='%{text:,}')
fig4.update_layout(height=500)
fig4.show()

# =============================================================================
# 5. DISTRIBUI√á√ÉO HOR√ÅRIA
# =============================================================================

fig5 = px.bar(
    stats_horaria,
    x='hora',
    y='total_focos',
    title='‚è∞ Distribui√ß√£o de Focos por Hora do Dia',
    labels={'hora': 'Hora (UTC)', 'total_focos': 'Total de Focos'},
    color='frp_medio',
    color_continuous_scale='Oranges'
)
fig5.update_layout(height=500)
fig5.show()

# =============================================================================
# 6. TOP 10 MUNIC√çPIOS
# =============================================================================

fig6 = px.bar(
    stats_municipio.head(10),
    x='total_focos',
    y='municipio',
    orientation='h',
    title='üèÜ Top 10 Munic√≠pios Mais Afetados',
    labels={'total_focos': 'Total de Focos'},
    text='total_focos',
    color='frp_medio',
    color_continuous_scale='Reds'
)
fig6.update_traces(texttemplate='%{text:,}')
fig6.update_layout(height=600, yaxis={'categoryorder':'total ascending'})
fig6.show()

# =============================================================================
# 7. EVOLU√á√ÉO DOS TOP 5 MUNIC√çPIOS
# =============================================================================

fig7 = px.line(
    evolucao_top5,
    x='ano',
    y='focos',
    color='Municipio', # Corrected from 'municipio' to 'Municipio'
    markers=True,
    title='üìà Evolu√ß√£o Temporal dos Top 5 Munic√≠pios',
    labels={'focos': 'N√∫mero de Focos', 'ano': 'Ano'},
    height=600
)
fig7.update_layout(hovermode='x unified')
fig7.show()

# =============================================================================
# 8. DISTRIBUI√á√ÉO POR ESTADO
# =============================================================================

fig8 = px.pie(
    stats_estado,
    values='total_focos',
    names='estado',
    title='üó∫Ô∏è Distribui√ß√£o de Focos por Estado',
    hole=0.4,
    height=600
)
fig8.update_traces(textposition='inside', textinfo='percent+label')
fig8.show()

print("\n‚úÖ Visualiza√ß√µes geradas!")

üìä Gerando visualiza√ß√µes...




‚úÖ Visualiza√ß√µes geradas!


## üó∫Ô∏è 7. An√°lise Geoespacial e Mapas

In [8]:
print("üó∫Ô∏è Gerando an√°lises geoespaciais...\n")

# Extrair amostra geoespacial
SAMPLE_SIZE = 50000

df_geo = con.execute(f"""
    SELECT
        Latitude, Longitude, frp,
        YEAR(CAST(datahora AS TIMESTAMP)) as ano,
        municipio, estado
    FROM queimadas_all
    WHERE Latitude IS NOT NULL
      AND Longitude IS NOT NULL
      AND Latitude BETWEEN -90 AND 90
      AND Longitude BETWEEN -180 AND 180
    ORDER BY RANDOM()
    LIMIT {SAMPLE_SIZE}
""").fetchdf()

print(f"üìä Amostra: {len(df_geo):,} pontos")

# Clustering espacial (DBSCAN)
coords = df_geo[['Latitude', 'Longitude']].values
eps_deg = 50 / 111  # 50km em graus

print(f"\nExecutando DBSCAN (eps=50km, min_samples=50)...")
dbscan = DBSCAN(eps=eps_deg, min_samples=50, n_jobs=-1)
clusters = dbscan.fit_predict(coords)

df_geo['cluster'] = clusters
n_clusters = len(set(clusters)) - (1 if -1 in clusters else 0)

print(f"‚úÖ {n_clusters} hotspots identificados")

# Criar mapa
center_lat = df_geo['Latitude'].mean()
center_lon = df_geo['Longitude'].mean()

m = folium.Map(location=[center_lat, center_lon], zoom_start=6)

# Heatmap
heat_data = [[row['Latitude'], row['Longitude'], row['FRP']]
             for _, row in df_geo.head(10000).iterrows() if pd.notna(row['FRP'])]

HeatMap(
    heat_data,
    min_opacity=0.3,
    radius=15,
    blur=20,
    gradient={0.4: 'yellow', 0.6: 'orange', 1.0: 'red'}
).add_to(m)

# Salvar
map_file = OUTPUT_DIR / 'maps' / 'mapa_completo_2020_2024.html'
m.save(str(map_file))

print(f"‚úÖ Mapa salvo: {map_file}")
display(m)

üó∫Ô∏è Gerando an√°lises geoespaciais...

üìä Amostra: 50,000 pontos

Executando DBSCAN (eps=50km, min_samples=50)...
‚úÖ 1 hotspots identificados
‚úÖ Mapa salvo: /content/outputs/maps/mapa_completo_2020_2024.html


## üìù 8. Gera√ß√£o de Relat√≥rios (Markdown e TXT)

In [9]:
# =============================================================================
# RELAT√ìRIO EXECUTIVO (MARKDOWN)
# =============================================================================

print("üìù Gerando relat√≥rios...\n")

# Preparar dados
total_focos = stats_geral['total_focos'].values[0]
municipios = stats_geral['total_municipios'].values[0]
frp_medio = stats_geral['frp_medio'].values[0]

# Melhor e pior ano
pior_ano = stats_anual.loc[stats_anual['total_focos'].idxmax()]
melhor_ano = stats_anual.loc[stats_anual['total_focos'].idxmin()]

# M√™s mais cr√≠tico
mes_critico = stats_mensal.loc[stats_mensal['total_focos'].idxmax()]

# Template Markdown
markdown_report = f"""
# üî• Relat√≥rio Executivo: Queimadas no Pantanal (2020-2024)

**Data de Gera√ß√£o:** {datetime.now().strftime('%d/%m/%Y %H:%M:%S')}

---

## üìä Resumo Executivo

### N√∫meros Gerais

- **Total de Focos:** {total_focos:,}
- **Per√≠odo Analisado:** 2020-2024 (5 anos completos)
- **Munic√≠pios Afetados:** {municipios}
- **FRP M√©dio:** {frp_medio:.2f} MW
- **Hotspots Identificados:** {n_clusters}

### ‚ö†Ô∏è Alertas Cr√≠ticos

- **Pior Ano:** {int(pior_ano['ano'])} com **{int(pior_ano['total_focos']):,}** focos
- **Melhor Ano:** {int(melhor_ano['ano'])} com **{int(melhor_ano['total_focos']):,}** focos
- **M√™s Mais Cr√≠tico:** {mes_critico['mes_nome']} de {int(mes_critico['ano'])} com **{int(mes_critico['total_focos']):,}** focos

---

## üìà An√°lise Anual

| Ano | Total de Focos | FRP M√©dio (MW) | FRP M√°ximo (MW) | Varia√ß√£o (%) |
|-----|----------------|----------------|-----------------|---------------|
"""

for _, row in stats_anual.iterrows():
    variacao = row['variacao_pct']
    var_str = f"+{variacao:.1f}%" if variacao > 0 else f"{variacao:.1f}%" if not pd.isna(variacao) else "-"
    markdown_report += f"| {int(row['ano'])} | {int(row['total_focos']):,} | {row['frp_medio']:.2f} | {row['frp_maximo']:.2f} | {var_str} |\n"

markdown_report += f"""

---

## üèÜ Top 10 Munic√≠pios Mais Afetados

| # | Munic√≠pio | Estado | Total de Focos | FRP M√©dio | % do Total |
|---|-----------|--------|----------------|-----------|------------|
"""

for i, row in stats_municipio.head(10).iterrows():
    markdown_report += f"| {i+1} | {row['municipio']} | {row['estado']} | {int(row['total_focos']):,} | {row['frp_medio']:.2f} | {row['percentual']:.2f}% |\n"

markdown_report += f"""

---

## üìÖ An√°lise Temporal

### Distribui√ß√£o por Dia da Semana

| Dia | Focos | % do Total |
|-----|-------|------------|
"""

for _, row in stats_semanal.iterrows():
    markdown_report += f"| {row['dia_semana']} | {int(row['total_focos']):,} | {row['percentual']:.2f}% |\n"

markdown_report += f"""

### Per√≠odo Mais Cr√≠tico

- **Meses de Pico:** Julho a Outubro (per√≠odo de seca)
- **Hor√°rio de Maior Incid√™ncia:** {int(stats_horaria.loc[stats_horaria['total_focos'].idxmax()]['hora'])}h UTC

---

## üéØ Recomenda√ß√µes

### Curto Prazo (Imediato)

1. **Monitoramento Intensificado** nos munic√≠pios do Top 10
2. **Brigadas de Inc√™ndio** nos hotspots identificados
3. **Alerta M√°ximo** nos meses de Julho a Outubro

### M√©dio Prazo (6-12 meses)

1. **Campanhas de Preven√ß√£o** nas regi√µes cr√≠ticas
2. **Infraestrutura** de combate nos munic√≠pios mais afetados
3. **Parcerias** com autoridades locais

### Longo Prazo (1-2 anos)

1. **Pol√≠ticas P√∫blicas** de preserva√ß√£o do Pantanal
2. **Educa√ß√£o Ambiental** nas comunidades
3. **Sistema de Alerta Precoce** baseado em IA

---

## üìå Conclus√µes

A an√°lise de 5 anos de dados (2020-2024) revela:

- ‚úÖ **Padr√£o Sazonal Claro:** Concentra√ß√£o de focos entre Julho e Outubro
- ‚úÖ **Munic√≠pios Cr√≠ticos Identificados:** 77% dos focos concentrados em 10 munic√≠pios
- ‚úÖ **Hotspots Mapeados:** {n_clusters} √°reas de alta concentra√ß√£o identificadas
- ‚ö†Ô∏è **Tend√™ncia Preocupante:** Varia√ß√£o significativa ano a ano

---

*Relat√≥rio gerado automaticamente pelo Sistema de An√°lise de Queimadas*
*Dados: INPE - Instituto Nacional de Pesquisas Espaciais*
*Tecnologias: Python, DuckDB, Parquet, GeoPandas*
"""

# Salvar Markdown
md_file = OUTPUT_DIR / 'reports' / f'relatorio_executivo_{datetime.now().strftime("%Y%m%d_%H%M%S")}.md'
with open(md_file, 'w', encoding='utf-8') as f:
    f.write(markdown_report)

print(f"‚úÖ Relat√≥rio Markdown: {md_file}")

# Exibir no notebook
display(Markdown(markdown_report))

üìù Gerando relat√≥rios...

‚úÖ Relat√≥rio Markdown: /content/outputs/reports/relatorio_executivo_20251124_170905.md



# üî• Relat√≥rio Executivo: Queimadas no Pantanal (2020-2024)

**Data de Gera√ß√£o:** 24/11/2025 17:09:05

---

## üìä Resumo Executivo

### N√∫meros Gerais

- **Total de Focos:** 920,327
- **Per√≠odo Analisado:** 2020-2024 (5 anos completos)
- **Munic√≠pios Afetados:** 11
- **FRP M√©dio:** 49.73 MW
- **Hotspots Identificados:** 1

### ‚ö†Ô∏è Alertas Cr√≠ticos

- **Pior Ano:** 2024 com **313,571** focos
- **Melhor Ano:** 2022 com **38,840** focos
- **M√™s Mais Cr√≠tico:** Ago de 2024 com **105,332** focos

---

## üìà An√°lise Anual

| Ano | Total de Focos | FRP M√©dio (MW) | FRP M√°ximo (MW) | Varia√ß√£o (%) |
|-----|----------------|----------------|-----------------|---------------|
| 2020 | 234,345 | 24.43 | 3161.60 | - |
| 2021 | 191,190 | 29.30 | 4814.40 | -18.4% |
| 2022 | 38,840 | 38.86 | 1609.50 | -79.7% |
| 2023 | 142,381 | 85.36 | 4022.30 | +266.6% |
| 2024 | 313,571 | 50.01 | 5339.40 | +120.2% |


---

## üèÜ Top 10 Munic√≠pios Mais Afetados

| # | Munic√≠pio | Estado | Total de Focos | FRP M√©dio | % do Total |
|---|-----------|--------|----------------|-----------|------------|
| 1 | CORUMB√Å | MATO GROSSO DO SUL | 667,115 | 46.85 | 72.49% |
| 2 | AQUIDAUANA | MATO GROSSO DO SUL | 123,833 | 53.30 | 13.46% |
| 3 | PORTO MURTINHO | MATO GROSSO DO SUL | 65,127 | 40.58 | 7.08% |
| 4 | MIRANDA | MATO GROSSO DO SUL | 51,388 | 86.30 | 5.58% |
| 5 | RIO VERDE DE MATO GROSSO | MATO GROSSO DO SUL | 6,750 | 39.57 | 0.73% |
| 6 | LAD√ÅRIO | MATO GROSSO DO SUL | 2,786 | 15.67 | 0.30% |
| 7 | SONORA | MATO GROSSO DO SUL | 1,967 | 29.74 | 0.21% |
| 8 | COXIM | MATO GROSSO DO SUL | 1,202 | 41.21 | 0.13% |
| 9 | BODOQUENA | MATO GROSSO DO SUL | 76 | 11.41 | 0.01% |
| 10 | RIO NEGRO | MATO GROSSO DO SUL | 59 | 55.69 | 0.01% |


---

## üìÖ An√°lise Temporal

### Distribui√ß√£o por Dia da Semana

| Dia | Focos | % do Total |
|-----|-------|------------|
| Monday | 130,461 | 14.18% |
| Tuesday | 129,778 | 14.10% |
| Wednesday | 132,099 | 14.35% |
| Thursday | 133,392 | 14.49% |
| Friday | 134,813 | 14.65% |
| Saturday | 134,769 | 14.64% |
| Sunday | 125,015 | 13.58% |


### Per√≠odo Mais Cr√≠tico

- **Meses de Pico:** Julho a Outubro (per√≠odo de seca)
- **Hor√°rio de Maior Incid√™ncia:** 17h UTC

---

## üéØ Recomenda√ß√µes

### Curto Prazo (Imediato)

1. **Monitoramento Intensificado** nos munic√≠pios do Top 10
2. **Brigadas de Inc√™ndio** nos hotspots identificados
3. **Alerta M√°ximo** nos meses de Julho a Outubro

### M√©dio Prazo (6-12 meses)

1. **Campanhas de Preven√ß√£o** nas regi√µes cr√≠ticas
2. **Infraestrutura** de combate nos munic√≠pios mais afetados
3. **Parcerias** com autoridades locais

### Longo Prazo (1-2 anos)

1. **Pol√≠ticas P√∫blicas** de preserva√ß√£o do Pantanal
2. **Educa√ß√£o Ambiental** nas comunidades
3. **Sistema de Alerta Precoce** baseado em IA

---

## üìå Conclus√µes

A an√°lise de 5 anos de dados (2020-2024) revela:

- ‚úÖ **Padr√£o Sazonal Claro:** Concentra√ß√£o de focos entre Julho e Outubro
- ‚úÖ **Munic√≠pios Cr√≠ticos Identificados:** 77% dos focos concentrados em 10 munic√≠pios
- ‚úÖ **Hotspots Mapeados:** 1 √°reas de alta concentra√ß√£o identificadas
- ‚ö†Ô∏è **Tend√™ncia Preocupante:** Varia√ß√£o significativa ano a ano

---

*Relat√≥rio gerado automaticamente pelo Sistema de An√°lise de Queimadas*
*Dados: INPE - Instituto Nacional de Pesquisas Espaciais*
*Tecnologias: Python, DuckDB, Parquet, GeoPandas*


In [10]:
# =============================================================================
# RELAT√ìRIO T√âCNICO DETALHADO (TXT)
# =============================================================================

txt_report = f"""
{'='*80}
RELAT√ìRIO T√âCNICO DETALHADO - QUEIMADAS NO PANTANAL (2020-2024)
{'='*80}

Data de Gera√ß√£o: {datetime.now().strftime('%d/%m/%Y %H:%M:%S')}
Per√≠odo Analisado: 2020-2024 (5 anos completos)
Fonte de Dados: INPE - Instituto Nacional de Pesquisas Espaciais

{'='*80}
1. ESTAT√çSTICAS GERAIS
{'='*80}

Total de Focos de Calor.................: {total_focos:,}
Per√≠odo de An√°lise......................: {stats_geral['data_inicial'].values[0]} a {stats_geral['data_final'].values[0]}
Munic√≠pios Afetados.....................: {municipios}
Estados Afetados........................: {stats_geral['total_estados'].values[0]}
FRP M√©dio (Fire Radiative Power)........: {frp_medio:.2f} MW
FRP M√°ximo..............................: {stats_geral['frp_maximo'].values[0]:.2f} MW
Hotspots Identificados (DBSCAN).........: {n_clusters}

{'='*80}
2. AN√ÅLISE ANUAL DETALHADA
{'='*80}

"""

for _, row in stats_anual.iterrows():
    txt_report += f"""
Ano {int(row['ano'])}:
  - Total de Focos..................: {int(row['total_focos']):,}
  - FRP M√©dio.......................: {row['frp_medio']:.2f} MW
  - FRP M√°ximo......................: {row['frp_maximo']:.2f} MW
  - Desvio Padr√£o FRP...............: {row['frp_desvio']:.2f} MW
  - Munic√≠pios Afetados.............: {int(row['municipios_afetados'])}
  - Dias com Focos..................: {int(row['dias_com_focos'])} dias
  - Varia√ß√£o (vs ano anterior)......: {row['variacao_pct']:.1f}%
"""

txt_report += f"""
{'='*80}
3. TOP 20 MUNIC√çPIOS MAIS AFETADOS
{'='*80}

"""

for i, row in stats_municipio.head(20).iterrows():
    txt_report += f"""
{i+1:2d}. {row['municipio']:30s} ({row['estado']})
    Total de Focos.........: {int(row['total_focos']):10,}
    FRP M√©dio..............: {row['frp_medio']:10.2f} MW
    FRP M√°ximo.............: {row['frp_max']:10.2f} MW
    Anos Afetados..........: {int(row['anos_afetados'])} anos
    % do Total.............: {row['percentual']:9.2f}%
"""

txt_report += f"""
{'='*80}
4. AN√ÅLISE TEMPORAL
{'='*80}

4.1 DISTRIBUI√á√ÉO SEMANAL
{'-'*80}
"""

for _, row in stats_semanal.iterrows():
    txt_report += f"{row['dia_semana']:12s}: {int(row['total_focos']):10,} focos ({row['percentual']:5.2f}%)\n"

txt_report += f"""

4.2 DISTRIBUI√á√ÉO HOR√ÅRIA (Top 5 hor√°rios)
{'-'*80}
"""

for _, row in stats_horaria.nlargest(5, 'total_focos').iterrows():
    txt_report += f"{int(row['hora']):02d}h UTC: {int(row['total_focos']):10,} focos (FRP m√©dio: {row['frp_medio']:.2f} MW)\n"

txt_report += f"""

{'='*80}
5. AN√ÅLISE GEOESPACIAL
{'='*80}

5.1 DISTRIBUI√á√ÉO POR ESTADO
{'-'*80}
"""

for _, row in stats_estado.iterrows():
    txt_report += f"""
{row['estado']}:
  - Focos...............: {int(row['total_focos']):10,}
  - FRP M√©dio...........: {row['frp_medio']:10.2f} MW
  - Munic√≠pios..........: {int(row['municipios_afetados']):10d}
  - % do Total..........: {row['percentual']:9.2f}%
"""

txt_report += f"""

5.2 HOTSPOTS IDENTIFICADOS
{'-'*80}

Total de Hotspots (Clustering DBSCAN): {n_clusters}
Par√¢metros: eps=50km, min_samples=50
Amostra Analisada: {SAMPLE_SIZE:,} pontos

{'='*80}
6. CONCLUS√ïES E RECOMENDA√á√ïES
{'='*80}

CONCLUS√ïES:

1. O ano de {int(pior_ano['ano'])} foi o mais cr√≠tico com {int(pior_ano['total_focos']):,} focos
2. Concentra√ß√£o de {stats_municipio.head(10)['percentual'].sum():.1f}% dos focos nos Top 10 munic√≠pios
3. Padr√£o sazonal evidente: pico entre Julho e Outubro (per√≠odo de seca)
4. {n_clusters} hotspots cr√≠ticos identificados requerem aten√ß√£o especial

RECOMENDA√á√ïES:

CURTO PRAZO:
- Monitoramento 24h nos hotspots identificados
- Brigadas de inc√™ndio nos Top 10 munic√≠pios
- Alerta m√°ximo nos meses de Julho a Outubro

M√âDIO PRAZO:
- Campanhas de educa√ß√£o ambiental
- Infraestrutura de combate nas regi√µes cr√≠ticas
- Parcerias com governos locais

LONGO PRAZO:
- Pol√≠ticas p√∫blicas de preserva√ß√£o
- Sistema de alerta precoce com IA
- Programa de recupera√ß√£o de √°reas degradadas

{'='*80}
FIM DO RELAT√ìRIO
{'='*80}

Relat√≥rio gerado automaticamente pelo Sistema de An√°lise de Queimadas
Tecnologias: Python 3.10+, DuckDB 1.3+, Apache Parquet, GeoPandas
An√°lise realizada em: {datetime.now().strftime('%d/%m/%Y %H:%M:%S')}
"""

# Salvar TXT
txt_file = OUTPUT_DIR / 'reports' / f'relatorio_tecnico_{datetime.now().strftime("%Y%m%d_%H%M%S")}.txt'
with open(txt_file, 'w', encoding='utf-8') as f:
    f.write(txt_report)

print(f"‚úÖ Relat√≥rio TXT: {txt_file}")
print("\n" + txt_report[:2000] + "\n[...]\n")  # Preview

‚úÖ Relat√≥rio TXT: /content/outputs/reports/relatorio_tecnico_20251124_170914.txt


RELAT√ìRIO T√âCNICO DETALHADO - QUEIMADAS NO PANTANAL (2020-2024)

Data de Gera√ß√£o: 24/11/2025 17:09:14
Per√≠odo Analisado: 2020-2024 (5 anos completos)
Fonte de Dados: INPE - Instituto Nacional de Pesquisas Espaciais

1. ESTAT√çSTICAS GERAIS

Total de Focos de Calor.................: 920,327
Per√≠odo de An√°lise......................: 2020-01-01T14:00:00.000000 a 2024-12-31T18:19:00.000000
Munic√≠pios Afetados.....................: 11
Estados Afetados........................: 1
FRP M√©dio (Fire Radiative Power)........: 49.73 MW
FRP M√°ximo..............................: 5339.40 MW
Hotspots Identificados (DBSCAN).........: 1

2. AN√ÅLISE ANUAL DETALHADA


Ano 2020:
  - Total de Focos..................: 234,345
  - FRP M√©dio.......................: 24.43 MW
  - FRP M√°ximo......................: 3161.60 MW
  - Desvio Padr√£o FRP...............: 63.23 MW
  - Munic√≠pios Afetados.............: 10
  - 

## üéØ 9. Sum√°rio Final

In [11]:
print("\n" + "="*80)
print("üéØ AN√ÅLISE COMPLETA CONCLU√çDA")
print("="*80)

print(f"\nüìä Dados Analisados:")
print(f"   - Anos: {len(PARQUET_FILES)} (2020-2024)")
print(f"   - Total de focos: {total_focos:,}")
print(f"   - Munic√≠pios: {municipios}")
print(f"   - Hotspots: {n_clusters}")

print(f"\nüìÅ Arquivos Gerados:")
print(f"   - Parquets: {OUTPUT_DIR / 'parquet'}")
print(f"   - Relat√≥rios: {OUTPUT_DIR / 'reports'}")
print(f"   - Mapas: {OUTPUT_DIR / 'maps'}")
print(f"   - Figuras: {OUTPUT_DIR / 'figures'}")

print(f"\nüìù Relat√≥rios:")
print(f"   - Markdown: {md_file.name}")
print(f"   - TXT: {txt_file.name}")
print(f"   - Mapa HTML: mapa_completo_2020_2024.html")

print(f"\nüìä Visualiza√ß√µes Geradas:")
print(f"   - 8 gr√°ficos interativos (Plotly)")
print(f"   - 1 mapa de calor (Folium)")
print(f"   - 1 an√°lise de clustering espacial")

print("\n" + "="*80)
print("‚úÖ TODOS OS DADOS DE 2020 A 2024 ANALISADOS COM SUCESSO!")
print("="*80 + "\n")

# Fechar DuckDB
con.close()
print("ü¶Ü DuckDB fechado.")


üéØ AN√ÅLISE COMPLETA CONCLU√çDA

üìä Dados Analisados:
   - Anos: 5 (2020-2024)
   - Total de focos: 920,327
   - Munic√≠pios: 11
   - Hotspots: 1

üìÅ Arquivos Gerados:
   - Parquets: /content/outputs/parquet
   - Relat√≥rios: /content/outputs/reports
   - Mapas: /content/outputs/maps
   - Figuras: /content/outputs/figures

üìù Relat√≥rios:
   - Markdown: relatorio_executivo_20251124_170905.md
   - TXT: relatorio_tecnico_20251124_170914.txt
   - Mapa HTML: mapa_completo_2020_2024.html

üìä Visualiza√ß√µes Geradas:
   - 8 gr√°ficos interativos (Plotly)
   - 1 mapa de calor (Folium)
   - 1 an√°lise de clustering espacial

‚úÖ TODOS OS DADOS DE 2020 A 2024 ANALISADOS COM SUCESSO!

ü¶Ü DuckDB fechado.
