## Comandos de configuração do ambiente Jupiter - IDE[VS Code]

#### Linux (Ubuntu 24.04)
**criando o ambiente virtual:**

`python3 -m venv venv`

**baixando dependências do projeto:**

`pip install -r requirements.txt`

# Importando Pacotes

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
plt.ion()

# Acessando Base de Dados

Os dados apresentados foram retirados do site https://terrabrasilis.dpi.inpe.br/ e a base pode ser obtida através do link abaixo:

`https://terrabrasilis.dpi.inpe.br/queimadas/bdqueimadas/#exportar-dados`

**Sobre a base:**
A base contém dados referente aos primeiros 05 dias do mês setembro contendo todos os estados brasileiros. O objetivo é transformar as informações sobre focos de fogo em um dado de valor, priorizando fidelidade e clareza, permitindo assim uma análise criteriosa e tomadas de deciões mais acertivas. (Base possui 60MB aproximadamente)

</br>

#
**DADOS:**
- Data e Hora
- Satélite que registrou o foco
- País (No nosso caso todos os dados são referentes ao Brasil)
- Estado
- Município
- Bioma
- Dias sem chuva
- Precipitação
- Risco de fogo
- Latitude
- Longitude
- FRP (“Fire Radiative Power”, mede a energia radiante liberada por unidade de tempo, associada à taxa de queima da vegetação, em MW - megawatts)

In [2]:
df = pd.read_csv('./queimadas_dataset.csv')

# Higienizando e Organizando os dados

In [None]:
# Mudando para datetype
df['DataHora'] = pd.to_datetime(df['DataHora'])

# Eliminando linhas onde há dados NaN, presentes em alguma das colunas definidas
df = df.dropna(subset=['Precipitacao', 'RiscoFogo', 'FRP'])

# Ordenando o dataframe por estado e municipio
df_ordenado_estado = df.sort_values(by=['Estado', 'Municipio'])
print(df_ordenado_estado)

In [None]:
# Dados AMAZONAS
total_am = len(df[df['Estado'] == 'AMAZONAS'])

# Dados SUDESTE
total_sudeste = len(df[(df['Estado'] == 'RIO DE JANEIRO') | (df['Estado'] == 'ESPÍRITO SANTO') | (df['Estado'] == 'SÃO PAULO') | (df['Estado'] == 'MINAS GERAIS')])

# Montando Torta
data_sudeste_am = [total_am, total_sudeste]
def to_pie(regiao, estados):
    total = int(np.round(regiao/100.*np.sum(estados)))
    return f"{regiao:.1f}%"

plt.pie(
    data_sudeste_am, 
    labels=[f"AMAZONAS | {total_am}", f"SUDESTE | {total_sudeste}"], 
    colors=['green', 'blue'], 
    autopct=lambda estado: to_pie(estado, data_sudeste_am), 
    startangle=90, 
    explode=[0, 0.1], 
    shadow=True, 
    textprops={"color": "w"}
)
plt.title("Sudeste | Amazonas")
plt.legend(
    loc='upper left', 
    bbox_to_anchor=(-0.2, -0.1, 0.5, 1)
)
plt.axis('equal')
plt.show()

# Organizando os estados de maior precipitação de chuva para o menor

In [6]:
# import pandas as pd
# import matplotlib.pyplot as plt
# import numpy as np
# plt.ion()

# df = pd.read_csv('./queimadas_dataset.csv')
# precipitation_by_municipality = df.groupby('Estado')['Precipitacao'].sum()

# precipitation_by_municipality = precipitation_by_municipality.sort_values(ascending=False)

# plt.figure(figsize=(10, 6))
# plt.scatter(precipitation_by_municipality.index, precipitation_by_municipality.values)

# plt.title('Estados com Maior Precipitação')
# plt.xlabel('Estados')
# plt.ylabel('Precipitação (mm)')
# plt.xticks(rotation=90)

# plt.tight_layout()
# plt.show()

# Média de estados com maior precipitação 

In [7]:
# import pandas as pd
# import matplotlib.pyplot as plt
# import seaborn as sns

# df = pd.read_csv('./queimadas_dataset.csv')

# mean_precipitation_by_state = df.groupby('Estado')['Precipitacao'].mean()

# plt.figure(figsize=(10, 6))
# plt.hist(mean_precipitation_by_state, bins=20, label='Média de Precipitação por Estado', edgecolor='k')

# plt.vlines(mean_precipitation_by_state.mean(), 0, plt.ylim()[1], label='Média Geral', colors='r', linestyles='dashed')

# plt.xlabel('Média de Precipitação (mm)')
# plt.ylabel('Frequência')
# plt.title('Distribuição da Média de Precipitação por Estado')
# plt.legend()

# sns.despine()

# plt.tight_layout()
# plt.show()

In [8]:
# import pandas as pd
# import matplotlib.pyplot as plt
# import seaborn as sns

# df = pd.read_csv('./queimadas_dataset.csv')
# mean_precipitation_by_state = df.groupby('Estado')['Precipitacao'].mean()

# plt.figure(figsize=(10, 6))
# plt.hist(mean_precipitation_by_state, bins=20, label='Média de Precipitação por Estado', edgecolor='k')

# plt.vlines(mean_precipitation_by_state.mean(), 0, plt.ylim()[1], label='Média Geral', color='blue')

# plt.vlines(mean_precipitation_by_state.median(), 0, plt.ylim()[1], linestyles='--', label='Mediana geral', color='red')

# plt.xlabel('Média de Precipitação (mm)')
# plt.ylabel('Frequência')
# plt.title('Distribuição da Médiana de Precipitação por Estado')

# plt.legend()

# sns.despine()

# plt.tight_layout()
# plt.show()

# Estados com menos dias de chuva para o com mais dias de chuva

In [9]:
# import pandas as pd
# import matplotlib.pyplot as plt
# import numpy as np
# plt.ion()

# df = pd.read_csv('./queimadas_dataset.csv')
# precipitation_by_municipality = df.groupby('Estado')['DiaSemChuva'].sum()

# precipitation_by_municipality = precipitation_by_municipality.sort_values(ascending=False)

# plt.figure(figsize=(10, 6))
# plt.scatter(precipitation_by_municipality.index, precipitation_by_municipality.values)

# plt.title('Estados com mais dias de chuva')
# plt.xlabel('Municípios')
# plt.ylabel('Precipitação (mm)')
# plt.xticks(rotation=90)

# plt.tight_layout()
# plt.show()

# Estados com maior número de focos

In [None]:
# Organizando um novo dataframe que tem como produto o Estado e o número de focos
total_de_focos_estado = df.groupby(['Estado']).size().reset_index(name='FocosIncendio')


# Validar número de focos (comparar com o número de linhas retornado na higienização)
# np.sum(total_de_focos_estado['FocosIncendio'])

# Obtendo apenas estados com mais de 20000 focos registrados
total_de_focos_estado = total_de_focos_estado[total_de_focos_estado['FocosIncendio'] >= 20000]

# Criando grafico de barras
fig, ax = plt.subplots(figsize=(16, 6))
ax.bar(total_de_focos_estado['Estado'], total_de_focos_estado['FocosIncendio'], width=0.9)
ax.set_ylabel('Focos Registrados')
ax.set_title('Estados com mais de 20000 focos registrados')

plt.show()

# Evolução do número de focos por dia na região Sudeste

In [None]:
# Organizando um novo dataframe que tem como produto o Estado e o número de focos
sudeste = df[(df['Estado'] == 'RIO DE JANEIRO') | (df['Estado'] == 'ESPÍRITO SANTO') | (df['Estado'] == 'SÃO PAULO') | (df['Estado'] == 'MINAS GERAIS')]
total_de_focos_sudeste = sudeste.groupby([sudeste['DataHora'].dt.date, 'Estado']).size().reset_index(name='FocosIncendio')
total_de_focos_sudeste = total_de_focos_sudeste.sort_values(by=['Estado', 'DataHora'])

fig, ax = plt.subplots(figsize=(16, 6))

# Iterar sobre os estados e plotar cada linha com configurações personalizadas
for estado in total_de_focos_sudeste['Estado'].unique():
    dados_estado = total_de_focos_sudeste[total_de_focos_sudeste['Estado'] == estado]
    ax.plot(dados_estado['DataHora'], dados_estado['FocosIncendio'], label=estado, marker='o')

# Configurar o gráfico
ax.set_xlabel('Data e Hora')
ax.set_ylabel('Número de Focos de Incêndio')
ax.set_title('Evolução de Focos de Incêndio por Estado - Sudeste')
ax.legend()

plt.show()

# Bioma predominante Minas Gerais

OBS: A Caatinga está presente apenas na parte norte do estado, divisa com o estado da BAHIA.

In [None]:
# Monatando Data Frame MINAS GERAIS
df_mg = df[df['Estado'] == 'MINAS GERAIS'].groupby(['Bioma']).size().reset_index(name='FocosIncendio')
df_mg = df_mg.sort_values(by=['Bioma'])
df_mg

# Montando Torta
explode = [0.05] * len(df_mg)
plt.pie(
    df_mg['FocosIncendio'],
    startangle=90, 
    explode=explode, 
    shadow=True, 
    autopct='%1.1f%%'
)
plt.title("Percentual de focos por BIOMA | MG")
plt.legend(
    labels=df_mg['Bioma'], 
    loc='upper left', 
    bbox_to_anchor=(-0.2, -0.1, 0.5, 1)
)
plt.axis('equal')  # Garante que o gráfico seja circular
plt.tight_layout()
plt.show()

# Biomas do RJ e ES

In [None]:
# Monatando Data Frame RIO DE JANEIRO
df_rj_es = df[(df['Estado'] == 'RIO DE JANEIRO') | (df['Estado'] == 'ESPÍRITO SANTO')].groupby(['Bioma']).size().reset_index(name='FocosIncendio')
df_rj_es = df_rj_es.sort_values(by=['Bioma'])

# Montando Torta
explode = [0.01] * len(df_rj_es)
plt.pie(
    df_rj_es['FocosIncendio'],
    startangle=90, 
    explode=explode, 
    shadow=True, 
    autopct='%1.1f%%'
)
plt.title("Percentual de focos por BIOMA | RJ ES")
plt.legend(
    labels=df_rj_es['Bioma'], 
    loc='upper left', 
    bbox_to_anchor=(-0.2, -0.1, 0.5, 1)
)
plt.axis('equal')  # Garante que o gráfico seja circular
plt.tight_layout()
plt.show()

# Biomas de São Paulo

In [None]:
# Monatando Data Frame MINAS GERAIS
df_sp = df[df['Estado'] == 'SÃO PAULO'].groupby(['Bioma']).size().reset_index(name='FocosIncendio')
df_sp = df_sp.sort_values(by=['Bioma'])
df_sp

# Montando Torta
explode = [0.05] * len(df_sp)
plt.pie(
    df_sp['FocosIncendio'],
    startangle=90, 
    explode=explode, 
    shadow=True, 
    autopct='%1.1f%%'
)
plt.title("Percentual de focos por BIOMA | MG")
plt.legend(
    labels=df_sp['Bioma'], 
    loc='upper left', 
    bbox_to_anchor=(-0.2, -0.1, 0.5, 1)
)
plt.axis('equal')  # Garante que o gráfico seja circular
plt.tight_layout()
plt.show()

# Precipitação de Chuva por Estado região Sudeste

In [None]:
# Pegando dados da região sudeste
sudeste = ['MINAS GERAIS', 'SÃO PAULO', 'RIO DE JANEIRO', 'ESPÍRITO SANTO']
df_sudeste = df[df['Estado'].isin(sudeste)]
precip_media_sudeste = df_sudeste.groupby('Estado')['Precipitacao'].mean().reset_index()

# Montando gráfico de barras
plt.figure(figsize=(8, 6))
plt.bar(precip_media_sudeste['Estado'], precip_media_sudeste['Precipitacao'], color='blue')
plt.title('Precipitação Média por Estado na Região Sudeste')
plt.xlabel('Estado')
plt.ylabel('Precipitação Média (mm)')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# Relação entre Bioma e Precipitação Média

In [None]:
# Pegando dados da região sudeste
sudeste = ['MINAS GERAIS', 'SÃO PAULO', 'RIO DE JANEIRO', 'ESPÍRITO SANTO']
df_sudeste = df[df['Estado'].isin(sudeste)]
precip_media_bioma = df_sudeste.groupby('Bioma')['Precipitacao'].mean().reset_index()

# Montando gráfico de barras para a precipitação média por bioma
plt.figure(figsize=(8, 6))
plt.bar(precip_media_bioma['Bioma'], precip_media_bioma['Precipitacao'], color=['green', 'brown'])
plt.title('Precipitação Média por Bioma na Região Sudeste')
plt.xlabel('Bioma')
plt.ylabel('Precipitação Média (mm)')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

