## Bloco 1: Importar bibliotecas e carregar dados

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configuração para gráficos aparecerem no notebook
%matplotlib inline

# Carregar dataset corrigido
df = pd.read_csv("../dados/dataset_corrigido.csv")

# Conferir primeiros registros
df.head()

## Bloco 2: Estatísticas descritivas básicas

In [None]:
# Estatísticas das colunas numéricas
df.describe()

## Bloco 3: Histogramas das variáveis numéricas

In [None]:
numericas = ['area_total', 'desmatado', 'vegetacao_natural', 'nao_vegetacao_natural', 'hidrografia']

limites_x = {
    'area_total': 20000,        # km²
    'desmatado': 2000,          # km²
    'vegetacao_natural': 15000, # km²
    'nao_vegetacao_natural': 500, 
    'hidrografia': 500
}

for col in numericas:
    plt.figure(figsize=(8,4))
    plt.hist(df[col], bins=50, color='skyblue', edgecolor='black')
    plt.title(f'Distribuição de {col}')
    plt.xlabel(col)
    plt.ylabel('Número de registros')
    
    # Limitar eixo X se houver limite definido
    if col in limites_x:
        plt.xlim(0, limites_x[col])
    
    plt.show()


## Bloco 4: Distribuição de registros por bioma

In [None]:
df['bioma'].value_counts()

plt.figure(figsize=(8,5))
sns.countplot(data=df, x='bioma', order=df['bioma'].value_counts().index, palette='viridis')
plt.title('Quantidade de registros por bioma')
plt.xlabel('Bioma')
plt.ylabel('Número de registros')
plt.show()

## Bloco 5: Evolução do desmatamento ao longo dos anos

In [None]:
media_desmatamento = df.groupby('ano')['desmatado'].mean()

plt.figure(figsize=(10,5))
plt.plot(media_desmatamento.index, media_desmatamento.values, marker='o', color='red')
plt.title('Média de desmatamento por ano')
plt.xlabel('Ano')
plt.ylabel('Desmatamento médio (km²)')
plt.grid(True)
plt.show()

## Bloco 6: Comparação entre biomas

In [None]:
media_bioma = df.groupby('bioma')['desmatado'].mean().sort_values(ascending=False)
media_bioma

plt.figure(figsize=(8,5))
sns.barplot(x=media_bioma.index, y=media_bioma.values, palette='magma')
plt.title('Média de desmatamento por bioma')
plt.xlabel('Bioma')
plt.ylabel('Desmatamento médio (km²)')
plt.show()

## Bloco 7: Percentuais de área

In [None]:
# Criar colunas percentuais
df['perc_vegetacao'] = df['vegetacao_natural'] / df['area_total'] * 100
df['perc_nao_vegetacao'] = df['nao_vegetacao_natural'] / df['area_total'] * 100
df['perc_hidrografia'] = df['hidrografia'] / df['area_total'] * 100

# Verificar primeiros registros
df[['ano','id_municipio','bioma','perc_vegetacao','perc_nao_vegetacao','perc_hidrografia']].head()

percentuais = ['perc_vegetacao', 'perc_nao_vegetacao', 'perc_hidrografia']

# Limites para visualização (0-100%)
limite_percentual = 100

for col in percentuais:
    plt.figure(figsize=(8,4))
    plt.hist(df[col], bins=50, color='lightgreen', edgecolor='black')
    plt.title(f'Distribuição de {col}')
    plt.xlabel('Percentual (%)')
    plt.ylabel('Número de registros')
    plt.xlim(0, limite_percentual)  # Limite do eixo X
    plt.show()


## Bloco 8: Boxplots de desmatamento por bioma

In [None]:
plt.figure(figsize=(10,6))

# Boxplot do desmatamento por bioma
sns.boxplot(data=df, x='bioma', y='desmatado', palette='pastel')

plt.title('Boxplot de desmatamento por bioma')
plt.xlabel('Bioma')
plt.ylabel('Desmatamento (km²)')

# Limitar eixo Y para facilitar visualização da maioria dos municípios
plt.ylim(0, 2000) 

plt.show()


## Bloco 9: Evolução percentual da vegetação natural

In [None]:
# Calcular média percentual de vegetação natural por ano
media_perc_veg = df.groupby('ano')['perc_vegetacao'].mean()

plt.figure(figsize=(10,5))
plt.plot(media_perc_veg.index, media_perc_veg.values, marker='o', color='green')
plt.title('Média percentual de vegetação natural por ano')
plt.xlabel('Ano')
plt.ylabel('Percentual de vegetação natural (%)')
plt.grid(True)
plt.show()


## Bloco 10: Comparação percentual entre biomas

In [None]:
# Média percentual de vegetação natural por bioma
media_perc_bioma = df.groupby('bioma')['perc_vegetacao'].mean().sort_values(ascending=False)

# Mostrar a tabela
print(media_perc_bioma)

# Gráfico de barras
plt.figure(figsize=(8,5))
sns.barplot(x=media_perc_bioma.index, y=media_perc_bioma.values, palette='Greens')
plt.title('Média percentual de vegetação natural por bioma')
plt.xlabel('Bioma')
plt.ylabel('Percentual médio (%)')
plt.ylim(0, 100)  # Limite do eixo Y
plt.show()