# 📊 Comparativo de Pessoas Sem Instrução - 2016 vs 2023

Este notebook tem como objetivo analisar os dados do IBGE referentes ao percentual de pessoas **sem instrução** no Brasil, comparando os anos de **2016** e **2023**. A análise é feita por estado, considerando todas as regiões do país.

## 🧾 1. Carregando os Dados

In [None]:
import pandas as pd
from pandas import read_excel
import matplotlib.pyplot as plt
import seaborn as sns

# Lendo a planilha e e pulando o cabeçalho
df_2016 = pd.read_excel("nivel_instrucao.xls", sheet_name="2016",skiprows=3)
df_2023 = pd.read_excel("nivel_instrucao.xls", sheet_name="2023", skiprows=3)

# Removendo espaços extras
df_2016.columns = df_2016.columns.str.strip()
df_2023.columns = df_2023.columns.str.strip()

# Renomeando a coluna de regiões
df_2016 = df_2016.rename(columns={"Unnamed: 0": "Regiao_UF"})
df_2023 = df_2023.rename(columns={"Unnamed: 0": "Regiao_UF"})

#Renomeia a coluna "Sem instrução" para incluir o ano (evita conflitos ao juntar os dados)
df_2016 = df_2016.rename(columns={"Sem instrução": "Sem_instrucao_2016"})
df_2023 = df_2023.rename(columns={"Sem instrução": "Sem_instrucao_2023"})

# Remover linhas com dados invalidos
df_2016 = df_2016[df_2016["Regiao_UF"].notna()]
df_2023 = df_2023[df_2023["Regiao_UF"].notna()]

## 🔄 2. Comparando os Dados de 2016 e 2023

In [None]:
# Juntar os dois DataFrame pelas regiões
comparacao = pd.merge(df_2016 [["Regiao_UF", "Sem_instrucao_2016"]], df_2023 [["Regiao_UF", "Sem_instrucao_2023"]], on="Regiao_UF")
print(comparacao.head(10))

# Calcular a diferença de percentual
comparacao["Diferenca_percentual"] = (
    (comparacao["Sem_instrucao_2023"] - comparacao["Sem_instrucao_2016"]) / comparacao["Sem_instrucao_2016"]
) * 100

## 📈 3. Visualização da Diferença Percentual (2016 vs 2023)

In [None]:
# Ordena para facilitar a visualização
comparacao = comparacao.sort_values(by="Diferenca_percentual")

#Exibe os dados
print(comparacao[["Regiao_UF", "Diferenca_percentual"]])

# 9. Cria gráfico
plt.figure(figsize=(12, 8))
sns.barplot(
    data=comparacao,
    x="Diferenca_percentual",
    y="Regiao_UF",
    hue="Regiao_UF",
    palette="coolwarm",
    dodge=False,
    legend=False
)
plt.title("Variação percentual de pessoas sem instrução (2023 vs 2016)")
plt.xlabel("Diferença percentual (%)")
plt.ylabel("Estado")
plt.axvline(x=0, color='gray', linestyle='--', linewidth=1)
plt.tight_layout()
plt.savefig("sem_instrucao_diferenca_percentual.png")
plt.show()

## 📌 Observações

- O estado do **Amapá** apresentou um aumento no percentual de pessoas sem instrução entre 2016 e 2023, mesmo sendo destaque em **ensino superior completo**.
- Estados como **Tocantins** e **Roraima** apresentaram reduções consideráveis.
- O Brasil como um todo também mostrou uma **melhoria geral**, reduzindo o percentual de pessoas sem instrução.

## ✅ Conclusão

Esta análise traz uma visão clara sobre os avanços e retrocessos na educação básica ao longo de 7 anos, e pode servir como base para estudos mais aprofundados sobre políticas públicas e desigualdade regional.