# üìä Comparativo de Pessoas Sem Instru√ß√£o - 2016 vs 2023

Este notebook tem como objetivo analisar os dados do IBGE referentes ao percentual de pessoas **sem instru√ß√£o** no Brasil, comparando os anos de **2016** e **2023**. A an√°lise √© feita por estado, considerando todas as regi√µes do pa√≠s.

## üßæ 1. Carregando os Dados

In [None]:
import pandas as pd
from pandas import read_excel
import matplotlib.pyplot as plt
import seaborn as sns

# Lendo a planilha e e pulando o cabe√ßalho
df_2016 = pd.read_excel("nivel_instrucao.xls", sheet_name="2016",skiprows=3)
df_2023 = pd.read_excel("nivel_instrucao.xls", sheet_name="2023", skiprows=3)

# Removendo espa√ßos extras
df_2016.columns = df_2016.columns.str.strip()
df_2023.columns = df_2023.columns.str.strip()

# Renomeando a coluna de regi√µes
df_2016 = df_2016.rename(columns={"Unnamed: 0": "Regiao_UF"})
df_2023 = df_2023.rename(columns={"Unnamed: 0": "Regiao_UF"})

#Renomeia a coluna "Sem instru√ß√£o" para incluir o ano (evita conflitos ao juntar os dados)
df_2016 = df_2016.rename(columns={"Sem instru√ß√£o": "Sem_instrucao_2016"})
df_2023 = df_2023.rename(columns={"Sem instru√ß√£o": "Sem_instrucao_2023"})

# Remover linhas com dados invalidos
df_2016 = df_2016[df_2016["Regiao_UF"].notna()]
df_2023 = df_2023[df_2023["Regiao_UF"].notna()]

## üîÑ 2. Comparando os Dados de 2016 e 2023

In [None]:
# Juntar os dois DataFrame pelas regi√µes
comparacao = pd.merge(df_2016 [["Regiao_UF", "Sem_instrucao_2016"]], df_2023 [["Regiao_UF", "Sem_instrucao_2023"]], on="Regiao_UF")
print(comparacao.head(10))

# Calcular a diferen√ßa de percentual
comparacao["Diferenca_percentual"] = (
    (comparacao["Sem_instrucao_2023"] - comparacao["Sem_instrucao_2016"]) / comparacao["Sem_instrucao_2016"]
) * 100

## üìà 3. Visualiza√ß√£o da Diferen√ßa Percentual (2016 vs 2023)

In [None]:
# Ordena para facilitar a visualiza√ß√£o
comparacao = comparacao.sort_values(by="Diferenca_percentual")

#Exibe os dados
print(comparacao[["Regiao_UF", "Diferenca_percentual"]])

# 9. Cria gr√°fico
plt.figure(figsize=(12, 8))
sns.barplot(
    data=comparacao,
    x="Diferenca_percentual",
    y="Regiao_UF",
    hue="Regiao_UF",
    palette="coolwarm",
    dodge=False,
    legend=False
)
plt.title("Varia√ß√£o percentual de pessoas sem instru√ß√£o (2023 vs 2016)")
plt.xlabel("Diferen√ßa percentual (%)")
plt.ylabel("Estado")
plt.axvline(x=0, color='gray', linestyle='--', linewidth=1)
plt.tight_layout()
plt.savefig("sem_instrucao_diferenca_percentual.png")
plt.show()

## üìå Observa√ß√µes

- O estado do **Amap√°** apresentou um aumento no percentual de pessoas sem instru√ß√£o entre 2016 e 2023, mesmo sendo destaque em **ensino superior completo**.
- Estados como **Tocantins** e **Roraima** apresentaram redu√ß√µes consider√°veis.
- O Brasil como um todo tamb√©m mostrou uma **melhoria geral**, reduzindo o percentual de pessoas sem instru√ß√£o.

## ‚úÖ Conclus√£o

Esta an√°lise traz uma vis√£o clara sobre os avan√ßos e retrocessos na educa√ß√£o b√°sica ao longo de 7 anos, e pode servir como base para estudos mais aprofundados sobre pol√≠ticas p√∫blicas e desigualdade regional.