# 📊 Análise Exploratória de Dados do ENEM (Simulado)

Este notebook realiza uma análise exploratória dos dados simulados do ENEM 2022, incluindo estatísticas descritivas e visualizações gráficas com Seaborn e Plotly.

In [None]:
# 📁 Carregando os dados
import pandas as pd

# Suba o arquivo CSV gerado (enem2022_fake.csv) no ambiente do Colab ou local
df = pd.read_csv("enem2022_fake.csv")
df.head()

## 📈 Estatísticas Descritivas

In [None]:
# Estatísticas descritivas das variáveis numéricas
df.describe()

## 📊 Distribuição da nota de matemática por sexo

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

sns.boxplot(data=df, x='TP_SEXO', y='NU_NOTA_MT')
plt.title('Distribuição da nota de matemática por sexo')
plt.show()

## 📦 Nota de Redação por Faixa de Renda

In [None]:
import plotly.express as px

# Dicionário de faixas de renda (Q006)
renda_dict = {
    'A': 'Nenhuma renda', 'B': 'Até R$ 998,00',
    'C': 'R$ 998,01 a R$ 1.497,00', 'D': 'R$ 1.497,01 a R$ 1.996,00',
    'E': 'R$ 1.996,01 a R$ 2.495,00', 'F': 'R$ 2.495,01 a R$ 2.994,00',
    'G': 'R$ 2.994,01 a R$ 3.992,00', 'H': 'R$ 3.992,01 a R$ 4.990,00',
    'I': 'R$ 4.990,01 a R$ 5.988,00', 'J': 'R$ 5.988,01 a R$ 6.986,00',
    'K': 'R$ 6.986,01 a R$ 7.984,00', 'L': 'R$ 7.984,01 a R$ 8.982,00',
    'M': 'Mais de R$ 8.982,00'
}

df['Q006_DESC'] = df['Q006'].map(renda_dict)

fig = px.box(df, x='Q006_DESC', y='NU_NOTA_REDACAO',
             title='Nota de Redação por Faixa de Renda',
             labels={'Q006_DESC': 'Faixa de Renda', 'NU_NOTA_REDACAO': 'Nota Redação'})
fig.update_layout(xaxis_tickangle=-45)
fig.show()