In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import scipy.stats as stats
import os

In [None]:
print("Diretório atual:", os.getcwd())

In [None]:
caminho_dados = 'projeto-anova-enem/dados/MICRODADOS_ENEM_ESCOLA.csv'
caminho_imagens = 'projeto-anova-enem/imagens/'

In [None]:
os.makedirs(caminho_imagens, exist_ok=True)

In [None]:
df = pd.read_csv(caminho_dados, sep=';', encoding='latin1', low_memory=False)

In [None]:
df = df[['TP_DEPENDENCIA_ADM_ESCOLA', 'NU_MEDIA_TOT']].copy()

In [None]:
mapeamento_tipo = {
    1: 'Federal',
    2: 'Estadual',
    3: 'Municipal',
    4: 'Privada'
}
df['TIPO_ESCOLA'] = df['TP_DEPENDENCIA_ADM_ESCOLA'].map(mapeamento_tipo)

In [None]:
df = df.dropna(subset=['NU_MEDIA_TOT', 'TIPO_ESCOLA'])

In [None]:
plt.figure(figsize=(10, 6))
sns.boxplot(x='TIPO_ESCOLA', y='NU_MEDIA_TOT', data=df)
plt.title('Distribuição das Médias do ENEM por Tipo de Escola')
plt.xlabel('Tipo de Escola')
plt.ylabel('Média Geral do ENEM')
plt.savefig(caminho_imagens + 'boxplot-media-geral.png')
plt.close()

In [None]:
federal = df[df['TIPO_ESCOLA'] == 'Federal']['NU_MEDIA_TOT']
estadual = df[df['TIPO_ESCOLA'] == 'Estadual']['NU_MEDIA_TOT']
municipal = df[df['TIPO_ESCOLA'] == 'Municipal']['NU_MEDIA_TOT']
privada = df[df['TIPO_ESCOLA'] == 'Privada']['NU_MEDIA_TOT']

In [None]:
f_stat, p_valor = stats.f_oneway(federal, estadual, municipal, privada)

In [None]:
print("Estatística F:", round(f_stat, 4))
print("Valor-p:", round(p_valor, 4))

In [None]:
resultados = pd.DataFrame({
    'Estatística F': [round(f_stat, 4)],
    'Valor-p': [round(p_valor, 4)]
})
resultados.to_csv('projeto-anova-enem/imagens/resultados-anova.csv', index=False)