In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

sns.set_theme(style="whitegrid", palette="muted", font_scale=1.1)
custom_palette = [
    "#D9ED92",  # verde claro amarelado
    "#B5E48C",  # verde claro
    "#99D98C",  # verde médio
    "#76C893",  # verde esverdeado
    "#52B69A",  # verde-água
    "#34A0A4",  # verde-azulado
    "#168AAD",  # azul esverdeado
    "#1A759F",  # azul médio
    "#1E6091",  # azul escuro
    "#184E77",  # azul bem escuro
    "#134770"   # azul mais
]
plt.style.use("dark_background")
# exam_palette = ["#FFFF00", "#99D98C", "#1A759F"]

Importando base de dados 

In [None]:
df_enem = pd.read_csv("databases/ENEM_2023_FINAL.csv")
display(df_enem)

Definição dos títulos dos eixos para cada variável

In [None]:
titles_dict = {
    "NU_NOTA_CH": {
        "title": "Distribuição da Nota de Ciências Humanas",
        "xlabel": "Nota em Ciências Humanas",
        "ylabel": "Frequência"
    },
    "NU_NOTA_CN": {
        "title": "Distribuição da Nota de Ciências da Natureza",
        "xlabel": "Nota em Ciências da Natureza",
        "ylabel": "Frequência"
    },
    "NU_NOTA_MT": {
        "title": "Distribuição da Nota de Matemática",
        "xlabel": "Nota em Matemática",
        "ylabel": "Frequência"
    },
    "NU_NOTA_LC": {
        "title": "Distribuição da Nota de Linguagens e Códigos",
        "xlabel": "Nota em Linguagens e Códigos",
        "ylabel": "Frequência"
    },
    "NU_NOTA_REDACAO": {
        "title": "Distribuição da Nota de Redação",
        "xlabel": "Nota de Redação",
        "ylabel": "Frequência"
    },
    "EST_IDADE": {
        "title": "Distribuição da Idade dos Participantes",
        "xlabel": "Idade (anos)",
        "ylabel": "Frequência"
    },
    "EST_RENDA_PER_CAP": {
        "title": "Distribuição da Renda Familiar Per Capita",
        "xlabel": "Renda per capita (R$)",
        "ylabel": "Frequência"
    },
    "EST_CELULAR_PER_CAP": {
        "title": "Distribuição de Celulares por Pessoa",
        "xlabel": "Número de celulares por pessoa",
        "ylabel": "Frequência"
    },
    "EST_COMP_PER_CAP": {
        "title": "Distribuição de Computadores por Pessoa",
        "xlabel": "Número de computadores por pessoa",
        "ylabel": "Frequência"
    },
    "EST_VEICULO_PER_CAP": {
        "title": "Distribuição de Veículos por Pessoa",
        "xlabel": "Número de veículos por pessoa",
        "ylabel": "Frequência"
    },
    "EST_ELE_DOM_PER_CAP": {
        "title": "Distribuição de Eletrodomésticos por Pessoa",
        "xlabel": "Número de eletrodomésticos por pessoa",
        "ylabel": "Frequência"
    }
}

Boxplots

In [None]:
grade_cols = ["NU_NOTA_CH", "NU_NOTA_CN", "NU_NOTA_MT", "NU_NOTA_LC", "NU_NOTA_REDACAO", "EST_IDADE", "EST_RENDA_PER_CAP", "EST_CELULAR_PER_CAP","EST_COMP_PER_CAP", "EST_VEICULO_PER_CAP", "EST_ELE_DOM_PER_CAP"]

def plot_single_boxplots(df: pd.DataFrame, cols: list, colors: list, titles:dict):
    for col, color in zip(cols, colors):
        plt.figure(figsize=(6,4))
        sns.boxplot(x=df[col], color=color)   # só uma nota por vez
        plt.title(titles[col]["title"])
        plt.xlabel(titles[col]["xlabel"])

        #Tornar fundo transparente
        # plt.gca().set_facecolor("none")  # Fundo do gráfico
        # plt.gcf().patch.set_alpha(0)      # Fundo da figura

        # Salvar com transparência
        plt.savefig(f"images/boxplot/{col}.png", transparent=False, dpi=300)
        plt.show()

# Chamada
plot_single_boxplots(df_enem, grade_cols, custom_palette, titles_dict)

Histogramas

In [None]:
grade_cols = ["NU_NOTA_CH", "NU_NOTA_CN", "NU_NOTA_MT", "NU_NOTA_LC", "NU_NOTA_REDACAO", "EST_IDADE", "EST_RENDA_PER_CAP", "EST_CELULAR_PER_CAP","EST_COMP_PER_CAP", "EST_VEICULO_PER_CAP", "EST_ELE_DOM_PER_CAP"]

def plot_single_histograms(df: pd.DataFrame, cols: list[str], colors: list[str], titles:dict):
    for col, color in zip(cols, colors):
        plt.figure(figsize=(6,4))
        sns.histplot(data=df, x=col, kde=True, color=color, edgecolor="white")
        plt.title(titles[col]["title"])
        plt.xlabel(titles[col]["xlabel"])
        plt.ylabel(titles[col]["ylabel"])

        # fundo transparente
        # plt.gca().set_facecolor("none")  # área do gráfico
        # plt.gcf().patch.set_alpha(0)     # figura inteira

        # salva com fundo transparente
        plt.savefig(f"images/histogram/{col}.png", transparent=False, dpi=300)
        plt.show()

plot_single_histograms(df_enem, grade_cols, custom_palette, titles_dict)