In [6]:
import pandas as pd
import matplotlib.pyplot as plt
from fpdf import FPDF

# Carregar os dados

In [7]:
df = pd.read_csv('./ProuniRelatorioDadosAbertos2020.csv', sep=';', encoding='latin1')

# Definir cursos de maior e menor prestígio

In [8]:
cursos_maior_prestigio = ['Medicina', 'Direito', 'Engenharia', 'Odontologia']
cursos_menor_prestigio = ['Pedagogia', 'Letras', 'Serviço Social', 'Licenciatura']

In [11]:
# Filtrar dados
df_maior_prestigio = df[df['NOME_CURSO_BOLSA'].str.contains('|'.join(cursos_maior_prestigio), case=False, na=False)]
grupo_maior_prestigio = df_maior_prestigio.groupby('RACA_BENEFICIARIO').size().reset_index(name='Quantidade')

df_menor_prestigio = df[df['NOME_CURSO_BOLSA'].str.contains('|'.join(cursos_menor_prestigio), case=False, na=False)]
grupo_menor_prestigio = df_menor_prestigio.groupby('RACA_BENEFICIARIO').size().reset_index(name='Quantidade')

# Criar gráficos
fig, ax = plt.subplots(1, 2, figsize=(14, 6))

# Gráfico de barras para cursos de maior prestígio
ax[0].bar(grupo_maior_prestigio['RACA_BENEFICIARIO'], grupo_maior_prestigio['Quantidade'], color='teal')
ax[0].set_title('Distribuição por Cor/Raça\nCursos de Maior Prestígio: Medicina, Direito, Engenharia, Odontologia')
ax[0].set_ylabel('Número de Alunos')
ax[0].set_xlabel('Cor/Raça')

# Adicionar os valores em cima das barras para cursos de maior prestígio
for i, valor in enumerate(grupo_maior_prestigio['Quantidade']):
    ax[0].text(i, valor + 200, str(valor), ha='center')

# Gráfico de barras para cursos de menor prestígio
ax[1].bar(grupo_menor_prestigio['RACA_BENEFICIARIO'], grupo_menor_prestigio['Quantidade'], color='orange')
ax[1].set_title('Distribuição por Cor/Raça\nCursos de Menor Prestígio: Pedagogia, Letras, Serviço Social, Licenciatura')
ax[1].set_ylabel('Número de Alunos')
ax[1].set_xlabel('Cor/Raça')

# Adicionar os valores em cima das barras para cursos de menor prestígio
for i, valor in enumerate(grupo_menor_prestigio['Quantidade']):
    ax[1].text(i, valor + 100, str(valor), ha='center')

plt.tight_layout()

# Salvar o gráfico como imagem
image_path = 'grafico_distribuicao_com_valores.png'
plt.savefig(image_path)
plt.close()

# Criar o PDF
pdf = FPDF()
pdf.add_page()
pdf.set_font("Arial", size=12)

# Adicionar título
pdf.set_font("Arial", 'B', 16)
pdf.cell(200, 10, txt="Análise de Distribuição por Cor/Raça em Cursos de Prestígio", ln=True, align='C')

# Adicionar explicações
pdf.set_font("Arial", size=12)
pdf.ln(10)  # Espaçamento

pdf.multi_cell(0, 10, (
    "Este relatório apresenta uma análise da distribuição por cor/raça dos alunos em cursos de maior e menor prestígio "
    "com base nos dados de bolsas de estudos. Os cursos considerados de maior prestígio incluem Medicina, Direito, Engenharia "
    "e Odontologia, enquanto os cursos de menor prestígio incluem Pedagogia, Letras, Serviço Social e Licenciatura.\n\n"
    "O primeiro gráfico mostra a distribuição por cor/raça para os cursos de maior prestígio. A análise revela a concentração "
    "de alunos em diferentes categorias raciais nesses cursos.\n\n"
    "O segundo gráfico exibe a distribuição por cor/raça para os cursos de menor prestígio, proporcionando uma comparação com "
    "os cursos de maior prestígio e ajudando a identificar possíveis disparidades na distribuição racial.\n\n"
    "Os gráficos fornecem uma visão visual dos dados e podem ser úteis para discutir questões de equidade e acessibilidade em "
    "educação superior."
))

# Adicionar imagem do gráfico
pdf.ln(10)  # Espaçamento
try:
    pdf.image(image_path, x=10, y=pdf.get_y(), w=180)
except Exception as e:
    print(f"Erro ao adicionar imagem ao PDF: {e}")

# Salvar o PDF
pdf_output_path = 'relatorio_distribuicao.pdf'
try:
    pdf.output(pdf_output_path)
    print(f"Gráfico salvo como {image_path} e PDF criado como {pdf_output_path}.")
except Exception as e:
    print(f"Erro ao criar o PDF: {e}")


Gráfico salvo como grafico_distribuicao_com_valores.png e PDF criado como relatorio_distribuicao.pdf.
