In [24]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from fpdf import FPDF

# 1 Carregar os dados

In [25]:
# Carregar os dados do arquivo CSV
df = pd.read_csv('./ProuniRelatorioDadosAbertos2020.csv', sep=';', encoding='latin1')

In [26]:
# Explorar os dados
print(df.head())
print(df.info())
print(df.describe())

# Limpar os dados, se necessário
df.dropna(inplace=True)  

   ANO_CONCESSAO_BOLSA  CODIGO_EMEC_IES_BOLSA                NOME_IES_BOLSA  \
0                 2020                    322         UNIVERSIDADE PAULISTA   
1                 2020                    163    UNIVERSIDADE ESTÁCIO DE SÁ   
2                 2020                  17670     FACULDADE DE QUIXERAMOBIM   
3                 2020                    203  UNIVERSIDADE SÃO JUDAS TADEU   
4                 2020                    203  UNIVERSIDADE SÃO JUDAS TADEU   

      MUNICIPIO                            CAMPUS TIPO_BOLSA  \
0      IPATINGA                          IPATINGA   INTEGRAL   
1     FORTALEZA               EAD VIA CORPVS - CE   INTEGRAL   
2  QUIXERAMOBIM  FACULDADE DE QUIXERAMOBIM - UNIQ   INTEGRAL   
3     SAO PAULO                          PAULISTA    PARCIAL   
4     SAO PAULO                          PAULISTA   INTEGRAL   

  MODALIDADE_ENSINO_BOLSA NOME_CURSO_BOLSA NOME_TURNO_CURSO_BOLSA  \
0                     EAD        PEDAGOGIA      CURSO A DISTÂNCIA   
1 

# 2. Análise Interseccional

In [27]:
# Exemplo de análise interseccional
result = df.groupby(['SEXO_BENEFICIARIO', 'RACA_BENEFICIARIO']).size().reset_index(name='Contagem')
print(result)


   SEXO_BENEFICIARIO RACA_BENEFICIARIO  Contagem
0                  F           Amarela      1960
1                  F            Branca     39666
2                  F          Ind¡gena       102
3                  F     Não Informada        49
4                  F             Parda     46946
5                  F             Preta     12394
6                  M           Amarela       940
7                  M            Branca     24797
8                  M          Ind¡gena        51
9                  M     Não Informada        19
10                 M             Parda     31111
11                 M             Preta      8757


# 3. Visualização dos Dados

In [30]:
# Criação de gráfico
plt.figure(figsize=(10, 6))
sns.countplot(data=df, x='SEXO_BENEFICIARIO', hue='RACA_BENEFICIARIO')
plt.title('Distribuição Interseccional de Gênero e Raça')

# Salvar o gráfico como imagem
plt.savefig('grafico_interseccional.png')
plt.close()

# 4. Gerar Relatório em PDF

In [33]:
class PDF(FPDF):
    def header(self):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, 'Relatório de Análise Interseccional', 0, 1, 'C')

    def footer(self):
        self.set_y(-15)
        self.set_font('Arial', 'I', 8)
        self.cell(0, 10, f'Page {self.page_no()}', 0, 0, 'C')

    def chapter_title(self, title):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, title, 0, 1, 'L')
        self.ln(10)

    def chapter_body(self, body):
        self.set_font('Arial', '', 12)
        self.multi_cell(0, 10, body)
        self.ln()

# Criar o PDF
pdf = PDF()
pdf.add_page()

# Adicionar Título do Relatório
pdf.chapter_title('Análise Interseccional de Dados')

# Adicionar o conteúdo da análise
texto_analise = (
    "Este relatório apresenta uma análise interseccional dos dados do Prouni "
    "para o ano de 2020. A análise considera diferentes variáveis como gênero e raça, "
    "visando identificar padrões e tendências."
)

pdf.chapter_body(texto_analise)

# Adicionar Resultados da Análise
pdf.chapter_title('Resultados da Análise')

# Adicionar gráfico
pdf.image('grafico_interseccional.png', x=10, y=None, w=180)

# Salvar o PDF
pdf.output('relatorio_interseccional_completo.pdf')

''