In [4]:
import pandas as pd
import matplotlib.pyplot as plt
from fpdf import FPDF
import os

# Carregar o CSV em um DataFrame
df = pd.read_csv('PDA_Lista_Instituicoes_Ensino_Superior_do_Brasil_EMEC.csv')

# Exibir informações iniciais do DataFrame
print(df.head())
print(df.describe())
print(df.info())

# Análise da distribuição das Instituições de Ensino por Estado (UF)
instituicoes_por_estado = df['UF'].value_counts()

# Gráfico de barras: Distribuição de Instituições por Estado
plt.figure(figsize=(10, 6))
instituicoes_por_estado.plot(kind='bar', color='skyblue')
plt.xlabel('Estado')
plt.ylabel('Número de Instituições')
plt.title('Distribuição de Instituições por Estado')
plt.savefig('instituicoes_por_estado_bar.png', bbox_inches='tight')
plt.close()

# Gráfico de pizza: Distribuição das 12 principais UF por número de Instituições
instituicoes_por_estado_top12 = df['UF'].value_counts().nlargest(12)
plt.figure(figsize=(10, 6))
instituicoes_por_estado_top12.plot(kind='pie', autopct='%1.1f%%', colors=plt.cm.Paired.colors)
plt.title('Distribuição de Instituições por Estado (Top 12)')
plt.savefig('instituicoes_por_estado_pie.png', bbox_inches='tight')
plt.close()

# Gráfico de barras: Distribuição de Bolsas por Estado
bolsas_por_estado = df['UF'].value_counts()  # Aqui você deve substituir pela coluna correta que representa as bolsas
plt.figure(figsize=(10, 6))
bolsas_por_estado.plot(kind='bar', color='lightgreen')
plt.xlabel('Estado')
plt.ylabel('Número de Bolsas')
plt.title('Distribuição de Bolsas por Estado')
plt.savefig('bolsas_por_estado_bar.png', bbox_inches='tight')
plt.close()

# Define o nome e caminho do arquivo PDF
output_path = os.path.expanduser("~/Downloads/relatorio_instituicoes_ensino_superior.pdf")

# Criação do PDF
pdf = FPDF()
pdf.set_auto_page_break(auto=True, margin=15)

# Adiciona uma página com imagem de fundo
pdf.add_page()
pdf.image('image.jpg', x=0, y=0, w=210, h=297)


# Gráfico de Barras no PDF
pdf.add_page()
pdf.set_font('Arial', 'B', 16)
pdf.cell(0, 10, 'Distribuição de Instituições por Estado', ln=True, align='C')
pdf.image('instituicoes_por_estado_bar.png', x=10, y=20, w=180)

# Gráfico de Pizza no PDF
pdf.add_page()
pdf.set_font('Arial', 'B', 16)
pdf.cell(0, 10, 'Distribuição de Instituições por Estado (Top 12)', ln=True, align='C')
pdf.image('instituicoes_por_estado_pie.png', x=10, y=20, w=180)

# Gráfico de Bolsas por Estado no PDF
pdf.add_page()
pdf.set_font('Arial', 'B', 16)
pdf.cell(0, 10, 'Distribuição de Bolsas por Estado', ln=True, align='C')
pdf.image('bolsas_por_estado_bar.png', x=10, y=20, w=180)


# Gráfico de IDH por Estado no PDF (Se disponível)
pdf.add_page()
pdf.set_font('Arial', 'B', 16)
pdf.cell(0, 10, 'Distribuição de IDH por Estado', ln=True, align='C')
pdf.image('idh_barras.png', x=10, y=20, w=180)

# Adicionar texto explicativo ao PDF
pdf.add_page()
pdf.set_font('Arial', '', 12)
texto_explicativo = """
A análise dos dados de instituições de ensino superior no Brasil revela uma clara desigualdade na distribuição
dessas instituições entre os estados. Regiões mais desenvolvidas, como Sudeste e Sul, concentram a maior parte
das instituições, enquanto estados das regiões Norte e Nordeste apresentam menor quantidade.

Essa disparidade reflete diretamente na desigualdade de acesso à educação superior de qualidade no país.
A distribuição desigual de instituições, juntamente com a concentração de recursos e oportunidades nas regiões
mais ricas, agrava a desigualdade educacional, limitando o desenvolvimento de talentos e a ascensão social
nas regiões menos favorecidas.

Essas desigualdades na distribuição das instituições e das bolsas de estudo também afetam a mobilidade estudantil,
com muitos alunos de regiões periféricas precisando migrar para centros urbanos maiores para obter uma educação de
qualidade, o que nem sempre é viável. Esse cenário contribui para a perpetuação das desigualdades sociais e econômicas
no Brasil.
"""

pdf.multi_cell(0, 10, texto_explicativo)

# Salvar o PDF
try:
    pdf.output(output_path, 'F')
    print(f"Relatório PDF gerado com sucesso em: {output_path}")
except PermissionError:
    print(f"Erro: Não foi possível salvar o PDF em {output_path}. Verifique as permissões ou se o arquivo está aberto.")


   CODIGO_DA_IES                                        NOME_DA_IES  \
0          21995             Faculdade de Tecnologia Senac Curitiba   
1           1768                         FACULDADE REGIONAL SERRANA   
2           5701                    UNIVERSIDADE DO ESTADO DO AMAPÁ   
3          23261       Faculdade São Judas de São Bernardo do Campo   
4           4250  FACULDADE DE CIÊNCIAS GERENCIAIS ALVES FORTES ...   

           SIGLA CATEGORIA_DA_IES COMUNITARIA CONFESSIONAL FILANTROPICA  \
0            NaN          Privada           N            N            N   
1         FUNPAC          Privada           N            N            N   
2           UEAP          Pública           N            N            N   
3            NaN          Privada           N            N            N   
4  FACE ALFOR JF          Privada           N            N            N   

  ORGANIZACAO_ACADEMICA  CODIGO_MUNICIPIO_IBGE                MUNICIPIO  UF  \
0             Faculdade              410690

  pdf.set_font('Arial', 'B', 16)
  pdf.cell(0, 10, 'Distribuição de Instituições por Estado', ln=True, align='C')
  pdf.set_font('Arial', 'B', 16)
  pdf.cell(0, 10, 'Distribuição de Instituições por Estado (Top 12)', ln=True, align='C')
  pdf.set_font('Arial', 'B', 16)
  pdf.cell(0, 10, 'Distribuição de Bolsas por Estado', ln=True, align='C')
  pdf.set_font('Arial', 'B', 16)
  pdf.cell(0, 10, 'Distribuição de IDH por Estado', ln=True, align='C')


Relatório PDF gerado com sucesso em: C:\Users\anaca/Downloads/relatorio_instituicoes_ensino_superior.pdf


  pdf.set_font('Arial', '', 12)
  pdf.output(output_path, 'F')
