In [3]:
import pandas as pd

try:
    df = pd.read_csv("./Iniciação_Ciêntifica - Dados Abertos.csv", encoding='latin1', engine='python', sep=';')

    # Remover linhas duplicadas
    df = df.drop_duplicates()

    # Analisar os dados
    discentes = df['DiscenteID'].nunique()
    projetos_unicos = df['Codigo_Projeto'].nunique()
    orientadores = df['OrientadorID'].nunique()
    departamentos = df['Unidade'].nunique()

    # Assumindo que projetos voluntários são aqueles com 'Tipo_de_bolsa' igual a 'VOLUNTÁRIO'
    projetos_voluntario = df[df['Tipo_de_bolsa'] == 'VOLUNTÁRIO'].shape[0]
    projetos_bolsas = projetos_unicos - projetos_voluntario

    # Explorar outros insights: Contar o número de projetos por status
    status_projetos = df['status'].value_counts()

    # Apresentar os resultados
    print(f"Número de alunos: {discentes}")
    print(f"Número de projetos: {projetos_unicos}")
    print(f"Número de projetos voluntários: {projetos_voluntario}")
    print(f"Número de projetos não voluntários: {projetos_bolsas}")
    print(f"Número de orientadores: {orientadores}")
    print(f"Número de departamentos: {departamentos}")

    print("\nContagem de projetos por status:")
    print(status_projetos)

except FileNotFoundError:
    print("Erro: Arquivo não encontrado. Verifique o caminho do arquivo.")
except Exception as e:
    print(f"Ocorreu um erro: {e}")

Número de alunos: 25424
Número de projetos: 16936
Número de projetos voluntários: 14706
Número de projetos não voluntários: 2230
Número de orientadores: 2558
Número de departamentos: 237

Contagem de projetos por status:
status
FINALIZADO               40875
PENDENTE DE RELATORIO     5954
EM ANDAMENTO              1658
Name: count, dtype: int64


In [8]:
# Obtém os conjuntos de DiscenteID e OrientadorID únicos do DataFrame
discentes_ids = set(df['Discente'].unique())
orientadores_ids = set(df['Orientador'].unique())

# Encontra IDs que aparecem em ambas as listas
discentes_como_orientadores_ids = discentes_ids.intersection(orientadores_ids)

# Apresenta os resultados
numero_discentes_como_orientadores = len(discentes_como_orientadores_ids)

print(f"Número de discentes que também são orientadores: {numero_discentes_como_orientadores}")

if numero_discentes_como_orientadores > 0:
    print("\nDiscentes que também são orientadores:")
    # Recupera os nomes dos discentes que também são orientadores
    discentes_como_orientadores_nomes = df[df['Discente'].isin(discentes_como_orientadores_ids)]['Discente'].unique()
    for nome in discentes_como_orientadores_nomes:
        print(nome)
else:
    print("\nNão foram encontrados discentes que também atuam como orientadores no conjunto de dados.")

Número de discentes que também são orientadores: 191

Discentes que também são orientadores:
ADALA NAYANA DE SOUSA MATA
ADA LIMA FERREIRA DE SOUSA
ADRIANA DA SILVA BRITO
ADRIANNE PAULA VIEIRA DE ANDRADE
ALCIDES VIANA DE LIMA NETO
ALEXSANDRO PEREIRA LIMA
ALINE BRAGA GALVAO SILVEIRA FERNANDES
ALINY DAYANY PEREIRA DE MEDEIROS PRANTO
ALYSON MATHEUS DE CARVALHO SOUZA
ANA CAROLINA DE OLIVEIRA NEVES MENEZES
ANA CECILIA VIEIRA DA NOBREGA
ANA KALLINY DE SOUSA SEVERO
ANA KARINA SILVA AZEVEDO
ANA LUDMILA FREIRE COSTA
ANA LUIZA BRAGA DE MACEDO LOMBARDI
ANA PAULA COSTA CAMARA
ANA RAFAELA LUZ DE AQUINO MARTINS
ANDERSON CRISTOPHER DOS SANTOS
ANDERSON DIAS VIANA
ANDERSON PAIVA CRUZ
ANDRE LUIS LOPES MORIYAMA
ANNA BEATRIZ SANTANA LUZ
ANNA GISELLE CAMARA DANTAS RIBEIRO RODRIGUES
ANTONINO ALVES FEITOSA NETO
ARTHUR CESAR DE MEDEIROS ALVES
ARTHUR EMANOEL CASSIO DA SILVA E SOUZA
ARYELLY DAYANE DA SILVA NUNES ARAÚJO
BARBARA LAIS FELIPE DE OLIVEIRA
BISMARCK LUIZ SILVA
BLENDA CARINE DANTAS DE MEDEIROS
BONIEK CA