In [1]:
p_storage_dir = "../../storage"
p_notebooks_root = None

In [2]:
if p_notebooks_root is not None:
    import os
    os.chdir(p_notebooks_root)

In [3]:
import pandas as pd
from pathlib import Path

IFG_PRODUZ_STORAGE_DIR = Path(f"{p_storage_dir}/ifg_produz")

## Orientação

In [4]:
orientacao = pd.read_csv(IFG_PRODUZ_STORAGE_DIR / "extracted/orientacao.csv", delimiter=";")

orientacao.sample(n=5)

Unnamed: 0,id_orientacao,tipo_orientacao,titulo_orientacao,ano_orientacao,nome_orientado,id_curriculo_id,concluida
55,55854,Iniciação Científica,Política e religião: estudos sobre manifestaçõ...,2020,Eduardo José de Alvarenga,10,False
931,56656,TRABALHO_DE_CONCLUSAO_DE_CURSO_GRADUACAO,Estudo de viabilidade de fundações para o câmp...,2017,Arthur Dias e Laís Wind,115,True
371,56131,TRABALHO_DE_CONCLUSAO_DE_CURSO_GRADUACAO,GESTÃO DE RESÍDUOS SÓLIDOS E LÍQUIDOS EM LAVA-...,2014,Leonardo Dorniger Feitosa,47,True
840,56566,INICIACAO_CIENTIFICA,Estudo sobre o comportamento do perfil de vent...,2014,Eduardo Palhares Sakemi,107,True
543,56304,Iniciação Científica,As metamorfoses do espaço: os dez anos de impl...,2018,Izadora Neto Reis,52,False


In [5]:
orientacao = orientacao.rename(columns={
    'id_orientacao': 'codigo',
    'tipo_orientacao': 'tipo',
    'titulo_orientacao': 'titulo',
    'ano_orientacao': 'ano',
    'id_curriculo_id': 'codigo_curriculo'
})

In [6]:
orientacao.sample(n=3)

Unnamed: 0,codigo,tipo,titulo,ano,nome_orientado,codigo_curriculo,concluida
127,55915,Iniciação Científica,Acolhimento e formação acadêmica nos cursos su...,2018,Marilia Jorge Squissato da Silva,18,False
1282,57005,INICIACAO_CIENTIFICA,PROGRAMA NACIONAL DE IMUNIZAÇÃO: A PERCEPÇÃO D...,2017,Ismália Pereira da Silva de Paula,152,True
845,56571,Trabalho de conclusão de curso de graduação,Desenvolvimento de Plataforma Experimental par...,2019,Leonardo Rodrigues Mendes da Cunha,107,False


In [7]:
orientacao['tipo'].unique()

array(['TRABALHO_DE_CONCLUSAO_DE_CURSO_GRADUACAO',
       'MONOGRAFIA_DE_CONCLUSAO_DE_CURSO_APERFEICOAMENTO_E_ESPECIALIZACAO',
       'ORIENTACAO-DE-OUTRA-NATUREZA', 'Orientação de outra natureza',
       'Iniciação Científica', 'INICIACAO_CIENTIFICA',
       'Trabalho de conclusão de curso de graduação',
       'Dissertação de mestrado', 'Tese de doutorado'], dtype=object)

In [8]:
tipo_replacement_map = {
    'TRABALHO_DE_CONCLUSAO_DE_CURSO_GRADUACAO': 'Trabalho de Conclusão de Curso de Graduação',
    'Trabalho de conclusão de curso de graduação': 'Trabalho de Conclusão de Curso de Graduação',
    'MONOGRAFIA_DE_CONCLUSAO_DE_CURSO_APERFEICOAMENTO_E_ESPECIALIZACAO': 'Monografia de Conclusão de Curso de Aperfeiçoamento e Especialização',
    'ORIENTACAO-DE-OUTRA-NATUREZA': 'Orientação de Outra Natureza',
    'Orientação de outra natureza': 'Orientação de Outra Natureza',
    'INICIACAO_CIENTIFICA': 'Iniciação Científica',
    'Dissertação de mestrado': 'Dissertação de Mestrado',
    'Tese de doutorado':'Tese de Doutorado'
}

In [9]:
orientacao['tipo'] = orientacao['tipo'].replace(tipo_replacement_map)

orientacao['tipo'].unique()

array(['Trabalho de Conclusão de Curso de Graduação',
       'Monografia de Conclusão de Curso de Aperfeiçoamento e Especialização',
       'Orientação de Outra Natureza', 'Iniciação Científica',
       'Dissertação de Mestrado', 'Tese de Doutorado'], dtype=object)

In [10]:
orientacao['titulo'] = orientacao['titulo'].apply(str.title).apply(str.strip)

orientacao['titulo'].sample(n=7)

1255    Avaliação Dos Perfis Obtidos Pelo Congelamento...
434                         Voip Utilizando Tecnologia 3G
897     Uma Aplicação Do Aprendizado De Sequências De ...
397     Certificação Digital: Aspectos Teoricos E Prat...
809         O Lúdico Na Educação Infantil: O Faz-De-Conta
618          Implantação De Sistemas De Gestão Industrial
1226    Levantamento Das Manifestações Patológicas Em ...
Name: titulo, dtype: object

In [11]:
orientacao.isna().any()

codigo              False
tipo                False
titulo              False
ano                 False
nome_orientado       True
codigo_curriculo    False
concluida           False
dtype: bool

**Exportar**

In [36]:
export_path = Path(IFG_PRODUZ_STORAGE_DIR / "preprocessed")

if not export_path.is_dir():
    Path(export_path).mkdir()

orientacao.to_csv(export_path / "orientacao.csv", sep=";", index=False)