# Classificação das Instituições com base na base de dados da ICJ e do Cadastro e-MEC

Este notebook documenta o processo de **classificação das instituições participantes da Iniciação Científica Júnior (ICJ)** entre os anos de 2010 a 2023, com base na consolidação de dados do CNPq e na estrutura institucional informada pelo **Cadastro Nacional de Instituições de Ensino Superior - e-MEC**.

---

## 🔍 Etapas do Processo

### 1. Carregamento das bases de dados
- `ICJ_Instituicao_Ano_bolsistas_2010_2023.xlsx`: base com registros de bolsas, valores e instituições.
- `CATEGORIAS_INSTITUICOES.xlsx`: base com a classificação de cada instituição.

### 2. Padronização dos nomes das instituições
```python
import unicodedata

def padronizar_nome(nome):
    if pd.isna(nome):
        return ""
    nome = unicodedata.normalize('NFKD', nome).encode('ASCII', 'ignore').decode('ASCII')
    return nome.strip().upper()

df_icj["Nome_Padronizado"] = df_icj["Instituição"].apply(padronizar_nome)
df_categorias["Nome_Padronizado"] = df_categorias["Nome_Padronizado"].apply(padronizar_nome)
```

---

### 3. Junção entre os bancos
Realizamos o `merge` usando a coluna `Nome_Padronizado`.

```python
df_icj_classificado = df_icj.merge(
    df_categorias,
    on="Nome_Padronizado",
    how="left",
    suffixes=("", "_classificado")
)
```

---

### 4. Estrutura da classificação

As colunas adicionadas foram:
- `Classificacao_Instituicao`: descrição geral (IES, Escola da Educação Básica, ONG, Instituto de Pesquisa, etc.).
- `CATEGORIA`: Pública, Privada ou ONG.
- `CATEGORIA_ADMINISTRATIVA`: ex: Pública Federal, Privada com fins lucrativos.
- `ORGANIZACAO_ACADEMICA`: Universidade, Centro Universitário, Faculdade (quando disponível).

---

### 5. Exportação final
```python
df_icj_classificado.to_excel("ICJ_Classificado_Final.xlsx", index=False)
```

---

## ✅ Considerações Finais

Este processo permitiu:
- Qualificar analiticamente o tipo de instituição que recebeu fomento da ICJ.
- Evitar erros de classificação automática baseados apenas em palavras-chave.
- Incorporar tipologias importantes para a discussão de políticas públicas no contexto do financiamento da educação básica e superior.

---

**Autor**: Tiago Ribeiro dos Anjos  
**Projeto**: Doutorado em Ciência, Tecnologia e Sociedade — UFSCar  
**Contato**: tiagoribeiroanjos@gmail.com  
