## Extração de Microdados da Plataforma Nilo Peçanha

Este script Python tem como objetivo realizar o download do arquivo CSV contendo os microdados da Plataforma Nilo Peçanha. Os microdados oferecem um nível de detalhamento e possibilidades de análise superior aos dados disponíveis através do módulo Extrator.

**⚠️ Atenção:** Antes de utilizar esta base de dados, **verifique a data da última atualização** para garantir que você está trabalhando com as informações mais recentes.

## Pré-requisitos

* **Python:** Certifique-se de ter o Python instalado em seu sistema.
* **Bibliotecas:** O script utiliza as bibliotecas `BeautifulSoup4` e `Requests`. Se você ainda não as possui, instale-as utilizando os seguintes comandos:

   ```bash
   pip install beautifulsoup4
   pip install requests
   ```

## Como Utilizar

1. **Instalação das bibliotecas (se necessário):** Execute os comandos de instalação acima caso ainda não tenha as bibliotecas `BeautifulSoup4` e `Requests`.

2. **Execução do script:**
   * Salve o código fornecido em um arquivo Python (por exemplo, `extrair_microdados.py`).
   * Abra seu terminal ou prompt de comando e navegue até o diretório onde você salvou o arquivo.
   * Execute o script utilizando o seguinte comando:

     ```bash
     python extrair_microdados.py
     ```

3. **Resultado:** Após a execução bem-sucedida, o arquivo `dados_tabela.csv` será criado no mesmo diretório do script, contendo os microdados extraídos.

## Explicação do Código

* **`extract_data_from_odata_api(url, params=None)`:** Esta função realiza a requisição à API OData, processa a resposta JSON e retorna os cabeçalhos e linhas de dados.
* **`write_to_csv(headers, rows, filename='dados_tabela.csv')`:** Esta função grava os dados em um arquivo CSV.
* **`if __name__ == '__main__':`:** Este bloco garante que o código principal seja executado apenas quando o script é executado diretamente, e não quando importado como um módulo.
* **`url`:** Contém a URL da API OData da Plataforma Nilo Peçanha.
* **`params`:** Permite a inclusão de parâmetros opcionais na requisição, como `$top` para limitar o número de resultados.

**Observações:**

* O script atualmente salva os dados em um arquivo chamado `dados_tabela.csv`. Você pode personalizar o nome do arquivo alterando o argumento `filename` na função `write_to_csv`.
* O parâmetro `$top` na variável `params` está comentado. Se você desejar limitar o número de resultados retornados pela API, descomente essa linha e ajuste o valor conforme necessário.

Lembre-se de que APIs podem ter limites de requisição ou exigir autenticação. Consulte a documentação da Plataforma Nilo Peçanha para obter informações detalhadas sobre o uso da API.

**Última atualização**
11 de setembro de 2024


In [1]:
pip install beautifulsoup4

Note: you may need to restart the kernel to use updated packages.


In [2]:
pip install requests

Note: you may need to restart the kernel to use updated packages.


In [3]:
import requests
import json
import csv

def extract_data_from_odata_api(url, params=None):
    """Extrai dados de uma API OData."""

    response = requests.get(url, params=params)
    response.raise_for_status()

    data = json.loads(response.content)

    headers = list(data['value'][0].keys())
    rows = [list(item.values()) for item in data['value']]

    return headers, rows

def write_to_csv(headers, rows, filename='dados_tabela.csv'):

    with open(filename, 'w', newline='', encoding='utf-8') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(headers)
        writer.writerows(rows)

if __name__ == '__main__':
    url = 'https://olinda.mec.gov.br/olinda-ide/servico/PDA_PNP/versao/v1/odata/PDA_PNP_Matriculas'
    params = {
        #'$top': 1000,  # Limitar o número de resultados (ajuste conforme necessário)
    }
    headers, rows = extract_data_from_odata_api(url, params)
    write_to_csv(headers, rows)

    print(f'Dados da tabela foram salvos em dados_tabela.csv')

Dados da tabela foram salvos em dados_tabela.csv
