In [30]:
import requests
import pandas as pd
from time import sleep
class CkanConsumer:
    def __init__(self, main_url:str, secure:bool = True):
        if secure:
            self.url = f'https://{main_url}/api/action/datastore_search'
        else:
            self.url = f'http://{main_url}/api/action/datastore_search'

    def request(self, resource_id) -> pd.DataFrame:
        params = {
            'limit': 1000,
            'offset': 0,
            'resource_id': resource_id
        }
        data = []

        print(f'[INFO] - Getting data from {self.url} on resource {resource_id} at offset {len(data)}')
        response = requests.get(self.url, params=params)
        total = response.json()['result']['total']
        data.extend(response.json()['result']['records'])

        while len(data) < total:
            params['offset'] = len(data)
            print(f'[INFO] - Getting data from {self.url} on resource {resource_id} at offset {len(data)}')
            response = requests.get(self.url, params=params)
            while response.status_code != 200:
                print(f'[ERROR] - Response code {response.status_code} from {self.url} on resource {resource_id} at offset {len(data)}')
                print(f'[INFO] - Waiting 5 seconds before trying again')
                sleep(5)
                response = requests.get(self.url, params=params)
            data.extend(response.json()['result']['records'])
        
        print(f'[INFO] - Total of {len(data)} records retrieved from {self.url} on resource {resource_id}')
        #Reassembling the dataframe
        df = pd.DataFrame(data)
        return df

In [52]:
ufpi_consumer = CkanConsumer('dados.ufpi.br', secure=True) 
cursos_ufpi = ufpi_consumer.request('afb0de00-8f39-4f9c-9197-4364f7312a98')
docentes_ufpi = ufpi_consumer.request('a34d7d7e-30af-41f0-81cf-cd10b6f078bd')
discentes_ufpi = ufpi_consumer.request('00658685-cd1b-47f4-9f42-107c45a1e4e1')


[INFO] - Getting data from https://dados.ufrn.br/api/action/datastore_search on resource a10bc434-9a2d-491a-ae8c-41cf643c35bc at offset 0
[INFO] - Total of 120 records retrieved from https://dados.ufrn.br/api/action/datastore_search on resource a10bc434-9a2d-491a-ae8c-41cf643c35bc
[INFO] - Getting data from https://dados.ufrn.br/api/action/datastore_search on resource 6a8e5461-e748-45c6-aac6-432188d88dde at offset 0
[INFO] - Getting data from https://dados.ufrn.br/api/action/datastore_search on resource 6a8e5461-e748-45c6-aac6-432188d88dde at offset 1000
[INFO] - Getting data from https://dados.ufrn.br/api/action/datastore_search on resource 6a8e5461-e748-45c6-aac6-432188d88dde at offset 2000
[INFO] - Total of 2772 records retrieved from https://dados.ufrn.br/api/action/datastore_search on resource 6a8e5461-e748-45c6-aac6-432188d88dde
[INFO] - Getting data from https://dados.ufrn.br/api/action/datastore_search on resource 14afbb6c-395e-411c-b24d-0e494cb95866 at offset 0
[INFO] - Gettin

In [63]:
cursos_ufrn.head()

Unnamed: 0,id_unidade_responsavel,area_conhecimento,unidade_responsavel,id_coordenador,codigo_inep,campus,nivel_ensino,nome,portaria_reconhecimento,id_curso,...,tipo_ciclo_formacao,convenio_academico,modalidade_educacao,municipio,situacao_curso,data_funcionamento,coordenador,turno,_id,dou
0,31011,Ciências Sociais Aplicadas,"FACULDADE DE ENGENHARIA, LETRAS E CIÊNCIAS SOC...",5752389,12355,Campus Currais Novos,GRADUAÇÃO,ADMINISTRAÇÃO,Portaria nº 272/2017 - MEC,2000004,...,Um ciclo,,Presencial,CURRAIS NOVOS,ATIVO,1978-09-15T00:00:00,MARILENE BIZERRA DA COSTA,Vespertino e Noturno,1,2017-04-04T00:00:00
1,443,Ciências Sociais Aplicadas,CENTRO DE CIÊNCIAS SOCIAIS APLICADAS,24344,12311,Campus Central,GRADUAÇÃO,ADMINISTRAÇÃO,Portaria nº 272/2017 - MEC,2000002,...,Um ciclo,,Presencial,NATAL,ATIVO,1971-09-16T00:00:00,CARLOS ALBERTO FREIRE MEDEIROS,Matutino e Noturno,2,2017-04-04T00:00:00
2,443,Ciências Sociais Aplicadas,CENTRO DE CIÊNCIAS SOCIAIS APLICADAS,5756793,1563343,,GRADUAÇÃO,ADMINISTRAÇÃO PÚBLICA,,149654895,...,Um ciclo,,Presencial,NATAL,ATIVO,,FABIO RESENDE DE ARAUJO,,3,
3,443,Ciências Sociais Aplicadas,CENTRO DE CIÊNCIAS SOCIAIS APLICADAS,5753587,1151028,,GRADUAÇÃO,ADMINISTRAÇÃO PÚBLICA,Portaria nº 226/2014 - DIREG/MEC,15315770,...,Um ciclo,,A Distância,NATAL,ATIVO,,CARLOS DAVID CEQUEIRA FEITOR,,4,2014-04-11T00:00:00
4,351,Outra,ESCOLA AGRÍCOLA DE JUNDIAÍ,5760230,1188193,,GRADUAÇÃO,ANÁLISE E DESENVOLVIMENTO DE SISTEMAS,Portaria MEC/SERES Nº 922/2018,94598200,...,Um ciclo,,Presencial,MACAÍBA,ATIVO,,CARLA DA COSTA FERNANDES CURVELO,,5,2018-12-28T00:00:00
