# Introdução ao Consumo de APIs: Requisições ao IBGE com Python

Este notebook demonstra como utilizar APIs para acessar dados públicos do IBGE, descrevendo os conceitos básicos de requisições HTTP e manipulação de respostas em Python.

## Definições:  
API(Application Programming Interface) são interfaces de comunicação entre dois sistemas ou aplicações. A grosso modo, um formato de fazer o compartilhamento de dados e informações que seja facilitado e seguro para ambos os lados dessa comunicação.
O mecanismo de funcionamento é baseado em solicitações (requests) de um sistema cliente, processamenoe dessa requisição por sistema um servidor que dará a resposta a solicitação. Sendo que essas solicatações podem ser do tipo GET, POST,PUT, PATCH e DELETE.
- **GET:** Solicitação de dados
- **POST:**Usado para enviar dados ao servidor, geralmente para criar um novo recurso. Por exemplo, ao enviar um formulário de cadastro, uma solicitação POST é feita para criar um novo usuário no sistema.
- **PUT:** Usado para atualizar um recurso existente ou criar um recurso caso ele não exista. Em uma atualização de usuário seria enviado todos os dados do usuário mesmo que apenas um deles tenha sido alterado de fato.
- **PATCH:** Usado para atualizar parcialmente um recurso existente. Ao contrário do PUT, que geralmente substitui o recurso inteiro, o PATCH modifica apenas os campos especificados.
- **DELETE:** Usado para solicitar a exclusão de um recurso no servidor. Por exemplo, deletar um registro específico de um banco de dados.


## Funcionamento:
As APIs funcionam por meio de transferência de informações através de URLs, algumas destas informações são adicionais e referentes ao processo de transação. Os Headers podem conter informações de `Content_Type` ou `Authentification`, por exemplo.  
Os 'diretórios' da URL de uma API é chamado de endpoint e normalmente separa as funcionalidades da API a cada endpoint.  
As respostas regularmente são em formato JSON e XML, sendo o segundo um pouco mais custoso em termos de tranferencia de dados visto que sua estrutura básica possui uma quantidade maior de caracters.  

Os `status_code` dentro das respostas recebidas indicam o resultado de um requisição enviada para uma API. Sendo eles:
- 200: Sucesso.
- 404: Não encontrado.
- 500: Erro interno do servidor, ex: sobrecarga, manutenção, consultas mal formuladas, etc. 
    
Além disso, técnicas de limitação de requisições em um intervalo de tempo podem ser aplicadas para evitar a sobrecarga do servidor.

## Objetivos

- Fazer requisições GET para acessar dados de uma API pública.
- Interpretar e manipular respostas das requisições.
- Manipular arquivo em formato JSON.
- Praticar comandos básicos com a biblioteca `requests`.


In [1]:
import json
import requests
import pandas as pd

# Caminho base para o acesso dos dados da API do IBGE
ibge = "https://servicodados.ibge.gov.br/api/v3/agregados"
# Solicitação GET dos dados
resposta = requests.get(ibge)
# Testando se a solicitação foi bem sucedida
if resposta.status_code == 200:
    print(f"{resposta.status_code}: Conjunto de dados obtidos")
else:
    print(f"{resposta.status_code}: Erro ao conectar API")

200: Conjunto de dados obtidos


In [2]:
resposta_404 = requests.get(ibge+"/Weslley")
print(f"{resposta_404.status_code}: Retorna erro 404 porque não encontra um endpoint chamado 'Weslley'")
   
resposta_503 = requests.get(ibge+"_br")
print(f"{resposta_503.status_code}: Retorna erro do tipo 503 por ser um caminho não existente no servidor sendo uma exceção não tratada e/ou erro na formulação da requisição")
    

404: Retorna erro 404 porque não encontra um endpoint chamado 'Weslley'
503: Retorna erro do tipo 503 por ser um caminho não existente no servidor sendo uma exceção não tratada e/ou erro na formulação da requisição


# Resultados do GET

In [26]:
ibge = "https://servicodados.ibge.gov.br/api/v3/agregados"
resposta = requests.get(ibge)

# A resposta direta de um request não é o conjunto de dados e sim seu status de retorno
print(f"Resposta direta do request - type:{type(resposta)}\n{resposta}\n\n")

# Recebendo os dados transferidos em formato TEXTO
dados = resposta.text
print(f"Resposta formatada para texto - type:{type(dados)}\n\n")

# Recebendo os dados transferidos em formato JSON
dados = resposta.json()
print(f"Formato de resposta json - type:{type(dados)}\n{dados[0]}\n\n")

# Convertendo um dos registros json para texto
""" Algumas outras transformações entre os tipos texto, dic e json podem ser feitas pelo json.load() ou json.dumps()"""
dados_dump = json.dumps(dados[0])
# Remover caracteres {, [, e "  ### fiz sem usar regex para facilitar entendimento
dados_dump = dados_dump.replace('{', '').replace('}', '')
dados_dump = dados_dump.replace('[', '').replace(']', '')
dados_dump = dados_dump.replace('"', '')
print(f"Dados em formato texto\n- type:{type(dados_dump)}\n{dados_dump}\n\n")

# Ademais os Headers são condições e configurações da comunição entre cliente-servidor
print(f"Headers da comunicação:\n{resposta.headers}\n\n")

Resposta direta do request - type:<class 'requests.models.Response'>
<Response [200]>


Resposta formatada para texto - type:<class 'str'>


Formato de resposta json - type:<class 'list'>
{'id': 'D5', 'nome': 'Áreas Urbanizadas', 'agregados': [{'id': '8418', 'nome': 'Áreas urbanizadas, Loteamento vazio, Área total mapeada e Subcategorias'}]}


Dados em formato texto
- type:<class 'str'>
id: D5, nome: \u00c1reas Urbanizadas, agregados: id: 8418, nome: \u00c1reas urbanizadas, Loteamento vazio, \u00c1rea total mapeada e Subcategorias


Headers da comunicação:
{'Date': 'Sun, 01 Sep 2024 20:05:39 GMT', 'Server': 'Apache/2.4.57 (Red Hat Enterprise Linux) OpenSSL/3.0.7 mod_qos/11.74', 'Content-Type': 'application/json; charset=utf-8', 'Cache-Control': 'max-age=3259.375', 'Content-Encoding': 'gzip', 'Expires': 'Sun, 01 Sep 2024 21:00:00 GMT', 'Vary': 'Accept-Encoding', 'Access-Control-Allow-Headers': 'Content-Type', 'Access-Control-Allow-Methods': 'GET, POST, OPTIONS', 'Access-Control-Allow-Or

# Análises:
As análises e exposições dos caminhos e dados possíveis de serem obtidos pelo dashboard será feito em formato WEB pela biblioteca Streamlit do python.

O código está disponível para execução em `dashboard.py`

Executar pelo cmd com: `streamlit run dashboard.py`
