# Aula 10 - requests, json e APIs

Na aula de hoje, vamos explorar os seguintes tópicos em Python:

- 1) Requests
- 2) JSON
- 3) APIs

_____________

___
___
___

## 1) Requests

Computadores em uma rede comunicam-se entre si utilizando **protocolos de comunicação**, que são conjuntos de padronização na forma como a informação é lida e enviada.

O principal protocolo utilizado é o **HTTP (HyperText Transfer Protocol)**, que foi desenvolvido para a internet.

A comunicação HTTP é dada através de ciclos de **requisição (request)** e **resposta (response)**. 

As requisições e respostas são **strings padronizadas** com alguns campos, incluindo, por exemplo, um cabeçalho e o conteúdo do site. Veremos exemplos adiante.

Para fazermos requisições e respostas em Python de forma estruturada (e sem a necessidade de um navegador), existe a biblioteca `Requests`, que nos permite trabalhar com HTTP em um nível mais concreto.

In [3]:
import requests

O protocolo HTTP define uma série de verbos que indicam a intenção da requisição. Os verbos mais comuns são:

- GET: ler ou obter informações
- POST: criar novos itens
- PUT: sobrescrever itens
- DELETE: remover itens

Cada verbo vai definir também o formato da requisição. 

O verbo GET é o mais comum de utilizarmos no dia a dia, uma vez que é esse verbo que utilizamos para obter páginas web, fazer solicitação de informações de APIs, etc. 

Utilizamos a função `get()` da requests para fazer uma requisição GET para obter, por exemplo, uma página de determinado endereço na internet.

Isso cria um objeto com a **resposta** da requisição!

In [4]:
resposta = requests.get('https://letscode-academy.com')

Este objeto response tem alguns atributos que contêm informações sobre a resposta recebida.

O atributo `.status_code` retorna o **código de status** da resposta à requisição:


- Informativo (1xx): Respostas sem conteúdo, contendo apenas informação sobre a comunicação.
    - Ex: Processing (102) - o servidor ainda está processando a requisição e, por hora, não tem conteúdo a enviar.
<br><br>
- Sucesso (2xx): A mensagem chegou ao servidor e era válida.
    - Ex: OK (200) - tudo ocorreu exatamente como planejado: a requisição estava OK e o servidor respondeu adequadamente.
<br><br>
- Redirecionamento (3xx): O recurso buscado está em outro servidor.
    - Ex: Moved Permanently (301) - o recurso buscado mudou permanentemente de endereço.
<br><br>
- Erro do cliente (4xx): A requisição possui algum erro
    - Ex: Not Found (404) - o recurso buscado não existe.
<br><br>
- Erro do servidor (5xx): O servidor não pode atender à requisição
    - Ex: Service Unavailable (503) - o servidor não é capaz de atender à solicitação no momento (por exemplo, por estar sobrecarregado ou em manutenção).
 <br><br> 

In [5]:
resposta.status_code

200

O atributo `.headers` retorna o **cabeçalho** da resposta à requisição. 

Ele contém algumas informações sobre a sua conexão, o software rodando no servidor, data etc.

In [6]:
resposta.headers

{'Date': 'Thu, 19 Aug 2021 00:05:49 GMT', 'Content-Type': 'text/html; charset=utf-8', 'Transfer-Encoding': 'chunked', 'Connection': 'keep-alive', 'Server': 'nginx/1.18.0', 'X-Powered-By': 'Next.js', 'ETag': '"2eea7-tC2zEZnO+kyHWplZwRKqbhFZfdE"', 'Vary': 'Accept-Encoding', 'Content-Encoding': 'gzip'}

Por fim, o último elemento recebido após a requisição é o próprio **conteúdo da página**, que contém o site completo (código em HTML, imagens, vídeos etc).

Para acessar o código HTML do site, tomamos o atributo `.text`

In [7]:
resposta.text

'<!DOCTYPE html><html lang="pt-BR"><head><link rel="preconnect" href="https://fonts.gstatic.com" crossorigin /><meta name="viewport" content="width=device-width"/><meta charSet="utf-8"/><link rel="preconnect" href="https://fonts.googleapis.com"/><link rel="preconnect" href="https://fonts.gstatic.com" crossorigin="true"/><link rel="stylesheet" data-href="https://fonts.googleapis.com/css?family=Montserrat:300,400,500,600,700,800,900&amp;display=swap" data-optimized-fonts="true"/><title>Let&#x27;s Code | Cursos de Programação</title><meta name="title" property="og:title" content="Let&#x27;s Code | Cursos de Programação"/><meta name="type" property="og:type" content="website"/><meta name="description" property="og:description" content="Cursos de programação presenciais e online em diversas linguagens. Teste grátis nossa plataforma."/><meta property="og:image" content="https://lc-public-assets.s3.sa-east-1.amazonaws.com/images/2020/siteLink.webp"/><meta name="facebook-domain-verification" c

O HTML vem na forma de uma string, que é praticamente ilegível! 

Mas o seu computador entende ele, e é assim que os sites são exibidos, quando acessados!

Além do código-fonte HTML, também é possível captar outros elementos da página como figuras e imagens.

Para isso, usamos o atributo `.raw`, que é dividido em vários blocos

In [8]:
# o argumento stream=True garante que os arquivos sejam baixados aos poucos
resposta = requests.get(
    'https://lc-public-assets.s3.sa-east-1.amazonaws.com/images/Background/backgroundHeaderHome.webp', 
    stream=True)

# exibindo cada um dos blocos "raw" da resposta
for bloco in resposta.raw:
    print(bloco)

b'RIFF\xba\xf5\x01\x00WEBPVP8X\n'
b"\x00\x00\x00\x10\x00\x00\x00\xaf\x04\x00\x95\x03\x00ALPHI\x13\x00\x00\x017\xa0\xa8m\x1b8\xd7R\xea\xff\x1a\x80ED\xe0\xac'I\n"
b'\xda\xb6\x91\x92\xf0g\xbd\xdd\x03!"&\x80\xe9|q-\xe1P\x01}\x06\xf5p\xf4\xa4\x92\xf7q,\xcf\x17\r\xea\xb1m\xebm\x1b\x94\x80\x12\x90\x0e(e\x06\x15\xbc9\x15d\xf0\x1b\x04.w\xff=\x80\xb4\x15<\xd9><\xd6GD\xff\'\x80\xb2\xadMr\xdb\xe6/0\xea5H\xc7\xbd\x06\xe5sz\x9f\xa9\xf7\x99\xb8\xf6\xc85@\x91\xf5\xfe\xef\xa0\x81\x83\xd8\xa8\xaa_\xb6\x19\xd1\xff\t\xb0\x18\xdbV\x18I\x92s\xd9X\xd0\xffY\xa0w\xfd\xf7\x01\x84\x10 \tifv#\xfa?\x01\xc3\x19\xc7\x7f^\xff\xdd\xf1h\xfd\xe3~%p\xd2\xf1u\xc7\xad\xf5C\xe7 \xe3+\x9e-\xe2\x1c\xe3+\xbe\xad\x9dgL;\xd6]\xf9\xc5\x0b\xee-N1n\xf8\xb7v\x1e1n8\xb8\x8a?\x8c;&\xee\xbca\xdc\xb1q\xe7\x0c;F\x16W\xd8pr\xf5\x84\x17\xbc\\\xfc`\xc2\xcd\xef\xbc`\xc4\xcf\x9d\x13\\\rU}\xe0\x82\xa3\xb3\x07\x8cx\xbas\x80\xcdT\xd5~\x17\\\x9d\xcd\xb7\xdbJ\xc5x\x17|\x9d\x8d\x87\xb3;\xd3\xad\xd6*\x96\x1b\xf1vg\xb8\xd5\\\xc5p\xb8[\xccv\xb1W6\xdbn

Para realmente conseguir baixar os arquivos, precisamos escrevê-los de forma binária a um arquivo

In [13]:
# o argumento stream=True garante que os arquivos sejam baixados aos poucos
resposta = requests.get(
    'https://lc-public-assets.s3.sa-east-1.amazonaws.com/images/Background/backgroundHeaderHome.webp', 
    stream=True)

# vamos escrever o arquivo bloco a bloco
with open('entrada.webp', 'wb') as f:
    for bloco in resposta.raw:
        f.write(bloco) # escreve o binário da requisição



In [14]:
import requests 

resposta = requests.get('https://credit.stone.com.br/api/v1/health') 

resposta

<Response [200]>

In [15]:
resposta.json()

{'ApplicationName': 'CreditApi.Application',
 'Version': '1.2.2108.1604',
 'BuildDate': '2021-08-16T20:00:10+00:00',
 'MachineName': 'credit-api-7787f999cb-8sw9x',
 'Timestamp': '2021-08-19T00:16:15.9050528+00:00',
 'status': 'Degraded',
 'components': {'self': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 4.4e-06},
  'CreditDb': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0012633},
  'CreditApiReadModelDb': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0013174},
  'PrivateMemory': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0010046},
  'DiskStorage': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0002105},
  'Redis': {'exception': '',
   'status': 'H

___
___
___


## 2) JSON

JSON é uma sigla para JavaScript Object Notation. 

O JavaScript é ma linguagem POO muito utilizada em web.

O JSON será a forma que receberemos as respostas de requisições a **APIs**, que veremos a seguir.

Os objetos nessa linguagem são representados de forma bem parecida com uma composição de dicionários e listas, mas **como uma string**, por exemplo:

```
'{"nome": "Mario", "pontuacao": 0, "nacionalidades": ["brasil", "frança"]}'
```

Para processar JSON, usamos a biblioteca `json`

A função `.loads()` transforma o json string em um dicionário do Python

In [16]:
import json
obj = json.loads('{"nome": "Mario", "pontuacao": 0, "nacionalidades": ["brasil", "frança"]}')
obj

{'nome': 'Mario', 'pontuacao': 0, 'nacionalidades': ['brasil', 'frança']}

In [17]:
obj['nome']

'Mario'

In [19]:
obj['nacionalidades'][0]

'brasil'

A função `.dumps()` recebe um dicionário e retorna uma string pronta para ser salva ou enviada como JSON:

In [21]:
json.dumps(obj, ensure_ascii=False)

'{"nome": "Mario", "pontuacao": 0, "nacionalidades": ["brasil", "frança"]}'

Agora, podemos usar o JSON e o Requests de forma combinada para estruturar as requisições!

É normal recebermos respostas em JSON na internet quando estamos trabalhando com APIs.

Se o atributo `text` da resposta for um JSON, usamos a biblioteca pra transformá-lo em um dicionário do Python!

Vejamos o exemplo abaixo:

In [22]:
resposta = requests.get('https://credit.stone.com.br/api/v1/health') 

resposta.headers

{'Date': 'Thu, 19 Aug 2021 00:23:22 GMT', 'Content-Type': 'application/json', 'Content-Length': '669', 'Connection': 'keep-alive', 'Cache-Control': 'no-store, no-cache', 'Pragma': 'no-cache', 'Content-Encoding': 'gzip', 'Expires': 'Thu, 01 Jan 1970 00:00:00 GMT', 'Vary': 'Accept-Encoding', 'X-Elapsed-Milliseconds': '179', 'Strict-Transport-Security': 'max-age=31536000; includeSubDomains', 'CF-Cache-Status': 'DYNAMIC', 'Expect-CT': 'max-age=604800, report-uri="https://report-uri.cloudflare.com/cdn-cgi/beacon/expect-ct"', 'X-Content-Type-Options': 'nosniff', 'Server': 'cloudflare', 'CF-RAY': '680f3b9bdc16cf8a-FOR'}

O "Content-Type" é um JSON! Portanto, o atributo `.text` será um JSON!

In [23]:
resposta.text

'{\n  "ApplicationName": "CreditApi.Application",\n  "Version": "1.2.2108.1604",\n  "BuildDate": "2021-08-16T20:00:10+00:00",\n  "MachineName": "credit-api-7787f999cb-wmcwx",\n  "Timestamp": "2021-08-19T00:23:22.49593+00:00",\n  "status": "Healthy",\n  "components": {\n    "self": {\n      "exception": "",\n      "status": "Healthy",\n      "applicationName": null,\n      "data": {},\n      "ElapsedTimeInSeconds": 2.1E-06\n    },\n    "CreditDb": {\n      "exception": "",\n      "status": "Healthy",\n      "applicationName": null,\n      "data": {},\n      "ElapsedTimeInSeconds": 0.0010558\n    },\n    "CreditApiReadModelDb": {\n      "exception": "",\n      "status": "Healthy",\n      "applicationName": null,\n      "data": {},\n      "ElapsedTimeInSeconds": 0.0010147\n    },\n    "PrivateMemory": {\n      "exception": "",\n      "status": "Healthy",\n      "applicationName": null,\n      "data": {},\n      "ElapsedTimeInSeconds": 0.0011225\n    },\n    "DiskStorage": {\n      "except

Vamos agora transformar o JSON em um dicionário

In [25]:
obj_resp = json.loads(resposta.text)
obj_resp

{'ApplicationName': 'CreditApi.Application',
 'Version': '1.2.2108.1604',
 'BuildDate': '2021-08-16T20:00:10+00:00',
 'MachineName': 'credit-api-7787f999cb-wmcwx',
 'Timestamp': '2021-08-19T00:23:22.49593+00:00',
 'status': 'Healthy',
 'components': {'self': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 2.1e-06},
  'CreditDb': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0010558},
  'CreditApiReadModelDb': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0010147},
  'PrivateMemory': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0011225},
  'DiskStorage': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0002488},
  'Redis': {'exception': '',
   'status': 'Heal

In [27]:
obj_resp['components']['CreditDb']

{'exception': '',
 'status': 'Healthy',
 'applicationName': None,
 'data': {},
 'ElapsedTimeInSeconds': 0.0010558}

Mas podemos usar o método `.json()` diretamente no objeto da resposta, isso já nos retorna um dicionário em Python, automaticamente:

In [28]:
resposta.json()

{'ApplicationName': 'CreditApi.Application',
 'Version': '1.2.2108.1604',
 'BuildDate': '2021-08-16T20:00:10+00:00',
 'MachineName': 'credit-api-7787f999cb-wmcwx',
 'Timestamp': '2021-08-19T00:23:22.49593+00:00',
 'status': 'Healthy',
 'components': {'self': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 2.1e-06},
  'CreditDb': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0010558},
  'CreditApiReadModelDb': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0010147},
  'PrivateMemory': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0011225},
  'DiskStorage': {'exception': '',
   'status': 'Healthy',
   'applicationName': None,
   'data': {},
   'ElapsedTimeInSeconds': 0.0002488},
  'Redis': {'exception': '',
   'status': 'Heal

**Dica: tentar sempre usar o método json acima: se der certo, ótimo, quer dizer que a requisição feita retornou um json. Se não der certo, o máximo que vai acontecer vai ser um erro.**

___
___
___


## 3) APIs

**API (Application Programming Interface)** é uma estrutura estabelecida por alguns provedores de dados, que estabelece protocolos comuns para requisições e respostas.

As APIs são usadas para a construção de aplicações entre diferentes plataformas.

Como as aplicações podem rodar em diferentes plataformas (Windows, Android, MacOS, iOS, um navegador de internet...), é importante estabelecer uma linguagem comum para que todos consigam consumir esses dados.

As APIs garantem esta comunicação comum.

As APIs são acessadas através de um url, de modo que elas podem ser utilizadas diretamente pela biblioteca `requests`

### URL Base

Várias APIs fornecem um "endereço base". Todas as suas requisições incluirão esse endereço, e ao final dele nós colocamos detalhes específicos para cada um dos recursos disponíveis.




Por exemplo, na PokeAPI (https://pokeapi.co/), uma API de pokemons, a URI base é:

https://pokeapi.co/api

Após a URL Base, vem o caminho (path):

/v2/pokemon/


e, em seguida, o recurso (resource):

pikachu

Após o caminho, pode vir ainda o parametros da query (query parameters). Eles vem separados do restante da url por uma `?`. Por exemplo, na AlphaVantage, uma API de dados de bolsas de valores e criptomoedas, para fazer uma consulta sem autenticação para valores da IBM, de 5 em 5 minutos, o endereço completo fica:

https://www.alphavantage.co/query?function=TIME_SERIES_INTRADAY&symbol=IBM&interval=5min&apikey=demo

Note o formato com NomeDoCampo=ValorDoCampo separados por `&`. Ele é bastante comum. 

In [29]:
resposta = requests.get("https://www.alphavantage.co/query?function=TIME_SERIES_INTRADAY&symbol=IBM&interval=5min&apikey=demo")

resposta.json()

{'Meta Data': {'1. Information': 'Intraday (5min) open, high, low, close prices and volume',
  '2. Symbol': 'IBM',
  '3. Last Refreshed': '2021-08-17 19:00:00',
  '4. Interval': '5min',
  '5. Output Size': 'Compact',
  '6. Time Zone': 'US/Eastern'},
 'Time Series (5min)': {'2021-08-17 19:00:00': {'1. open': '142.2100',
   '2. high': '142.2100',
   '3. low': '142.2100',
   '4. close': '142.2100',
   '5. volume': '100'},
  '2021-08-17 18:15:00': {'1. open': '142.5000',
   '2. high': '142.5000',
   '3. low': '142.5000',
   '4. close': '142.5000',
   '5. volume': '203'},
  '2021-08-17 16:25:00': {'1. open': '142.7900',
   '2. high': '142.7900',
   '3. low': '142.7900',
   '4. close': '142.7900',
   '5. volume': '200'},
  '2021-08-17 16:10:00': {'1. open': '142.4200',
   '2. high': '142.4200',
   '3. low': '142.4200',
   '4. close': '142.4200',
   '5. volume': '3836'},
  '2021-08-17 16:05:00': {'1. open': '142.4200',
   '2. high': '142.4200',
   '3. low': '142.4200',
   '4. close': '142.420

__Como saber detalhes do uso da API?__

Não tem outro jeito: tem que ir na documentação.

Veremos isso adiante.

Antes, vamos falar sobre alguns elementos conceituais comuns a todas as APIs:

**Schema**

É bastante comum que as APIs disponibilizem um "modelo" genérico de como será formatado o seu JSON, XML etc para que os desenvolvedores saibam quais campos esperar e quais tipos de dados serão possíveis para cada campo. 

Este modelo é chamado de **schema**, e está presente na documentação das APIs.

**Autenticação**

Enquanto algumas APIs são grátis, outras são pagas. 

Também há APIs que você pode consumir um certo volume de dados, e acima disso você deverá pagar. 

Assim, é muito comum a necessidade da **autenticação** da API para que seu uso seja possível.

Os dois modelos mais comuns de autenticação são:

- Chave: ao fazer seu registro, você recebe uma **chave que será inclusa na requisição**.

- OAuth: um esquema um pouco mais complexo onde são combinados códigos de autorização, identificação do cliente, etc. APIs de gigantes da internet (como Google e Facebook) costumam usar esse modelo.

**Rate limiting**

As APIs costumam limitar o número de requisições que você pode fazer em um instante de tempo (3 requisições por minuto, 10000 requisições por dia etc). 

Isso ocorre por dois motivos:

- Segurança: evitar uma sobrecarga no servidor deles que possa indisponibilizar a API para todos os usuários;

- Venda de planos: várias APIs pagas possuem diferentes planos de pagamento. Os planos mais caros costumam permitir mais requisições do que os mais baratos ou gratuitos.


__Que APIs posso usar?__

Como saber se existe uma boa API para ajudar? Confira alguns bons repositórios de API organizados por categoria:

- https://github.com/n0shake/public-apis

- https://github.com/public-apis/public-apis

- https://any-api.com/

    Sites de governos costumam ter uma grande riqueza de dados também. Segue abaixo algumas sugestões (oficiais ou mantidas por voluntários) com dados do Brasil como um todo. Experimente buscar por bases de dados de sua cidade ou estado!

- http://www.transparencia.gov.br/swagger-ui.html

- http://www.dados.gov.br/

- https://brasil.io/home/


__Vamos agora a alguns exemplos!__


https://open.exchangerate-api.com


__Um outro exemplo...__

API de informação de filmes (esse precisa de uma chave de autenticação!

http://www.omdbapi.com/