# Acesso aos dados via API

Alguns sites disponibilizam APIs (Application Programming Interface) para a captura de dados. Isso quer dizer, que o site criou uma série de URLs pelas quais os dados são fornecidos de forma 'pura'. O formato mais comum é o [JSON](https://www.json.org/json-en.html) (JavaScript Object Notation). Ele é uma forma muito usada para troca de dados entre sistemas, mas outros podem ser usados, como por exemplo o XML. 

#### Vantagens do JSON

* Leitura mais simples
* Analisador(parsing) mais fácil
* JSON suporta objetos! Sim, ele é tipado!
* Velocidade maior na execução e transporte de dados
* Arquivo com tamanho reduzido
* Quem utiliza? Google, Facebook, Yahoo!, Twitter...

![alt text](https://github.com/patriciacatandi/Lets_Code_Alunos/blob/main/02_Ferramentas_Programa%C3%A7%C3%A3o/05_Json/imagens/json_formato.png?raw=1)


### API REST 

Para fins didáticos, vamos usar uma API Fake https://jsonplaceholder.typicode.com/

GET: usado para recuperar informação, normalmente o que nós mais usamos no contexto de ciência de dados


In [None]:
url = 'https://jsonplaceholder.typicode.com/posts/1'

response = requests.get(url)
print(response.json())

POST: usado para enviar uma informação para o servidor


In [None]:
url = 'https://jsonplaceholder.typicode.com/posts'

# data={'key': 'value'}
data = { 'title': 'compras','body': 'Preciso de um mouse novo !','userId': 9,}
headers = {'content-type': 'application/json; charset=UTF-8'}

response = requests.post(url, data=json.dumps(data), headers=headers)
print(response.content)



In [None]:
# response.status_code

In [None]:
# response.headers

In [None]:
url = 'https://jsonplaceholder.typicode.com/posts/101'

response = requests.get(url)
print(response.json())

PUT: usado para atualizar uma informação 


In [None]:
url = 'https://jsonplaceholder.typicode.com/posts/1'
data = {'id':1, 'userId':2, 'title':'drink cold milk', 'body':'drinking water is important'}
headers = {'Content-Type':'application/json; charset=UTF-8'}
response = requests.put(url, data=json.dumps(data), headers=headers)


print(response.content)

DELETE: usado para deletar uma informação 

In [None]:
url = 'https://jsonplaceholder.typicode.com/posts/1'
headers = {'Content-Type': 'application/json; charset=UTF-8'}
response = requests.delete(url, headers=headers)

print(response.content) # <class 'str'>

# Vamos começar a trabalhar com alguns dados! 

In [None]:
import pandas as pd
import numpy as np
import requests
import json

https://viacep.com.br/?ref=devresourc.es

## Acessando uma API

In [None]:
response = requests.get('http://viacep.com.br/ws/01001000/json/').text

In [None]:
response

In [None]:
requests.get('http://viacep.com.br/ws/000/json/').text # formato errado

In [None]:
requests.get('http://viacep.com.br/ws/99999999/json/').text # formato correto, porem inexistente

In [None]:
 
requests_ends = requests.get('http://viacep.com.br/ws/RS/Porto Alegre/Domingos/json/').text #busca por enderenco

### Tratando os dados: transformando em dicionário

In [None]:
response_info = json.loads(response)

In [None]:
response_info

In [None]:
print('Logradouro: ', response_info['logradouro'])

In [None]:
requests_ends_dict = json.loads(requests_ends)

### data frame 

In [None]:
# dict to df

df_cep = pd.DataFrame.from_dict(response_info, orient='index')
df_cep

In [None]:
pd.DataFrame.from_dict(requests_ends_dict)

### Extraindo uma lista 

In [None]:
# lista de ceps
ceps = ['01001000', '04304111']
dicts_list = []
p1 = 'http://viacep.com.br/ws/'
p3 = '/json/'
for i in ceps:
    search = p1+i+p3
    response = requests.get(search).text
    dicts_list.append(json.loads(response))

In [None]:
dicts_list

In [None]:
pd.DataFrame(dicts_list)

## Referências

* https://pt.linkedin.com/pulse/consumindo-api-e-tratando-dados-com-python-alexandre-tavares
* https://docs.python-requests.org/en/latest/user/quickstart/
* https://towardsdatascience.com/json-and-apis-with-python-fba329ef6ef0