# Exercício de Integração ETL, ELT, APIs e Arquivos


## Trabalho em Grupo

Você trabalha em um e-commerce de variados produtos, e no último mês os gerentes operacionais da companhia notaram que
houve uma variação muito grande em seus estoques por períodos de até 24h, cujos produtos, voltavam ao estoque
no dia seguinte o que não caracterizava uma venda concretizada.
Sabendo disso um dos diretores sugeriu um estudo sobre os carrinhos em aberto, e qual o perfil dos usuários que deixavam seus carrinhos em aberto, e para isso fora criada uma demanda para seu time.

Para resulver esta demanda, você e seu time deverão realizar a ingestão dos dados de:

- Usuários
- Carrinhos

Estes dados poderão ser obtidos através dos seguintes endpoints:

- Usuários: https://dummyjson.com/auth/users
- Carrinhos: https://dummyjson.com/auth/carts

Lembrando que estes são endpoints seguros então você deverá realizar a autenticação através do seguinte endpoint: https://dummyjson.com/auth/login

Lembre-se de verificar a documentação para obter mais detalhes do funcionamento dos endpoints https://dummyjson.com/docs/auth

Após isso, os passos de tratamento do dado, serão:

1. Após consumidos os dados, você deverá persistí-los utilizando a técnica aprendida em aula em uma pastas chamada raw no formato json

2. Consumir sua camada raw e criar uma nova entidade que relacione os clientes aos carrihos através do atributo userId do seu carrinho e o atribute id da tabela users, feito isso gravar o resultado dessa agregação em uma pasta chamda kitchen

3. Por fim você deverá contemplar se os dados gerados são capazes de responder as seguintes perguntas:

   - Qual o estado de residencia possui clientes com mais carrinhos em aberto ?
   - Qual a idade dos usuários com mais carrinhos em aberto ?
   - Quais os produtos que mais aparecem em carrinhos em aberto ?

OBS: **Não se preocupe em fazer uma análise aprofundade, o intuito desta atividade é exercitar a construção de um fluxo de ETL ou ELT utilizando os conceitos aprendidos em sala de aula, então concentrem seus esforços no fluxo de dados**


In [None]:
import pandas as pd 
import requests
import json

def authenticate(login, senha):
    login_response = requests.post(
        url="https://dummyjson.com/auth/login",
        headers={"Content-Type": "application/json"},
        data=json.dumps({
            "username": login,
            "password": senha,
            "expiresInMins": 1
        })
    )
    
    return login_response.json()['token']
  

def get_authorization_headers():
    access_token = authenticate(login="kminchelle", senha="0lelplR")
    
    authorization_header = {
        "Authorization": f"Bearer {access_token}", 
        "Content-Type": "application/json"
    }
    
    return authorization_header
  
def get_endpoint(url: str):
    response = requests.get(
        url=url, 
        headers=get_authorization_headers()
    )
    
    return response.json() 


In [29]:
users = get_endpoint("https://dummyjson.com/auth/users")
carts = get_endpoint("https://dummyjson.com/auth/carts")

json_users = json.dumps(users)
json_carts = json.dumps(carts)

def file_convert_text(type: str, data: str, path: str):
  with open(f"../ex_full_cycle/{path}/{type}.json", mode="w") as file_to_write:
    file_to_write.write(data)  
    file_to_write.flush()
    file_to_write.close()    
    

file_convert_text("users", json_users, "raw_full_cycle")
file_convert_text("carts", json_carts, "raw_full_cycle")

In [32]:
def file_open(type: str):
  users_created = pd.read_json(f"../ex_full_cycle/raw_full_cycle/{type}.json", encoding="utf-8")
  return users_created
 

get_users = file_open("users")
get_carts = file_open("carts")

expanded_users = pd.DataFrame(pd.json_normalize(get_users['users']))
expanded_carts = pd.DataFrame(pd.json_normalize(get_carts['carts']))

expanded_users.rename(columns={"id": "userId"}, inplace=True)

join_merged = pd.merge(expanded_users, expanded_carts, on="userId", how="inner")
json_string = join_merged.to_json(orient='records')

file_convert_text("join_merged", json_string, "kitchen")    

'[{"userId":1,"firstName":"Terry","lastName":"Medhurst","maidenName":"Smitham","age":50,"gender":"male","email":"atuny0@sohu.com","phone":"+63 791 675 8914","username":"atuny0","password":"9uQFF1Lh","birthDate":"2000-12-25","image":"https:\\/\\/robohash.org\\/hicveldicta.png","bloodGroup":"A\\u2212","height":189,"weight":75.4,"eyeColor":"Green","domain":"slashdot.org","ip":"117.29.86.254","macAddress":"13:69:BA:56:A3:74","university":"Capitol University","ein":"20-9487066","ssn":"661-64-2976","userAgent":"Mozilla\\/5.0 (Windows NT 6.1) AppleWebKit\\/534.24 (KHTML, like Gecko) Chrome\\/12.0.702.0 Safari\\/534.24","hair.color":"Black","hair.type":"Strands","address.address":"1745 T Street Southeast","address.city":"Washington","address.coordinates.lat":38.867033,"address.coordinates.lng":-76.979235,"address.postalCode":"20020","address.state":"DC","bank.cardExpire":"06\\/22","bank.cardNumber":"50380955204220685","bank.cardType":"maestro","bank.currency":"Peso","bank.iban":"NO17 0695 2754