# Santander Dev Week 2023 (ETL com Python)

### Extract Transform e Load de dados de usuários de um banco

- Obtenção dos dados dos clientes através da API da Santander Dev Week 2023
- Transformação dos dados a partir da geração de novos atributos
- Envio dos dados modificados de volta para API

In [None]:
# Utilize sua própria URL se quiser ;)
# Repositório da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api
sdw2023_api_url = 'https://sdw-2023-prd.up.railway.app'

## **E**xtract

Extraia a lista de IDs de usuário a partir do arquivo CSV. Para cada ID, faça uma requisição GET para obter os dados do usuário correspondente.

In [None]:
import pandas as pd

df = pd.read_csv('SDW2023.csv')
user_ids = df['UserID'].tolist()
print(user_ids)

[100, 101, 102, 103]


In [None]:
import requests
import json

def get_user(id):
  response = requests.get(f'{sdw2023_api_url}/users/{id}')
  return response.json() if response.status_code == 200 else None

users = [user for id in user_ids if (user := get_user(id)) is not None]
print(json.dumps(users, indent=2))

[
  {
    "id": 100,
    "name": "\u00cdtalo",
    "account": {
      "id": 107,
      "number": "00001-19",
      "agency": "9999",
      "balance": 0.0,
      "limit": 200.0
    },
    "card": {
      "id": 99,
      "number": "**** **** **** 1129",
      "limit": 700.0
    },
    "features": [],
    "news": [
      {
        "id": 420,
        "icon": "https://images.genius.com/31fac7e2bef0ff83f25dbd8077863794.1000x1000x1.jpg",
        "description": "Eduardo esteve aqui"
      },
      {
        "id": 421,
        "icon": "https://images.genius.com/31fac7e2bef0ff83f25dbd8077863794.1000x1000x1.jpg",
        "description": "Eduardo esteve aqui"
      },
      {
        "id": 1056,
        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
        "description": "\u00cdtalo, \u00e9 claro que o surgimento do com\u00e9rcio virtual afeta positivamente a correta previs\u00e3o das formas de a\u00e7\u00e3o. "
      },
      {
        "id": 1477,
 

## **T**ransform

Adicionando aos usuários novos atributos
- Sobrenome
- Idade
- CPF

In [None]:
import random

def Idade():
  return str(random.randint(18, 60))

def Sobrenome():
    sobrenome = ["Ribeiro", "Nascimento", "Oliveira", "Souza", "Rodrigues",
                 "Ferreira", "Alves", "Pereira", "Lima", "Gonçalves"]

    return str(sobrenome[random.randint(0, len(sobrenome)-1)])

def CPF():
    cpf = [str(random.randint(0, 9)) for _ in range(11)]
    cpf = ''.join(cpf)

    return f"{cpf[:3]}.{cpf[3:6]}.{cpf[6:9]}-{cpf[9:]}"

In [None]:
for user in users:
  idade = Idade()
  sobrenome = Sobrenome()
  cpf = CPF()

  # api nao permite criar novas celulas
  user['features'].append({
    "icon": "Sobrenome // Idade // CPF",
    "description": f"{sobrenome} // {idade} // {cpf}"
  })

  print(f"{user['name']} {sobrenome}, idade:{idade},  cpf:{cpf}")

Ítalo Rodrigues, idade:35,  cpf:394.938.439-85
Douglas Pereira, idade:27,  cpf:510.053.757-89
Kauã Rodrigues, idade:30,  cpf:378.920.127-50
Neymar JR Ferreira, idade:45,  cpf:481.154.216-13


## **L**oad

Atualizando a lista de "news" de cada usuário na API com a nova mensagem gerada.

In [None]:
def update_user(user):
  response = requests.put(f"{sdw2023_api_url}/users/{user['id']}", json=user)
  return True if response.status_code == 200 else False

for user in users:
  success = update_user(user)
  print(f"User {user['name']} updated? {success}!")

User Ítalo updated? True!
User Douglas updated? True!
User Kauã updated? True!
User Neymar JR updated? True!


In [None]:
import requests
import json

def get_user(id):
  response = requests.get(f'{sdw2023_api_url}/users/{id}')
  return response.json() if response.status_code == 200 else None

users = [user for id in user_ids if (user := get_user(id)) is not None]
print(json.dumps(users, indent=2))

[
  {
    "id": 100,
    "name": "\u00cdtalo",
    "account": {
      "id": 107,
      "number": "00001-19",
      "agency": "9999",
      "balance": 0.0,
      "limit": 200.0
    },
    "card": {
      "id": 99,
      "number": "**** **** **** 1129",
      "limit": 700.0
    },
    "features": [
      {
        "id": 688,
        "icon": "Sobrenome // Idade // CPF",
        "description": "Oliveira // 27 // 674.832.789-44"
      }
    ],
    "news": [
      {
        "id": 420,
        "icon": "https://images.genius.com/31fac7e2bef0ff83f25dbd8077863794.1000x1000x1.jpg",
        "description": "Eduardo esteve aqui"
      },
      {
        "id": 421,
        "icon": "https://images.genius.com/31fac7e2bef0ff83f25dbd8077863794.1000x1000x1.jpg",
        "description": "Eduardo esteve aqui"
      },
      {
        "id": 1056,
        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
        "description": "\u00cdtalo, \u00e9 claro que o surgime