<a href="https://colab.research.google.com/github/fernandabomtorin16/dio-lab-open-source/blob/desafio-de-projeto/Pipeline_ETL_Fernanda_Bomtorin.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Santander Dev Week 2023 (ETL com Python)

**Contexto:** Você é um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo é usar o poder da IA Generativa para criar mensagens de marketing personalizadas que serão entregues a cada cliente.

**Condições do Problema:**

1. Você recebeu uma planilha simples, em formato CSV ('SDW2023.csv'), com uma lista de IDs de usuário do banco:
  ```
  UserID
  1
  2
  3
  4
  5
  ```
2. Seu trabalho é consumir o endpoint `GET https://sdw-2023-prd.up.railway.app/users/{id}` (API da Santander Dev Week 2023) para obter os dados de cada cliente.
3. Depois de obter os dados dos clientes, você vai usar a API do ChatGPT (OpenAI) para gerar uma mensagem de marketing personalizada para cada cliente. Essa mensagem deve enfatizar a importância dos investimentos.
4. Uma vez que a mensagem para cada cliente esteja pronta, você vai enviar essas informações de volta para a API, atualizando a lista de "news" de cada usuário usando o endpoint `PUT https://sdw-2023-prd.up.railway.app/users/{id}`.



In [87]:
# Utilize sua própria URL se quiser ;)
# Repositório da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api
sdw2023_api_url = 'https://sdw-2023-prd.up.railway.app'

## **E**xtract

In [88]:
import pandas as pd

df = pd.read_csv('SDW2023.csv', sep=';')

In [89]:
df.head()

Unnamed: 0,id,name,account id,account number,account agency,account balance,account limit,card id,card number,card limit,features,news
0,1872,Chanel,1961,56182-3,1,0.0,500.0,1805,**** **** **** 5612,500.0,,
1,1873,Lilly,1962,64521-5,1,0.0,1000.0,1806,**** **** **** 2656,1000.0,,
2,1874,Luci,1963,32896-2,1,0.0,800.0,1807,**** **** **** 3519,800.0,,


# Transform

In [90]:
# Primeiro traduzir os nomes

df = df.rename(columns={'id':'ID', 'name':'Nome', 'account id':'Conta', 'account number':'Número da Conta','account agency':'Agência', 'account balance':'Balanço da Conta', 'account limit':'Limite da Conta', 'card id':'ID do Cartão', 'card number':'Número do Cartão','card limit':'Limite do Cartão'})
df.head()

Unnamed: 0,ID,Nome,Conta,Número da Conta,Agência,Balanço da Conta,Limite da Conta,ID do Cartão,Número do Cartão,Limite do Cartão,features,news
0,1872,Chanel,1961,56182-3,1,0.0,500.0,1805,**** **** **** 5612,500.0,,
1,1873,Lilly,1962,64521-5,1,0.0,1000.0,1806,**** **** **** 2656,1000.0,,
2,1874,Luci,1963,32896-2,1,0.0,800.0,1807,**** **** **** 3519,800.0,,


In [91]:
df = df.drop(columns=['features', 'news'])
df.head()

Unnamed: 0,ID,Nome,Conta,Número da Conta,Agência,Balanço da Conta,Limite da Conta,ID do Cartão,Número do Cartão,Limite do Cartão
0,1872,Chanel,1961,56182-3,1,0.0,500.0,1805,**** **** **** 5612,500.0
1,1873,Lilly,1962,64521-5,1,0.0,1000.0,1806,**** **** **** 2656,1000.0
2,1874,Luci,1963,32896-2,1,0.0,800.0,1807,**** **** **** 3519,800.0


# Load

In [126]:
df.to_csv("base_trasformada.csv", sep=';')