# Santander Dev Week 2023 (ETL com Python)

**Contexto:** Voc√™ √© um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo √© usar o poder da IA Generativa para criar mensagens de marketing personalizadas que ser√£o entregues a cada cliente.

**Condi√ß√µes do Problema:**

1. Voc√™ recebeu uma planilha simples, em formato CSV ('SDW2023.csv'), com uma lista de IDs de usu√°rio do banco:
  ```
  UserID
  1
  2
  3
  4
  5
  ```
2. Seu trabalho √© consumir o endpoint `GET https://sdw-2023-prd.up.railway.app/users/{id}` (API da Santander Dev Week 2023) para obter os dados de cada cliente.
3. Depois de obter os dados dos clientes, voc√™ vai usar a API do ChatGPT (OpenAI) para gerar uma mensagem de marketing personalizada para cada cliente. Essa mensagem deve enfatizar a import√¢ncia dos investimentos.
4. Uma vez que a mensagem para cada cliente esteja pronta, voc√™ vai enviar essas informa√ß√µes de volta para a API, atualizando a lista de "news" de cada usu√°rio usando o endpoint `PUT https://sdw-2023-prd.up.railway.app/users/{id}`.



In [15]:
# Utilize sua pr√≥pria URL se quiser ;)
# Reposit√≥rio da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api
sdw2023_api_url = 'https://sdw-2023-prd.up.railway.app'

## **E**xtract

Extraia a lista de IDs de usu√°rio a partir do arquivo CSV. Para cada ID, fa√ßa uma requisi√ß√£o GET para obter os dados do usu√°rio correspondente.

- Ao inv√©s de fazer uma requisi√ß√£o um-a-um, estou usando GET /users para retornar todos os usu√°rios listados no sistema, dessa forma s√≥ uma requisi√ß√£o ser√° feita ao servidor e possivelmente minimazar√° os gastos.

In [None]:
import requests

# Construa a URL completa para receber todos os clientes
client_endpoint = f"{sdw2023_api_url}/users"

# Fa√ßa a solicita√ß√£o GET para a API
response = requests.get(client_endpoint)

# Verifique se a solicita√ß√£o foi bem-sucedida (c√≥digo de status 200)
if response.status_code == 200:
    clients_data = response.json()  # Dados do cliente em formato JSON
    print(clients_data)
else:
    print(f"Erro ao obter dados do cliente. C√≥digo de status: {response.status_code}")

Caso deseje salvar localmente os usu√°rios rode a c√©lula abaixo:

In [None]:
import csv

# Caminho para o arquivo CSV de sa√≠da
csv_file_path = "SDW2023.csv"

# Extrair as chaves dos dicion√°rios para serem usadas como cabe√ßalhos do CSV
csv_headers = clients_data[0].keys()

# Escrever os dados no arquivo CSV
with open(csv_file_path, 'w', newline='', encoding='utf-8') as csv_file:
    csv_writer = csv.DictWriter(csv_file, fieldnames=csv_headers)
    csv_writer.writeheader()
    csv_writer.writerows(clients_data)

print(f"Dados salvos no arquivo CSV: {csv_file_path}")

Agora vamos conferir os IDs dos nossos usu√°rios. E a quantidade de usu√°rios que temos cadastrados.

In [1]:
import pandas as pd

df = pd.read_csv('SDW2023.csv')
user_ids = df['id'].tolist()
print(user_ids)
print(f"\nTotal de usu√°rios no sistema {len(user_ids)}")

[9, 116, 1, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 113, 114, 115, 118, 119, 120, 121, 122, 123, 124, 125, 127, 128, 129, 130, 132, 136, 137, 138, 139, 8, 5, 6, 10, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 252, 189, 190, 191, 192, 193, 194, 195, 196, 197, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 23

A parte de baixo n√£o ser√° mais utilizada no modo novo de extra√ß√£o.

In [23]:
'''import requests
import json

def get_user(id):
  response = requests.get(f'{sdw2023_api_url}/users/{id}')
  return response.json() if response.status_code == 200 else None

users = [user for id in user_ids if (user := get_user(id)) is not None]
print(json.dumps(users, indent=2))'''

#Imprimindo os usu√°rios do sistema:

print(df)

      id          name                                            account  \
0      9         Ayumi  {'id': 12, 'number': '00003-03', 'agency': '00...   
1    116         Maria  {'id': 123, 'number': '333-5', 'agency': '0001...   
2      1  Devweekerson  {'id': 1, 'number': '01.097954-4', 'agency': '...   
3     11       anguile  {'id': 18, 'number': '00010-4', 'agency': '200...   
4     12       Ronaldo  {'id': 19, 'number': '00001-4', 'agency': '003...   
..   ...           ...                                                ...   
292  312      Pyterson  {'id': 323, 'number': '11111-1', 'agency': '00...   
293  313           Pip  {'id': 324, 'number': '22222-2', 'agency': '00...   
294  314           Pip  {'id': 325, 'number': '33333-3', 'agency': '00...   
295  315           Pap  {'id': 326, 'number': '44444-4', 'agency': '00...   
296  316     Elon Musk  {'id': 327, 'number': '00001-9', 'agency': '00...   

                                                  card  \
0    {'id': 9, 'n

## **T**ransform

~Utilize a API do OpenAI GPT-4 para gerar uma mensagem de marketing personalizada para cada usu√°rio.~

Como n√£o tenho mais cr√©ditos na OPENAI, vou criar uma fun√ß√£o que gera respostas aleat√≥rias.

In [11]:
import random

def generate_random_news(user):
  possible_answers = [f'{user}, N√£o espere. Invista agora e garanta seu amanh√£.', f'{user}, Investir √© cuidar do seu futuro financeiro.', f'Ol√° {user}, O Santander tem solu√ß√µes de cr√©dito sob medida pra voc√™. Confira!',
                      f'Investir √© garantir um futuro financeiro s√≥lido. {user}, N√£o deixe seu dinheiro parado!', f'{user}. Invista seu dinheiro com sabedoria e garanta um futuro promissor.', f'{user}, O futuro √© hoje: invista para colher amanh√£.',
                      f'{user}, Invista hoje, desfrute no futuro.', f'{user}. Invista hoje, colha amanh√£! #FuturoBrilhante'
                     ]
  return random.choice(possible_answers)

# Atualizar a estrutura da coluna "news" para ser uma lista de dicion√°rios vazios
df["news"] = df["news"].apply(lambda x: [] if pd.isna(x) else eval(x))

# Iterar sobre cada linha do DataFrame
for index, user in df.iterrows():
    news = generate_random_news(user["name"])
    print(news)
    # Adicionar a nova not√≠cia ao usu√°rio
    user['news'].append({
        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
        "description": news
    })

# Agora, o DataFrame df cont√©m as not√≠cias geradas pela IA para cada usu√°rio

Investir √© garantir um futuro financeiro s√≥lido. Ayumi, N√£o deixe seu dinheiro parado!
Maria, Investir √© cuidar do seu futuro financeiro.
Devweekerson, Investir √© cuidar do seu futuro financeiro.
anguile. Invista hoje, colha amanh√£! #FuturoBrilhante
Ol√° Ronaldo, O Santander tem solu√ß√µes de cr√©dito sob medida pra voc√™. Confira!
anguile, Investir √© cuidar do seu futuro financeiro.
Ol√° Maria, O Santander tem solu√ß√µes de cr√©dito sob medida pra voc√™. Confira!
Pyterson. Invista seu dinheiro com sabedoria e garanta um futuro promissor.
Pip, O futuro √© hoje: invista para colher amanh√£.
Pep. Invista hoje, colha amanh√£! #FuturoBrilhante
Rides, Invista hoje, desfrute no futuro.
Investir √© garantir um futuro financeiro s√≥lido. Money Trees, N√£o deixe seu dinheiro parado!
a lot. Invista hoje, colha amanh√£! #FuturoBrilhante
Pyterson, Invista hoje, desfrute no futuro.
Homero, O futuro √© hoje: invista para colher amanh√£.
Caroline, N√£o espere. Invista agora e garanta seu amanh

## **L**oad

Atualize a lista de "news" de cada usu√°rio na API com a nova mensagem gerada.

In [19]:
def update_user(user):
    user_data = user.to_dict()  # Transforma a s√©rie em um dicion√°rio
    response = requests.put(f"{sdw2023_api_url}/users/{user['id']}", json=user_data)
    return True if response.status_code == 200 else False


# Iterar sobre cada linha do DataFrame
for index, user in df.iterrows():
  success = update_user(user)
  print(f"User {user['name']} updated? {success}!")
  if not success:
      break

User Ayumi updated? False!


No momento do teste a API estava com erro no servidor retornando erro 500[UnDoc