# Santander Dev Week 2023 (ETL com Python)

**Contexto:** Você é um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo é usar o poder da IA Generativa para criar mensagens de marketing personalizadas que serão entregues a cada cliente.

**Condições do Problema:**

1. Você recebeu uma planilha simples, em formato CSV ('SDW2023.csv'), com uma lista de IDs de usuário do banco:
  ```
  UserID
  1
  2
  3
  4
  5
  ```
2. Seu trabalho é consumir o endpoint `GET https://sdw-2023-prd.up.railway.app/users/{id}` (API da Santander Dev Week 2023) para obter os dados de cada cliente.
3. Depois de obter os dados dos clientes, você vai usar a API do ChatGPT (OpenAI) para gerar uma mensagem de marketing personalizada para cada cliente. Essa mensagem deve enfatizar a importância dos investimentos.
4. Uma vez que a mensagem para cada cliente esteja pronta, você vai enviar essas informações de volta para a API, atualizando a lista de "news" de cada usuário usando o endpoint `PUT https://sdw-2023-prd.up.railway.app/users/{id}`.



In [None]:
'''
# Utilize sua própria URL se quiser ;)
# Repositório da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api
sdw2023_api_url = 'https://sdw-2023-prd.up.railway.app'
'''

"\n# Utilize sua própria URL se quiser ;)\n# Repositório da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api\nsdw2023_api_url = 'https://sdw-2023-prd.up.railway.app'\n"

## **E**xtract

Extraia a lista de IDs de usuário a partir do arquivo CSV. Para cada ID, faça uma requisição GET para obter os dados do usuário correspondente.

In [45]:
import pandas as pd

df = pd.read_csv('SDW2023.csv')
user_ids = df['UserID'].tolist()
print(user_ids)

[4, 5, 6]


In [None]:
'''
import requests
import json

def get_user(id):
  response = requests.get(f'{sdw2023_api_url}/users/{id}')
  return response.json() if response.status_code == 200 else None

users = [user for id in user_ids if (user := get_user(id)) is not None]
print(json.dumps(users, indent=2))
'''

"\nimport requests\nimport json\n\ndef get_user(id):\n  response = requests.get(f'{sdw2023_api_url}/users/{id}')\n  return response.json() if response.status_code == 200 else None\n\nusers = [user for id in user_ids if (user := get_user(id)) is not None]\nprint(json.dumps(users, indent=2))\n"

In [46]:
arquivo = ('/content/customers.csv')
customers = pd.read_csv(arquivo, sep = ";")

In [47]:
customers

Unnamed: 0,id,name,account_id,account_number,account_agency,account_balance,account_limit,card_id,card_number,card_limit,features_id,features_icon,features_description,news_id,news_icon,news_description
0,1,Haruki Murakami,1,01.097954-4,2030,62412,1000,1,xxxx xxxx xxxx 1111,2000,1,https://digitalinnovationone.github.io/santand...,PIX,1,https://digitalinnovationone.github.io/santand...,O Santander tem solucoes de credito sob medida...
1,2,Chinua Achebe,2,02.198765-5,2040,89530,1500,2,xxxx xxxx xxxx 2222,2500,2,https://digitalinnovationone.github.io/santand...,Pagar,2,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
2,3,Isabel Allende,3,03.135792-6,2050,124567,2000,3,xxxx xxxx xxxx 3333,3000,3,https://digitalinnovationone.github.io/santand...,Transferir,3,https://digitalinnovationone.github.io/santand...,O Santander tem solucoes de credito sob medida...
3,4,Leo Tolstoy,4,04.246813-7,2060,43256,800,4,xxxx xxxx xxxx 4444,1000,4,https://digitalinnovationone.github.io/santand...,Conta Corrente,4,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
4,5,Chimamanda Ngozi Adichie,5,05.777777-8,2070,98743,1500,5,xxxx xxxx xxxx 5555,2000,5,https://digitalinnovationone.github.io/santand...,Cartoes,5,https://digitalinnovationone.github.io/santand...,O Santander tem solucoes de credito sob medida...
5,6,Machado de Assis,6,06.369258-9,2080,132500,2000,6,xxxx xxxx xxxx 6666,2500,6,https://digitalinnovationone.github.io/santand...,PIX,6,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
6,7,Julio Cortazar,7,07.987654-0,2090,78923,1000,7,xxxx xxxx xxxx 7777,1200,7,https://digitalinnovationone.github.io/santand...,Pagar,7,https://digitalinnovationone.github.io/santand...,O Santander tem solucoes de credito sob medida...
7,8,Chinweizu Ibekwe,8,08.123456-1,2100,152345,2000,8,xxxx xxxx xxxx 8888,2500,8,https://digitalinnovationone.github.io/santand...,Transferir,8,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
8,9,Ngugi wa Thiongo,9,09.555555-2,2110,63278,800,9,xxxx xxxx xxxx 9999,1000,9,https://digitalinnovationone.github.io/santand...,Conta Corrente,9,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
9,10,Gabriel Garcia Marquez,10,10.987654-3,2120,87432,1500,10,xxxx xxxx xxxx 0000,2000,10,https://digitalinnovationone.github.io/santand...,Cartoes,10,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa


In [48]:
users = customers[customers['id'].isin(user_ids)]

In [49]:
users

Unnamed: 0,id,name,account_id,account_number,account_agency,account_balance,account_limit,card_id,card_number,card_limit,features_id,features_icon,features_description,news_id,news_icon,news_description
3,4,Leo Tolstoy,4,04.246813-7,2060,43256,800,4,xxxx xxxx xxxx 4444,1000,4,https://digitalinnovationone.github.io/santand...,Conta Corrente,4,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
4,5,Chimamanda Ngozi Adichie,5,05.777777-8,2070,98743,1500,5,xxxx xxxx xxxx 5555,2000,5,https://digitalinnovationone.github.io/santand...,Cartoes,5,https://digitalinnovationone.github.io/santand...,O Santander tem solucoes de credito sob medida...
5,6,Machado de Assis,6,06.369258-9,2080,132500,2000,6,xxxx xxxx xxxx 6666,2500,6,https://digitalinnovationone.github.io/santand...,PIX,6,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa


## **T**ransform

Utilize a API do OpenAI GPT-4 para gerar uma mensagem de marketing personalizada para cada usuário.

In [20]:
#!pip install openai

In [21]:
# Documentação Oficial da API OpenAI: https://platform.openai.com/docs/api-reference/introduction
# Informações sobre o Período Gratuito: https://help.openai.com/en/articles/4936830

# Para gerar uma API Key:
# 1. Crie uma conta na OpenAI
# 2. Acesse a seção "API Keys"
# 3. Clique em "Create API Key"
# Link direto: https://platform.openai.com/account/api-keys

# Substitua o texto TODO por sua API Key da OpenAI, ela será salva como uma variável de ambiente.
#openai_api_key = 'sk-wIWMI7Ms**************'

In [22]:
"""

RateLimitError: You exceeded your current quota, please check your plan and billing details.

import openai

openai.api_key = openai_api_key

def generate_ai_news(user):
    completion = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[
            {
                "role": "system",
                "content": "Você é um especialista em marketing bancário."
            },
            {
                "role": "user",
                "content": f"Crie uma mensagem para {user['name']} sobre a importância dos investimentos (máximo de 100 caracteres)"
            }
        ]
    )
    return completion.choices[0].message.content.strip('"')

for index, customer in users.iterrows():
    user_info = {
        "name": customer['name'],
    }
    news = generate_ai_news(user_info)
    print(news)

    users.at[index, 'news'] = {
        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
        "description": news
    }
"""

'\n\nRateLimitError: You exceeded your current quota, please check your plan and billing details.\n\nimport openai\n\nopenai.api_key = openai_api_key\n\ndef generate_ai_news(user):\n    completion = openai.ChatCompletion.create(\n        model="gpt-3.5-turbo",\n        messages=[\n            {\n                "role": "system",\n                "content": "Você é um especialista em marketing bancário."\n            },\n            {\n                "role": "user",\n                "content": f"Crie uma mensagem para {user[\'name\']} sobre a importância dos investimentos (máximo de 100 caracteres)"\n            }\n        ]\n    )\n    return completion.choices[0].message.content.strip(\'"\')\n\nfor index, customer in users.iterrows():\n    user_info = {\n        "name": customer[\'name\'],\n    }\n    news = generate_ai_news(user_info)\n    print(news)\n    \n    users.at[index, \'news\'] = {\n        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/c

In [23]:
mensagens = [
    "Warren Buffett: 'A melhor época para investir foi ontem, a segunda melhor é hoje.'",
    "Elon Musk: 'Investir em inovação é o caminho para o sucesso financeiro.'",
    "Oprah Winfrey: 'O investimento em educação é o investimento mais importante que você pode fazer.'",
    "Jeff Bezos: 'Arrisque-se. Se você vencer, será um empreendedor de sucesso; se não, aprenderá algo valioso.'",
    "Charlie Munger: 'O maior inimigo do investidor é ele mesmo.'",
    "Sheryl Sandberg: 'Invista em você mesma e acredite em seu potencial.'",
    "Richard Branson: 'Cada centavo economizado é um centavo que pode ser investido em seu futuro.'",
    "Mark Cuban: 'Nunca pare de aprender. O investimento em conhecimento rende os melhores juros.'",
    "Warren Buffett: 'Ações são a maneira de criar riqueza a longo prazo.'",
    "Elon Musk: 'Pense grande. Grandes investimentos trazem grandes recompensas.'",
    "Oprah Winfrey: 'O investimento em si mesmo é a melhor aposta que você pode fazer.'",
    "Jeff Bezos: 'O investimento em equipe é tão importante quanto o investimento em ideias.'",
    "Charlie Munger: 'Diversificar seus investimentos reduz o risco financeiro.'",
    "Sheryl Sandberg: 'A mentalidade positiva é uma ferramenta poderosa para o sucesso financeiro.'",
    "Richard Branson: 'O investimento em networking pode abrir portas financeiras.'",
    "Mark Cuban: 'A pesquisa é essencial antes de qualquer investimento.'",
    "Warren Buffett: 'A paciência é a chave para o sucesso no mercado de ações.'",
    "Elon Musk: 'Investir em sustentabilidade é investir no futuro.'",
    "Oprah Winfrey: 'O investimento em caridade também é um investimento em si mesmo.'",
    "Jeff Bezos: 'Persistência é o segredo do sucesso financeiro.'"
]

In [50]:
import random

# Função para criar mensagens personalizadas
def criar_mensagem_personalizada(nome):
    mensagem = random.choice(mensagens)
    return f"Olá {nome}, gostaria de compartilhar esse pensamento contigo: {mensagem}. E se precisar de uma dica para investir estou aqui para te ajudar."

# Aplicar a função criar_mensagem_personalizada à coluna 'name' e atualizar 'news_description'
users['news_description'] = users['name'].apply(criar_mensagem_personalizada)

# Exiba o DataFrame com as mensagens personalizadas
users

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  users['news_description'] = users['name'].apply(criar_mensagem_personalizada)


Unnamed: 0,id,name,account_id,account_number,account_agency,account_balance,account_limit,card_id,card_number,card_limit,features_id,features_icon,features_description,news_id,news_icon,news_description
3,4,Leo Tolstoy,4,04.246813-7,2060,43256,800,4,xxxx xxxx xxxx 4444,1000,4,https://digitalinnovationone.github.io/santand...,Conta Corrente,4,https://digitalinnovationone.github.io/santand...,"Olá Leo Tolstoy, gostaria de compartilhar esse..."
4,5,Chimamanda Ngozi Adichie,5,05.777777-8,2070,98743,1500,5,xxxx xxxx xxxx 5555,2000,5,https://digitalinnovationone.github.io/santand...,Cartoes,5,https://digitalinnovationone.github.io/santand...,"Olá Chimamanda Ngozi Adichie, gostaria de comp..."
5,6,Machado de Assis,6,06.369258-9,2080,132500,2000,6,xxxx xxxx xxxx 6666,2500,6,https://digitalinnovationone.github.io/santand...,PIX,6,https://digitalinnovationone.github.io/santand...,"Olá Machado de Assis, gostaria de compartilhar..."


In [51]:
# Função para criar mensagens personalizadas com base no ID
def criar_mensagem_personalizada(id_escolhido):
    mensagem = random.choice(mensagens)
    nome = customers.loc[customers['id'] == id_escolhido, 'name'].values[0]
    return f"Olá {nome}, gostaria de compartilhar esse pensamento contigo: {mensagem}. E se precisar de uma dica para investir estou aqui para te ajudar."

# Solicita ao usuário que digite um ID
try:
    id_escolhido = int(input("Digite um ID da lista de IDs disponíveis: "))

    # Verifica se o ID existe no DataFrame
    if id_escolhido in customers['id'].values:
        mensagem_personalizada = criar_mensagem_personalizada(id_escolhido)
        print(mensagem_personalizada)
    else:
        print("ID não encontrado na lista.")
except ValueError:
    print("ID inválido. Por favor, digite um número válido.")

Digite um ID da lista de IDs disponíveis: 8
Olá Chinweizu Ibekwe, gostaria de compartilhar esse pensamento contigo: Oprah Winfrey: 'O investimento em caridade também é um investimento em si mesmo.'. E se precisar de uma dica para investir estou aqui para te ajudar.


In [52]:
# Atualiza a coluna 'news_description' com a mensagem
customers.loc[customers['id'] == id_escolhido, 'news_description'] = mensagem_personalizada

# Exibe o DataFrame atualizado
customers

Unnamed: 0,id,name,account_id,account_number,account_agency,account_balance,account_limit,card_id,card_number,card_limit,features_id,features_icon,features_description,news_id,news_icon,news_description
0,1,Haruki Murakami,1,01.097954-4,2030,62412,1000,1,xxxx xxxx xxxx 1111,2000,1,https://digitalinnovationone.github.io/santand...,PIX,1,https://digitalinnovationone.github.io/santand...,O Santander tem solucoes de credito sob medida...
1,2,Chinua Achebe,2,02.198765-5,2040,89530,1500,2,xxxx xxxx xxxx 2222,2500,2,https://digitalinnovationone.github.io/santand...,Pagar,2,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
2,3,Isabel Allende,3,03.135792-6,2050,124567,2000,3,xxxx xxxx xxxx 3333,3000,3,https://digitalinnovationone.github.io/santand...,Transferir,3,https://digitalinnovationone.github.io/santand...,O Santander tem solucoes de credito sob medida...
3,4,Leo Tolstoy,4,04.246813-7,2060,43256,800,4,xxxx xxxx xxxx 4444,1000,4,https://digitalinnovationone.github.io/santand...,Conta Corrente,4,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
4,5,Chimamanda Ngozi Adichie,5,05.777777-8,2070,98743,1500,5,xxxx xxxx xxxx 5555,2000,5,https://digitalinnovationone.github.io/santand...,Cartoes,5,https://digitalinnovationone.github.io/santand...,O Santander tem solucoes de credito sob medida...
5,6,Machado de Assis,6,06.369258-9,2080,132500,2000,6,xxxx xxxx xxxx 6666,2500,6,https://digitalinnovationone.github.io/santand...,PIX,6,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
6,7,Julio Cortazar,7,07.987654-0,2090,78923,1000,7,xxxx xxxx xxxx 7777,1200,7,https://digitalinnovationone.github.io/santand...,Pagar,7,https://digitalinnovationone.github.io/santand...,O Santander tem solucoes de credito sob medida...
7,8,Chinweizu Ibekwe,8,08.123456-1,2100,152345,2000,8,xxxx xxxx xxxx 8888,2500,8,https://digitalinnovationone.github.io/santand...,Transferir,8,https://digitalinnovationone.github.io/santand...,"Olá Chinweizu Ibekwe, gostaria de compartilhar..."
8,9,Ngugi wa Thiongo,9,09.555555-2,2110,63278,800,9,xxxx xxxx xxxx 9999,1000,9,https://digitalinnovationone.github.io/santand...,Conta Corrente,9,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa
9,10,Gabriel Garcia Marquez,10,10.987654-3,2120,87432,1500,10,xxxx xxxx xxxx 0000,2000,10,https://digitalinnovationone.github.io/santand...,Cartoes,10,https://digitalinnovationone.github.io/santand...,Santander Seguro Casa


## **L**oad

Atualize a lista de "news" de cada usuário na API com a nova mensagem gerada.

In [54]:
'''
def update_user(user):
  response = requests.put(f"{sdw2023_api_url}/users/{user['id']}", json=user)
  return True if response.status_code == 200 else False

for user in users:
  success = update_user(user)
  print(f"User {user['name']} updated? {success}!")
'''

'\ndef update_user(user):\n  response = requests.put(f"{sdw2023_api_url}/users/{user[\'id\']}", json=user)\n  return True if response.status_code == 200 else False\n\nfor user in users:\n  success = update_user(user)\n  print(f"User {user[\'name\']} updated? {success}!")\n'

In [57]:
# Usa compreensão de listas para atribuir mensagens aleatórias aos usuários
customers['news_description'] = [
    f"Olá {row['name']}, gostaria de compartilhar esse pensamento contigo: {random.choice(mensagens)}. E se precisar de uma dica para investir estou aqui para te ajudar."
    for _, row in customers.iterrows()]

# Exibe o DataFrame resultante
customers

Unnamed: 0,id,name,account_id,account_number,account_agency,account_balance,account_limit,card_id,card_number,card_limit,features_id,features_icon,features_description,news_id,news_icon,news_description
0,1,Haruki Murakami,1,01.097954-4,2030,62412,1000,1,xxxx xxxx xxxx 1111,2000,1,https://digitalinnovationone.github.io/santand...,PIX,1,https://digitalinnovationone.github.io/santand...,"Olá Haruki Murakami, gostaria de compartilhar ..."
1,2,Chinua Achebe,2,02.198765-5,2040,89530,1500,2,xxxx xxxx xxxx 2222,2500,2,https://digitalinnovationone.github.io/santand...,Pagar,2,https://digitalinnovationone.github.io/santand...,"Olá Chinua Achebe, gostaria de compartilhar es..."
2,3,Isabel Allende,3,03.135792-6,2050,124567,2000,3,xxxx xxxx xxxx 3333,3000,3,https://digitalinnovationone.github.io/santand...,Transferir,3,https://digitalinnovationone.github.io/santand...,"Olá Isabel Allende, gostaria de compartilhar e..."
3,4,Leo Tolstoy,4,04.246813-7,2060,43256,800,4,xxxx xxxx xxxx 4444,1000,4,https://digitalinnovationone.github.io/santand...,Conta Corrente,4,https://digitalinnovationone.github.io/santand...,"Olá Leo Tolstoy, gostaria de compartilhar esse..."
4,5,Chimamanda Ngozi Adichie,5,05.777777-8,2070,98743,1500,5,xxxx xxxx xxxx 5555,2000,5,https://digitalinnovationone.github.io/santand...,Cartoes,5,https://digitalinnovationone.github.io/santand...,"Olá Chimamanda Ngozi Adichie, gostaria de comp..."
5,6,Machado de Assis,6,06.369258-9,2080,132500,2000,6,xxxx xxxx xxxx 6666,2500,6,https://digitalinnovationone.github.io/santand...,PIX,6,https://digitalinnovationone.github.io/santand...,"Olá Machado de Assis, gostaria de compartilhar..."
6,7,Julio Cortazar,7,07.987654-0,2090,78923,1000,7,xxxx xxxx xxxx 7777,1200,7,https://digitalinnovationone.github.io/santand...,Pagar,7,https://digitalinnovationone.github.io/santand...,"Olá Julio Cortazar, gostaria de compartilhar e..."
7,8,Chinweizu Ibekwe,8,08.123456-1,2100,152345,2000,8,xxxx xxxx xxxx 8888,2500,8,https://digitalinnovationone.github.io/santand...,Transferir,8,https://digitalinnovationone.github.io/santand...,"Olá Chinweizu Ibekwe, gostaria de compartilhar..."
8,9,Ngugi wa Thiongo,9,09.555555-2,2110,63278,800,9,xxxx xxxx xxxx 9999,1000,9,https://digitalinnovationone.github.io/santand...,Conta Corrente,9,https://digitalinnovationone.github.io/santand...,"Olá Ngugi wa Thiongo, gostaria de compartilhar..."
9,10,Gabriel Garcia Marquez,10,10.987654-3,2120,87432,1500,10,xxxx xxxx xxxx 0000,2000,10,https://digitalinnovationone.github.io/santand...,Cartoes,10,https://digitalinnovationone.github.io/santand...,"Olá Gabriel Garcia Marquez, gostaria de compar..."
