<a href="https://colab.research.google.com/github/pablobalmeida/santander-dev-week-2023/blob/master/Entrega_Projeto/SantanderDevWeek2023.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Santander Dev Week 2023 (ETL com Python)

**Contexto:** Você é um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo é usar o poder da IA Generativa para criar mensagens de marketing personalizadas que serão entregues a cada cliente.

**Condições do Problema:**

1. Você recebeu uma planilha simples, em formato CSV ('SDW2023.csv'), com uma lista de IDs de usuário do banco:
  ```
  UserID
  1
  2
  3
  4
  5
  ```
2. Seu trabalho é consumir o endpoint `GET https://sdw-2023-prd.up.railway.app/users/{id}` (API da Santander Dev Week 2023) para obter os dados de cada cliente.
3. Depois de obter os dados dos clientes, você vai usar a API do ChatGPT (OpenAI) para gerar uma mensagem de marketing personalizada para cada cliente. Essa mensagem deve enfatizar a importância dos investimentos.
4. Uma vez que a mensagem para cada cliente esteja pronta, você vai enviar essas informações de volta para a API, atualizando a lista de "news" de cada usuário usando o endpoint `PUT https://sdw-2023-prd.up.railway.app/users/{id}`.



In [None]:
# Utilize sua própria URL se quiser ;)
# Repositório da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api
sdw2023_api_url = 'https://sdw-2023-prd.up.railway.app'

## **E**xtract

Extraia a lista de IDs de usuário a partir do arquivo CSV. Para cada ID, faça uma requisição GET para obter os dados do usuário correspondente.

In [5]:
import pandas as pd


df = pd.read_csv('SDW2023.csv')
user_ids = df['UserID'].tolist()
print(user_ids)

[4, 5, 6]


In [58]:
with open('usuarios.csv', 'r') as arquivo:
    conteudo = arquivo.read()

print(conteudo)

dados = [
{
  "id": 4,
  "name": "Pyterson",
  "account": {
    "id": 7,
    "number": "00001-1",
    "agency": "0001",
    "balance": 0.0,
    "limit": 500.0
  },
  "card": {
    "id": 4,
    "number": "**** **** **** 1111",
    "limit": 1000.0
  }
},
{
  "id": 5,
  "name": "Pip",
  "account": {
    "id": 8,
    "number": "00002-2",
    "agency": "0001",
    "balance": 0.0,
    "limit": 500.0
  },
  "card": {
    "id": 5,
    "number": "**** **** **** 2222",
    "limit": 1000.0
  }
},
{
  "id": 6,
  "name": "Pep",
  "account": {
    "id": 9,
    "number": "00003-3",
    "agency": "0001",
    "balance": 0.0,
    "limit": 500.0
  },
  "card": {
    "id": 6,
    "number": "**** **** **** 3333",
    "limit": 1000.0
  }
}
]

import csv

dados_csv = []

for usuario in dados:
    dados_csv.append({
        "id": usuario["id"],
        "name": usuario["name"],
        "account_id": usuario["account"]["id"],
        "account_number": usuario["account"]["number"],
        "account_agency": usua

In [59]:
import pandas as pd
from io import StringIO

# Colar o conteúdo do arquivo aqui (entre as três aspas)
conteudo_csv = """
id,name,account_id,account_number,account_agency,account_balance,account_limit,card_id,card_number,card_limit
4,Pyterson,7,00001-1,0001,0.0,500.0,4,**** **** **** 1111,1000.0
5,Pip,8,00002-2,0001,0.0,500.0,5,**** **** **** 2222,1000.0
6,Pep,9,00003-3,0001,0.0,500.0,6,**** **** **** 3333,1000.0
"""

# Ler os dados como um DataFrame
df = pd.read_csv(StringIO(conteudo_csv))

# Exibir os dados
df

Unnamed: 0,id,name,account_id,account_number,account_agency,account_balance,account_limit,card_id,card_number,card_limit
0,4,Pyterson,7,00001-1,1,0.0,500.0,4,**** **** **** 1111,1000.0
1,5,Pip,8,00002-2,1,0.0,500.0,5,**** **** **** 2222,1000.0
2,6,Pep,9,00003-3,1,0.0,500.0,6,**** **** **** 3333,1000.0


In [63]:
def get_user(user_id):
    # Aqui você coloca a lógica para obter o usuário com o ID fornecido
    # Por exemplo, você pode buscar o usuário no DataFrame usando o user_id
    user = df[df['id'] == user_id].to_dict(orient='records')
    return user[0] if user else None

# Obter os usuários
user_records = df.to_dict(orient='records')
users = [user for user in user_records if get_user(user['id']) is not None]

# Exibir os usuários filtrados
print(json.dumps(users, indent=2))

[
  {
    "id": 4,
    "name": "Pyterson",
    "account_id": 7,
    "account_number": "00001-1",
    "account_agency": 1,
    "account_balance": 0.0,
    "account_limit": 500.0,
    "card_id": 4,
    "card_number": "**** **** **** 1111",
    "card_limit": 1000.0
  },
  {
    "id": 5,
    "name": "Pip",
    "account_id": 8,
    "account_number": "00002-2",
    "account_agency": 1,
    "account_balance": 0.0,
    "account_limit": 500.0,
    "card_id": 5,
    "card_number": "**** **** **** 2222",
    "card_limit": 1000.0
  },
  {
    "id": 6,
    "name": "Pep",
    "account_id": 9,
    "account_number": "00003-3",
    "account_agency": 1,
    "account_balance": 0.0,
    "account_limit": 500.0,
    "card_id": 6,
    "card_number": "**** **** **** 3333",
    "card_limit": 1000.0
  }
]


In [None]:
import requests
import json

def get_user(id):
  response = requests.get(f'{sdw2023_api_url}/users/{id}')
  return response.json() if response.status_code == 200 else None

users = [user for id in user_ids if (user := get_user(id)) is not None]
print(json.dumps(users, indent=2))

[
  {
    "id": 4,
    "name": "Pyterson",
    "account": {
      "id": 7,
      "number": "00001-1",
      "agency": "0001",
      "balance": 0.0,
      "limit": 500.0
    },
    "card": {
      "id": 4,
      "number": "**** **** **** 1111",
      "limit": 1000.0
    },
    "features": [],
    "news": [
      {
        "id": 9,
        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
        "description": "Pyterson, invista hoje para garantir um futuro seguro e pr\u00f3spero. Seu futuro agradece!"
      }
    ]
  },
  {
    "id": 5,
    "name": "Pip",
    "account": {
      "id": 8,
      "number": "00002-2",
      "agency": "0001",
      "balance": 0.0,
      "limit": 500.0
    },
    "card": {
      "id": 5,
      "number": "**** **** **** 2222",
      "limit": 1000.0
    },
    "features": [],
    "news": [
      {
        "id": 10,
        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",


## **T**ransform

Utilize a API do OpenAI GPT-4 para gerar uma mensagem de marketing personalizada para cada usuário.

In [64]:
!pip install openai

Collecting openai
  Downloading openai-0.28.1-py3-none-any.whl (76 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/77.0 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━[0m [32m71.7/77.0 kB[0m [31m2.2 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.0/77.0 kB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: openai
Successfully installed openai-0.28.1


In [65]:
# Documentação Oficial da API OpenAI: https://platform.openai.com/docs/api-reference/introduction
# Informações sobre o Período Gratuito: https://help.openai.com/en/articles/4936830

# Para gerar uma API Key:
# 1. Crie uma conta na OpenAI
# 2. Acesse a seção "API Keys"
# 3. Clique em "Create API Key"
# Link direto: https://platform.openai.com/account/api-keys

# Substitua o texto TODO por sua API Key da OpenAI, ela será salva como uma variável de ambiente.
openai_api_key = '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'

In [66]:
import openai

openai.api_key = openai_api_key

def generate_ai_news(user):
  completion = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
      {
          "role": "system",
          "content": "Você é um especialista em markting bancário."
      },
      {
          "role": "user",
          "content": f"Crie uma mensagem para {user['name']} sobre a importância dos investimentos (máximo de 100 caracteres)"
      }
    ]
  )
  return completion.choices[0].message.content.strip('\"')

for user in users:
  news = generate_ai_news(user)
  print(news)
  user['news'].append({
      "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
      "description": news
  })

RateLimitError: ignored

## **L**oad

Atualize a lista de "news" de cada usuário na API com a nova mensagem gerada.

In [67]:
def update_user(user):
  response = requests.put(f"{sdw2023_api_url}/users/{user['id']}", json=user)
  return True if response.status_code == 200 else False

for user in users:
  success = update_user(user)
  print(f"User {user['name']} updated? {success}!")

NameError: ignored