<a href="https://colab.research.google.com/github/JULIACARDOSO/JULIACARDOSO/blob/main/ETL_com_Python_Santander_Bootcamp.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Santander Dev Week 2023 (ETL com Python)

**Contexto:** Você é um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo é usar o poder da IA Generativa para criar mensagens de marketing personalizadas que serão entregues a cada cliente.

**Condições do Problema:**

1. Você recebeu uma planilha simples, em formato CSV ('SDW2023.csv'), com uma lista de IDs de usuário do banco:
  ```
  UserID
  1
  2
  3
  4
  5
  ```
2. Seu trabalho é consumir o endpoint `GET https://sdw-2023-prd.up.railway.app/users/{id}` (API da Santander Dev Week 2023) para obter os dados de cada cliente.
3. Depois de obter os dados dos clientes, você vai usar a API do ChatGPT (OpenAI) para gerar uma mensagem de marketing personalizada para cada cliente. Essa mensagem deve enfatizar a importância dos investimentos.
4. Uma vez que a mensagem para cada cliente esteja pronta, você vai enviar essas informações de volta para a API, atualizando a lista de "news" de cada usuário usando o endpoint `PUT https://sdw-2023-prd.up.railway.app/users/{id}`.



In [5]:
# Utilize sua própria URL se quiser ;)
# Repositório da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api
sdw2023_api_url = 'https://sdw-2023-prd.up.railway.app'

## **E**xtract

Extraia a lista de IDs de usuário a partir do arquivo CSV. Para cada ID, faça uma requisição GET para obter os dados do usuário correspondente.

In [1]:
import pandas as pd

df = pd.read_csv('SDW2023.csv')
user_ids = df['UserID'].tolist()
print(user_ids)

[1009, 1010, 1011]


In [6]:
import requests
import json

def get_user(id):
  response = requests.get(f'{sdw2023_api_url}/users/{id}')
  return response.json() if response.status_code == 200 else None

users = [user for id in user_ids if (user := get_user(id)) is not None]
print(json.dumps(users, indent=2))

[
  {
    "id": 1009,
    "name": "Julia",
    "account": {
      "id": 1080,
      "number": "00222-3",
      "agency": "2222",
      "balance": 0.0,
      "limit": 50.0
    },
    "card": {
      "id": 991,
      "number": "2222 2272 2222 2222",
      "limit": 37.0
    },
    "features": [],
    "news": []
  },
  {
    "id": 1010,
    "name": "Ryan",
    "account": {
      "id": 1081,
      "number": "00222-7",
      "agency": "2282",
      "balance": 0.0,
      "limit": 50.0
    },
    "card": {
      "id": 992,
      "number": "8756 2452 2121 5555",
      "limit": 37.0
    },
    "features": [],
    "news": []
  },
  {
    "id": 1011,
    "name": "Seth",
    "account": {
      "id": 1082,
      "number": "00313-3",
      "agency": "2292",
      "balance": 0.0,
      "limit": 50.0
    },
    "card": {
      "id": 993,
      "number": "3333 2752 1515 3333",
      "limit": 37.0
    },
    "features": [],
    "news": []
  }
]


## **T**ransform

Utilize a API do OpenAI GPT-4 para gerar uma mensagem de marketing personalizada para cada usuário.

In [7]:
!pip install openai

Collecting openai
  Downloading openai-0.27.10-py3-none-any.whl (76 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/76.5 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━[0m [32m71.7/76.5 kB[0m [31m2.3 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.5/76.5 kB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: openai
Successfully installed openai-0.27.10


In [17]:
# Documentação Oficial da API OpenAI: https://platform.openai.com/docs/api-reference/introduction
# Informações sobre o Período Gratuito: https://help.openai.com/en/articles/4936830

# Para gerar uma API Key:
# 1. Crie uma conta na OpenAI
# 2. Acesse a seção "API Keys"
# 3. Clique em "Create API Key"
# Link direto: https://platform.openai.com/account/api-keys

# Substitua o texto TODO por sua API Key da OpenAI, ela será salva como uma variável de ambiente.
openai_api_key = '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'

In [19]:
import os
import openai

os.environ["OPENAI_API_KEY"] = <"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">
openai.api_key = OPENAI_API_KEY

def generate_ai_news(user):
  completion = openai.ChatCompletion.create(
    model="gpt-3.5",
    messages=[
      {
          "role": "system",
          "content": "Você é um especialista em series, filmes e indicar canais de streaming."
      },
      {
          "role": "user",
          "content": f"Crie uma mensagem para {user['name']} sobre a serie friends e onde ele pode assistir (máximo de 175 caracteres)"
      }
    ]
  )
  return completion.choices[0].message.content.strip('\"')

for user in users:
  news = generate_ai_news(user)
  print(news)
  user['news'].append({
      "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
      "description": news
  })

SyntaxError: ignored

## **L**oad

Atualize a lista de "news" de cada usuário na API com a nova mensagem gerada.

In [12]:
def update_user(user):
  response = requests.put(f"{sdw2023_api_url}/users/{user['id']}", json=user)
  return True if response.status_code == 200 else False

for user in users:
  success = update_user(user)
  print(f"User {user['name']} updated? {success}!")

User Julia updated? True!
User Ryan updated? True!
User Seth updated? True!
