# Santander Dev Week 2023 (ETL com Python)

**Contexto:** Você é um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo é usar o poder da IA Generativa para criar mensagens de marketing personalizadas que serão entregues a cada cliente.

**Condições do Problema:**

1. Você recebeu uma planilha simples, em formato CSV ('SDW2023.csv'), com uma lista de IDs de usuário do banco:
  ```
  UserID
  1
  2
  3
  4
  5
  ```
2. Seu trabalho é consumir o endpoint `GET https://sdw-2023-prd.up.railway.app/users/{id}` (API da Santander Dev Week 2023) para obter os dados de cada cliente.
3. Depois de obter os dados dos clientes, você vai usar a API do ChatGPT (OpenAI) para gerar uma mensagem de marketing personalizada para cada cliente. Essa mensagem deve enfatizar a importância dos investimentos.
4. Uma vez que a mensagem para cada cliente esteja pronta, você vai enviar essas informações de volta para a API, atualizando a lista de "news" de cada usuário usando o endpoint `PUT https://sdw-2023-prd.up.railway.app/users/{id}`.



In [2]:
# Utilize sua própria URL se quiser ;)
# Repositório da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api
# meu repositorio depois do fork https://github.com/RosaneStream/santander-dev-week-2023-api
sdw2023_api_url = 'https://sdw-2023-prd.up.railway.app'
#sdw2023_api_url = 'https://github.com/RosaneStream/santander-dev-week-2023-api'
cotacoes = requests.get('https://economia.awesomeapi.com.br/json/all')


## **E**xtract

Extraia a lista de IDs de usuário a partir do arquivo CSV. Para cada ID, faça uma requisição GET para obter os dados do usuário correspondente.

In [None]:
#importa a biblioteca para trabalhar com dataframe
import pandas as pd

#carrega o arquivo como dataframe
df = pd.read_csv('SDW2023.csv')

#carrega os ids
user_ids = df['UserID'].tolist()


#imprime o dataframe
print(df)

#imprime os ids carregados
print(user_ids)

   UserID
0     675
1     676
2     677
[675, 676, 677]


In [None]:
# não esquecer de executar o código que carrega a API antes deste
#importa a biblioteca para utilizar os requests (client http padrão do Python)
import requests
import json

#define uma função para enviar um id e recuperar as informações do usuario
def get_user(id):
  response = requests.get(f'{sdw2023_api_url}/users/{id}')
  # retorna o jason se o status code for 200 senão retorna vazio
  return response.json() if response.status_code == 200 else None

#percorre a lista e atribui à função get_user os ids se não são nulos
users = [user for id in user_ids if (user := get_user(id)) is not None]
#imprime o resultado usando o formato jason com identação 2
print(json.dumps(users, indent=2))


[
  {
    "id": 675,
    "name": "Pythoniza",
    "account": {
      "id": 696,
      "number": "111111-4",
      "agency": "001",
      "balance": 10000.0,
      "limit": 1000.0
    },
    "card": {
      "id": 649,
      "number": "**** **** ***** 4444",
      "limit": 1000.0
    },
    "features": [],
    "news": []
  },
  {
    "id": 676,
    "name": "Peter",
    "account": {
      "id": 697,
      "number": "111111-5",
      "agency": "001",
      "balance": 50000.0,
      "limit": 5000.0
    },
    "card": {
      "id": 650,
      "number": "**** **** ***** 5555",
      "limit": 5000.0
    },
    "features": [],
    "news": []
  },
  {
    "id": 677,
    "name": "Paty",
    "account": {
      "id": 698,
      "number": "111111-6",
      "agency": "001",
      "balance": 60000.0,
      "limit": 6000.0
    },
    "card": {
      "id": 651,
      "number": "**** **** ***** 6666",
      "limit": 6000.0
    },
    "features": [],
    "news": []
  }
]


In [None]:
cotacoes_dic = cotacoes.json()
print(cotacoes_dic)

{'USD': {'code': 'USD', 'codein': 'BRL', 'name': 'Dólar Americano/Real Brasileiro', 'high': '4.9008', 'low': '4.8579', 'varBid': '-0.0081', 'pctChange': '-0.17', 'bid': '4.8711', 'ask': '4.8731', 'timestamp': '1692997198', 'create_date': '2023-08-25 17:59:58'}, 'USDT': {'code': 'USD', 'codein': 'BRLT', 'name': 'Dólar Americano/Real Brasileiro Turismo', 'high': '4.925', 'low': '4.865', 'varBid': '-0.005', 'pctChange': '-0.1', 'bid': '4.75', 'ask': '5.04', 'timestamp': '1692991860', 'create_date': '2023-08-25 16:31:00'}, 'CAD': {'code': 'CAD', 'codein': 'BRL', 'name': 'Dólar Canadense/Real Brasileiro', 'high': '3.5969', 'low': '3.5752', 'varBid': '-0.0082', 'pctChange': '-0.23', 'bid': '3.5809', 'ask': '3.5863', 'timestamp': '1692997185', 'create_date': '2023-08-25 17:59:45'}, 'GBP': {'code': 'GBP', 'codein': 'BRL', 'name': 'Libra Esterlina/Real Brasileiro', 'high': '6.1652', 'low': '6.1237', 'varBid': '-0.0214', 'pctChange': '-0.35', 'bid': '6.1297', 'ask': '6.1335', 'timestamp': '16929

## **T**ransform

Utilize a API do OpenAI GPT-4 para gerar uma mensagem de marketing personalizada para cada usuário.

In [None]:
!pip install openai

Collecting openai
  Downloading openai-0.27.9-py3-none-any.whl (75 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/75.5 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━[0m [32m51.2/75.5 kB[0m [31m1.2 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m75.5/75.5 kB[0m [31m1.4 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: openai
Successfully installed openai-0.27.9


In [None]:
# Documentação Oficial da API OpenAI: https://platform.openai.com/docs/api-reference/introduction
# Informações sobre o Período Gratuito: https://help.openai.com/en/articles/4936830

# Para gerar uma API Key:
# 1. Crie uma conta na OpenAI
# 2. Acesse a seção "API Keys"
# 3. Clique em "Create API Key"
# Link direto: https://platform.openai.com/account/api-keys

# Substitua o texto TODO por sua API Key da OpenAI, ela será salva como uma variável de ambiente.
openai_api_key = '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'

In [None]:
import openai

openai.api_key = openai_api_key

def generate_ai_news(user):
  completion = openai.ChatCompletion.create(
    model="gpt-3.5-turbo-0613",
    messages=[
      {
          "role": "system",
          "content": "You are an investment advisor."
      },
      {
          "role": "user",
          "content": f"Advise {user['name']} about one of the best investments he can make, given the world's financial history from the previous year to the present date (máximo de 100 caracteres)"
      }
    ]
  )
  return completion.choices[0].message.content.strip('\"')

for user in users:
  news = generate_ai_news(user)
  print(news)
  user['news'].append({
      "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
      "description": news
  })

Invest in technology stocks for long-term growth potential.
Gold and silver have historically been a safe investment during uncertain times. Consider investing in precious metals.
Invest in technology stocks for long-term growth.


## **L**oad

Atualize a lista de "news" de cada usuário na API com a nova mensagem gerada.

In [None]:
def update_user(user):
  response = requests.put(f"{sdw2023_api_url}/users/{user['id']}", json=user)
  return True if response.status_code == 200 else False

for user in users:
  success = update_user(user)
  print(f"User {user['name']} updated? {success}!")

User Pythoniza updated? True!
User Peter updated? True!
User Paty updated? True!
