<a href="https://colab.research.google.com/github/CarolMacioti/Pipeline_ETL_com_Python/blob/main/Desafio_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ***ETL com Python***

**Contexto:** Você é um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo é usar o poder da IA Generativa para criar mensagens de marketing personalizadas que serão entregues a cada cliente.

**Condições do Problema:**

1. Você recebeu uma planilha simples, em formato CSV ('SDW2023.csv'), com uma lista de IDs de usuário do banco:
  ```
  UserID
  1
  2
  3
  4
  5
  ```
2. Seu trabalho é consumir o endpoint `GET https://sdw-2023-prd.up.railway.app/users/{id}` (API da Santander Dev Week 2023) para obter os dados de cada cliente.
3. Depois de obter os dados dos clientes, você vai usar a API do ChatGPT (OpenAI) para gerar uma mensagem de marketing personalizada para cada cliente. Essa mensagem deve enfatizar a importância dos investimentos.
4. Uma vez que a mensagem para cada cliente esteja pronta, você vai enviar essas informações de volta para a API, atualizando a lista de "news" de cada usuário usando o endpoint `PUT https://sdw-2023-prd.up.railway.app/users/{id}`.

In [2]:
#Repositório da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api

#variável do Swagger:
desafio_bootcamp_api = 'https://sdw-2023-prd.up.railway.app'

## Aplicando **ETL** (*Extract, Transformation and Load*)

---



#**E**xtract

A aventura começa com uma planilha simples, de onde extrairemos os IDs dos usuários. Depois, usaremos esses IDs para acessar a API da 'Santander Dev Week 2023' e obter dados mais detalhados, um processo que evidencia a versatilidade na coleta de informações em Ciência de Dados.

In [3]:
#Extrair os IDs do arquivo CSV.

import pandas as pd

#df = data_frame; passo o nome do arquivo com os IDs COMO PARÂMETRO;
df = pd.read_csv('PLANILHA.csv')

#Pegar SPO os IDs -  posso passar uma FUNÇÃO ->passar cabeçalho + método tolist
user_ids = df['UserID'].tolist()

print(user_ids)



[1735, 1736, 1737, 1738]


In [4]:
#Obter os dados de cada ID usando API do SDW - dar um Get dos Id Points barra os ids que criei

#PARA ISSO: Trazer duas bibliotecas (APIs) que serão necessárias:

#1ª) REQUESTS: que trás interfaces para o HTTP c/ padrão Python
#2ª) JSON: p/ fazer a manipulação de dados de retorno de forma simplificada e formatá-los em algumas saídas visualizando retornos das requisições.

import requests
import json

#Função para recuperação de usuário:

def get_user(id):
  response = requests.get (f'{desafio_bootcamp_api}/users/{id}')
# crio uma condição para o retorno da função descobrir se o status_code do response é = à 200, E SE NÃO FOR, irá retornar "NONE":
 #Resumindo: retorna o Status de Json se o status for = a 200, se não for, retorne NONE!
  return response.json() if response.status_code == 200 else None

#usando o conceito de Compreensão de listas:
#pega o usuário da lista de ids (user_ids) -> e o usuário só será atribuido à lista  se(if) a condião não for None

users = [user for id in user_ids if  (user := get_user(id)) is not None]

#Fazer um 'print' usando a função dumps do Json para visualizar uma lista ordenada dos usuários
print(json.dumps(users, indent=4))


[
    {
        "id": 1735,
        "name": "Carolina",
        "account": {
            "id": 1822,
            "number": "84333-0",
            "agency": "78032",
            "balance": 0.0,
            "limit": 500.0
        },
        "card": {
            "id": 1676,
            "number": "**** **** 5461 1441",
            "limit": 1000.0
        },
        "features": [],
        "news": [
            {
                "id": 3513,
                "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
                "description": "Preambulo: introdu\u00e7\u00e3o aos princ\u00edpios da CF 88!"
            },
            {
                "id": 3514,
                "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
                "description": "Oi Carolina, o pre\u00e2mbulo da CF/88 \u00e9 um texto introdut\u00f3rio que explicita os princ\u00edpios fundamentais do pa\u00eds."
            }
     

**OBSERVAÇÕES**:

##**200** -> Operation Successful
Status Code = 200, significa que a execução foi bem sucedida, conforme está explicad lá no Swagge.

##**404** -> Error: User not Found
Status Code = 404, é quando da erro

 # **T**ransform

 Integrando a API do ChatGPT.
 Adentraremos o universo da IA com o GPT-4 da OpenAI, transformando esses dados em mensagens personalizadas de marketing. Veremos como a IA pode ser empregada de maneira inovadora e prática!

In [None]:
#Segue *ABAIXO* a ferrameta de instalação do pcote de APIs do ChatGPT

In [5]:
!pip install openai

Collecting openai
  Downloading openai-0.28.0-py3-none-any.whl (76 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.5/76.5 kB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: openai
Successfully installed openai-0.28.0


In [6]:
# Documentação Oficial da API OpenAI: https://platform.openai.com/docs/api-reference/introduction
# Informações sobre o Período Gratuito: https://help.openai.com/en/articles/4936830

# Para gerar uma API Key:
# 1. Crie uma conta na OpenAI
# 2. Acesse a seção "API Keys"
# 3. Clique em "Create API Key"
# Link direto: https://platform.openai.com/account/api-keys

# Substitua o texto TODO por sua API Key da OpenAI, ela será salva como uma variável de ambiente.
openai_minha_api_key = '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'

#Depois é só EXECUTAR o código e tá tudo pronto para usar a API

In [None]:
# Hora de implementar a INTEGRAÇÃO com o ChatGPT usando o Modelo: GPT-4

import openai #chamando a API para uso

openai.api_key = openai_api_key #introduzindo a biblioteca com o uso da chave

#AGORA: Criar função para gerar as mensagens aos usuários usando AI

def generate_ai_news(user): #recebe o usário como parâmetro

#Na documentação Oficial da API OpenAI: https://platform.openai.com/docs/api-reference -> "Endpoints"
# na Aba "Chat" -> "Create chat completion" consta o passo a passo de como  e qual create vou consumir

#Copiar a implementação da opção que está em "python" ->MAS escolho o "modelo" gpt-4
  completion = openai.ChatCompletion.create(
    model="gpt-4",
    #Personalizar as mensagens que vou usar para interação via ChatGPT, posso escrevê-las em Português
    messages=[
      {
          "role": "system",
          "content": "Você é um especialista em markting bancário."
      },
      {
          "role": "user",#Pedir para a AI criar uma mensagem para o usuário "fulano de tal" sobre det. assunto relacionado ao 'content' acima
          "content": f"Crie uma mensagem para {user['name']} sobre a importância dos investimentos (máximo de 100 caracteres)"
      }
    ]
  )# agora quero retornar com a resposta do Chat, e é isso que "peço" no meu RETURN
  return completion.choices[0].message.content.strip('\"')

# .strip('\"') --> é usado para remover as aspas duplas que o ChatGPT add às mensagens

#AGORA: preciso chamar o método acima interagindo com a lista de usuários que foi implementada no inicio do desafio,
# (na etapa de Extraction) com o uso do GET na API do Swagger

#faço o programa percorrer a alista para criar as mensagens personalizadas para os usuários
for user in users:
  news = generate_ai_news(user) #=: para cada usuário terei uma nova mensagem (news: que são a descrição do objeto do APPEND)
  print(news)
  user['news'].append({
      "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
      "description": news #aqui fica a mensagem que a AI irá gerar
  })

In [7]:
import openai

openai.api_key = openai_minha_api_key

def generate_ai_news(user):
  completion = openai.ChatCompletion.create(
      model="gpt-4",
      messages=[
        {
            "role": "system",
            "content": "Você é um especialista em Direito constitucional."
        },
        {
            "role": "user",
            "content": f"Crie uma mensagem para {user['name']} sobre o preâmbulo da CF de 1988 (máximo de 100 caracteres)"
        }
      ]
    )
  return completion.choices[0].message.content.strip('\"')

for user in users:
  news = generate_ai_news(user)
  print(news)
  user['news'].append({
      "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
      "description": news
  })


Olá Carolina, o preâmbulo da CF/88 apresenta os valores fundamentais de nossa democracia: liberdade, justiça e paz.
Olá, Fabiana! O preâmbulo CF 1988 estabelece objetivos como justiça, liberdade e democracia.
Márcia, o preâmbulo da CF/88 introduz os fundamentos e objetivos do nosso Estado Democrático. Explore!
Preâmbulo da CF/88: proclama nossa sociedade justa, fraterna, democrática e sem preconceitos.


# **L**oad

Enviando essas mensagens de volta para a API da 'Santander Dev Week 2023'. Este passo ilustra como dados transformados são reintegrados em sistemas, completando o ciclo de um pipeline ETL.

Atualizando a lista de "news" de cada usuário na API com a nova mensagem gerada.

In [None]:
#INICIAR definindo uma função para atualizar um usuário. Na API da Swagger --> aba PUT  ja acontece isso

#aqui vou "esperar um 'response' e fazer uma requisição para o PUT na minha url da api (desafio_bootcamp_api)/users/{especif. o ID do usuário}

def update_user(user):
  #AGORA: precisa passar o "corpo" da requisição (do REQUEST) usanso o JSON
  response = request.put(f"{desafio_bootcamp_api}/users/{user['id']}", json = user)
  #retornar true se a resposta for um ID válido

  return True if response.status_code == 200 else False

 #Percorrer os usuários e ver se a função funciona

for user in users:
   #essa é a chamada para cada usuário
  success = update_user(user)
  #aqui estou devolvendo o nome de usuário e descobrindo se ele foi atualizado ou não
  print(f"User {user['name']} updated? {success}!")

In [8]:
def update_user(user):
   response = requests.put(f"{desafio_bootcamp_api}/users/{user['id']}",  json=user)
   return True if response.status_code == 200 else False

 #Percorrer os usuários e ver se a função funciona

for user in users:
  success = update_user(user)
  print(f"User {user['name']} updated? {success}!")

User Carolina updated? True!
User Fabiana updated? True!
User Márcia updated? True!
User Geralda updated? True!
