# Desafio - Explorando IA Generativa em um Pipeline de ETL com Python

Desafio de código proposto no curso de Ciência de Dados do Santander Bootcamp 2023

**ETL** é a sigla para processo de __Extract, Transform and Loud__ que é uma forma tradicionalmente aceita para que as organizações combinem dados de vários sistemas em um único banco de dados, repositório de dados, armazenamento de dados ou data lake.

__Links importantes__:

- [Swagger da API utilizada](https://sdw-2023-prd.up.railway.app/swagger-ui/index.html#/Users%20Controller/findById)
- [OpenAI API Reference](https://platform.openai.com/docs/api-reference/introduction)


## **Extração**
A parte de extração do Desafio envolve um arquivo `.csv` com os ids dos usuários. Com os ids, faremos uma requisição usando o módulo `requests` à API em Java do SDW2023 para obter as informações do usuário correspondente.

In [3]:
# Lendo o arquivo .csv e listando todos os id's da coluna UserID
import pandas as pd

df = pd.read_csv('/content/SDW2023.csv')
id_usuarios = df['UserID'].tolist()
print(id_usuarios) # lista de ids encontradas no arquivo

[4, 5, 6]


In [None]:
# Pegando as informações dos usuários através da requisição GET na API
import requests
import json

sdw2023_api_url = 'https://sdw-2023-prd.up.railway.app'

def get_usuario(id):
  resposta = requests.get(f'{sdw2023_api_url}/users/{id}')
  return resposta.json() if resposta.status_code == 200 else None

# Listará a informação do usuário respectivo ao id caso o resultado não seja None
usuarios = [usuario for id in id_usuarios if (usuario := get_usuario(id)) is not None]
print(json.dumps(usuarios, indent=2))


## **Transformação**

Etapa para criação de mensagens personalizadas usando a API da OpenAI ChatGPT-4.


In [5]:
!pip install openai

Collecting openai
  Downloading openai-0.27.9-py3-none-any.whl (75 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/75.5 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━━[0m [32m71.7/75.5 kB[0m [31m2.2 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m75.5/75.5 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: openai
Successfully installed openai-0.27.9


In [6]:
import openai

openai_api_key = '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'

openai.api_key = openai_api_key

# Função para gerar as mensagens personalizadas

def gerando_mensagens(usuario):
  completion = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
      {
          "role": "system",
          "content": "Você é um especialista em marketing bancário."
      },
      {
          "role": "user",
          "content": f"Crie uma mensagem para {usuario['name']} sobre a importância dos investimentos (máximo de 120 caracteres)"
      }
    ]
  )
  return completion.choices[0].message.content.strip('\"')

for usuario in usuarios:
  mensagem = gerando_mensagens(usuario)
  print(mensagem)


RateLimitError: ignored

## **Carregamento (Load)**

Atualização dos dados da API com os valores de news gerados pelo ChatGPT.

In [8]:
# Função para enviar as novas informações para API

def atualizacao_usuario(usuario):
  resposta = requests.put(f"{sdw2023_api_url}/users/{usuario['id']}", json=usuario)
  return True if resposta.status_code == 200 else False

for usuario in usuarios:
  resposta = atualizacao_usuario(usuario)
  print(f"Usuario: {usuario['name']} atualizado? {resposta}")

Usuario: Pep atualizado? True
