<a href="https://colab.research.google.com/github/BlueDeepSea/Explorando_IA_Generativa_em_um_Pipeline_de_ETL_com_Python/blob/main/IA_Generativa_em_um_Pipeline_de_ETL_com_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Informa√ß√µes

Prepare-se para uma jornada pr√°tica pelo mundo da Ci√™ncia de Dados neste v√≠deo! Vamos construir um pipeline ETL (Extra√ß√£o, Transforma√ß√£o e Carregamento), demonstrando a rela√ß√£o entre dados, Intelig√™ncia Artificial (IA) e APIs. Extra√ß√£o: A aventura come√ßa com uma planilha simples, de onde extrairemos os IDs dos usu√°rios. Depois, usaremos esses IDs para acessar a API da 'Santander Dev Week 2023' e obter dados mais detalhados, um processo que evidencia a versatilidade na coleta de informa√ß√µes em Ci√™ncia de Dados. Transforma√ß√£o: Adentraremos o universo da IA com o GPT-4 da OpenAI, transformando esses dados em mensagens personalizadas de marketing. Veremos como a IA pode ser empregada de maneira inovadora e pr√°tica! Carregamento: Finalizaremos o processo enviando essas mensagens de volta para a API da 'Santander Dev Week 2023'. Este passo ilustra como dados transformados s√£o reintegrados em sistemas, completando o ciclo de um pipeline ETL.

Python REST OpenAI.API ChatGPT ETL

In [None]:
# Reposit√≥rio da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api
sdw2023_api_url = "https://sdw-2023-prd.up.railway.app"

# Extract

In [None]:
import pandas as pd

df = pd.read_csv("users.csv")
user_ids = df["UserID"].tolist()
print(user_ids)

[2626, 1213, 1231]


In [None]:
import requests
import json

def get_user(id):
    response = requests.get(f"{sdw2023_api_url}/users/{id}")
    print(response.status_code)
    data = response.json()
    print(data)
    return data if response.status_code == 200 else None


users = [user for id in user_ids if (user := get_user(id)) is not None]
print(json.dumps(users, indent=2))


200
{'id': 2626, 'name': 'Pedro', 'account': {'id': 2772, 'number': '16474-7', 'agency': '1467', 'balance': 0.0, 'limit': 500.0}, 'card': {'id': 2549, 'number': '5398 9262 6620 9993', 'limit': 350.0}, 'features': [{'id': 887, 'icon': 'string', 'description': 'string'}], 'news': [{'id': 5393, 'icon': 'string', 'description': 'string'}]}
200
{'id': 1213, 'name': 'leonardo fogaca', 'account': {'id': 1279, 'number': '00857-1', 'agency': '0001', 'balance': 0.0, 'limit': 5000.0}, 'card': {'id': 1177, 'number': '**** **** **** 8748', 'limit': 2000.0}, 'features': [], 'news': [{'id': 2767, 'icon': 'https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg', 'description': '"Leonardo, invista agora para garantir o seu futuro financeiro! Conte com o Santander para te ajudar a alcan√ßar seus objetivos. N√£o deixe essa oportunidade passar."'}, {'id': 2770, 'icon': 'https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg', 'description': 'Leonar

## Transform

In [41]:
!pip install openai

Collecting openai
  Downloading openai-0.28.0-py3-none-any.whl (76 kB)
[?25l     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/76.5 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[90m‚ï∫[0m[90m‚îÅ‚îÅ[0m [32m71.7/76.5 kB[0m [31m2.1 MB/s[0m eta [36m0:00:01[0m[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m76.5/76.5 kB[0m [31m1.7 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: openai
Successfully installed openai-0.28.0


In [42]:
openai_api_key = "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"

In [62]:
import openai
import os

openai.api_key = openai_api_key

def generate_ai_news(user):
    message = f"Crie uma mensagem para {user['name']} sobre a import√¢ncia do QA nas empresas (m√°ximo de 100 caracteres)"

    completion = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[
            {"role": "system", "content": "Voc√™ √© um especialista em quality assurance em uma ind√∫stria de software."},
            {"role": "user", "content": message}
        ]
    )
    return completion.choices[0].message.content

for user in users:
    news = generate_ai_news(user)
    print(news)

    # Initialize the "news" list if it doesn't exist in the user's data
    if "news" not in user:
        user["news"] = []

    user["news"].append({
        "icon": "https://img.freepik.com/vetores-gratis/vetor-de-gradiente-de-logotipo-colorido-de-passaro_343694-1365.jpg",
        "description": news
    })

RateLimitError: ignored

## Load

In [61]:
def update_user(user):
  response = requests.put(f"{sdw2023_api_url}/users/{user['id']}", json=user)
  return True if response.status_code == 200 else False

for user in users:
  success = update_user(user)
  print(f"User {user['name']} updated? {success}!")

User Pedro updated? True!
User leonardo fogaca updated? True!
User Devweekerson updated? True!
