# **Explorando IA Generativa em um Pipeline de ETL com Python**

Este projeto visa demonstrar a aplicação de IA generativa em um pipeline de ETL (Extração, Transformação e Carregamento) usando a linguagem Python. Vamos usar a API da Santander Dev Week 2023 para obter dados de usuários e a API OpenAI para gerar notícias de IA personalizadas para cada usuário.


---

#### Repositório da API: https://github.com/digitalinnovationone/santander-dev-week-2023-api
#### sdw2023_api_url = https://sdw-2023-prd.up.railway.app

In [72]:
# Importações necessárias
import requests

# URL da API da Santander Dev Week 2023
sdw2023_api_url = 'hs://github.com/digitalinnovattptionone/santander-dev-week-2023-api'

def fetch_data(api_url):
    """
    Realiza uma requisição GET para a API da Santander Dev Week 2023 e retorna os dados.

    Args:
        api_url (str): URL da API

    Returns:
        dict: Dados retornados pela API
    """
    response = requests.get(api_url)
    if response.status_code == 200:
        data = response.json()
        return data
    else:
        raise Exception(f"Erro na requisição: {response.status_code}")

# Chamada para buscar os dados da API
try:
    api_data = fetch_data(sdw2023_api_url)
    print("Dados da API:")
    print(api_data)
except Exception as e:
    print("Erro ao buscar dados da API:", e)

Erro ao buscar dados da API: No connection adapters were found for 'hs://github.com/digitalinnovattptionone/santander-dev-week-2023-api'


# **E - EXTRACTION**

In [73]:
import pandas as pd

def load_csv_data(file_path):
    """
    Carrega dados de um arquivo CSV para um DataFrame do Pandas.

    Args:
        file_path (str): Caminho do arquivo CSV

    Returns:
        pd.DataFrame: DataFrame contendo os dados do arquivo CSV
    """
    df = pd.read_csv(file_path)
    return df

def extract_user_ids(data_frame):
    """
    Extrai a coluna 'UserID' do DataFrame e retorna como uma lista.

    Args:
        data_frame (pd.DataFrame): DataFrame contendo os dados

    Returns:
        list: Lista de IDs de usuário
    """
    user_ids = data_frame['UserID'].tolist()
    return user_ids

# Carregamento dos dados do arquivo CSV
csv_file_path = 'SDW2023.csv'
try:
    loaded_data = load_csv_data(csv_file_path)
    extracted_user_ids = extract_user_ids(loaded_data)
    print("Lista de IDs de Usuário:")
    print(extracted_user_ids)
except Exception as e:
    print("Erro ao carregar e extrair dados:", e)


Lista de IDs de Usuário:
[1, 2, 3, 4, 5]


In [74]:
import requests
import json

def get_user_data(api_url, user_id):
    """
    Faz uma requisição GET à API para obter os dados de um usuário pelo seu ID.

    Args:
        api_url (str): URL da API
        user_id (int): ID do usuário

    Returns:
        dict or None: Dados do usuário (ou None se não encontrado)
    """
    response = requests.get(f'https://sdw-2023-prd.up.railway.app/users/{id}')

    if response.status_code == 200:
        user_data = response.json()
        return user_data
    else:
        return None

def fetch_users(api_url, user_ids):
    """
    Busca os dados de usuários a partir de seus IDs.

    Args:
        api_url (str): URL da API
        user_ids (list): Lista de IDs de usuário

    Returns:
        list: Lista de dicionários contendo os dados dos usuários
    """
    users = [get_user_data(api_url, user_id) for user_id in user_ids]
    return [user for user in users if user is not None]

# Busca e impressão dos dados dos usuários
try:
    extracted_users = fetch_users(sdw2023_api_url, extracted_user_ids)
    print("Dados dos Usuários:")
    print(json.dumps(extracted_users, indent=2))
except Exception as e:
    print("Erro ao buscar dados dos usuários:", e)


Dados dos Usuários:
[]


# **T - TRANSFORM**

In [75]:
#INSTALANDO O OPENAI
!pip install openai



In [82]:
# Documentação Oficial da API OpenAI: https://platform.openai.com/docs/api-reference/introduction
# Informações sobre o Período Gratuito: https://help.openai.com/en/articles/4936830

openai_api_key = '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'


In [83]:
# Exemplo fictício de lista de usuários (substitua com os dados reais)
users = [
    {"id": 1, "name": "Usuário 1", "news": []},
    {"id": 2, "name": "Usuário 2", "news": []},
    # Adicione mais usuários aqui...
]

# Função para gerar notícias de IA
def generate_ai_news(user):
    # Código de geração de notícias...
    pass

# Gerar notícias de IA para cada usuário
for user in users:
    news = generate_ai_news(user)
    print(news)
    user['news'].append({
        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
        "description": news
    })


None
None


In [86]:
import requests
import json
import openai

openai.api_key = openai_api_key

def generate_ai_news(user):
    system_message = "Você é um especialista em marketing bancário."
    user_prompt = f"Crie uma mensagem para {user['name']} sobre a importância dos investimentos (máximo de 100 caracteres)"

    completion = openai.Completion.create(
        engine="text-davinci-003",  # Atualizar para o motor apropriado
        prompt=f"{system_message}\n{user_prompt}",
        max_tokens=50
    )

    generated_text = completion.choices[0].text.strip()

    return generated_text

# Exemplo fictício de lista de usuários (substitua com os dados reais)
users = [
    {"id": 1, "name": "Usuário 1", "news": []},
    {"id": 2, "name": "Usuário 2", "news": []},
    # Adicione mais usuários aqui...
]

# Gerar notícias de IA para cada usuário
for user in users:
    news = generate_ai_news(user)
    print(news)
    user['news'].append({
        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
        "description": news
    })


RateLimitError: ignored

# **L - LOAD**

In [88]:

def update_user_data(api_url, user):
    """
    Atualiza os dados de um usuário na API.

    Args:
        api_url (str): URL da API
        user (dict): Dados do usuário

    Returns:
        bool: True se a atualização foi bem-sucedida, False caso contrário
    """
    try:
        response = requests.put(f"{api_url}/users/{user['id']}", json=user)
        return response.status_code == 200
    except requests.exceptions.RequestException as e:
        print(f"Erro na solicitação: {e}")
        return False

# Atualização dos dados dos usuários
for user in users:
    update_success = update_user_data(sdw2023_api_url, user)
    print(f"Usuário {user['name']} atualizado? {update_success}!")


Erro na solicitação: No connection adapters were found for 'hs://github.com/digitalinnovattptionone/santander-dev-week-2023-api/users/1'
Usuário Usuário 1 atualizado? False!
Erro na solicitação: No connection adapters were found for 'hs://github.com/digitalinnovattptionone/santander-dev-week-2023-api/users/2'
Usuário Usuário 2 atualizado? False!
