<a href="https://colab.research.google.com/github/jjulinha/Java/blob/main/C%C3%B3pia_de_SantanderDevWeek2023.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Santander Dev Week 2023 (ETL com Python)

**Contexto:** Você é um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo é usar o poder da IA Generativa para criar mensagens de marketing personalizadas que serão entregues a cada cliente.

**Condições do Problema:**

1. Você recebeu uma planilha simples, em formato CSV ('SDW2023.csv'), com uma lista de IDs de usuário do banco:
  ```
  UserID
  1
  2
  3
  4
  5
  ```
2. Seu trabalho é consumir o endpoint `GET https://sdw-2023-prd.up.railway.app/users/{id}` (API da Santander Dev Week 2023) para obter os dados de cada cliente.
3. Depois de obter os dados dos clientes, você vai usar a API do ChatGPT (OpenAI) para gerar uma mensagem de marketing personalizada para cada cliente. Essa mensagem deve enfatizar a importância dos investimentos.
4. Uma vez que a mensagem para cada cliente esteja pronta, você vai enviar essas informações de volta para a API, atualizando a lista de "news" de cada usuário usando o endpoint `PUT https://sdw-2023-prd.up.railway.app/users/{id}`.



## **E**xtract

Extraia a lista de IDs de usuário a partir do arquivo CSV. Para cada ID, faça uma requisição GET para obter os dados do usuário correspondente.

In [None]:
import pandas as pd

df = pd.read_csv('SDW2023.csv')
user_ids = df['UserID'].tolist()
print(user_ids)

In [1]:
import csv

# Nome do arquivo CSV
csv_file = 'SDW2023.csv'

# Função para buscar e mostrar os dados do usuário com base no ID
def get_user_data(user_id):
    with open(csv_file, 'r', newline='') as file:
        csv_reader = csv.DictReader(file)
        for row in csv_reader:
            if row['UserID'] == user_id:
                user_name = row['Name']
                user_access = row['Acesso']
                return user_name, user_access
    return None, None

# Lista de IDs de usuário para buscar
user_ids = ['48625', '59843', '15934']  # Substitua pelos IDs que deseja buscar

# Para cada ID de usuário, obtenha e mostre os dados
for user_id in user_ids:
    user_name, user_access = get_user_data(user_id)
    if user_name and user_access:
        print(f"ID: {user_id}, Nome: {user_name}, Acesso: {user_access}")
    else:
        print(f"ID: {user_id} não encontrado no arquivo CSV")

# Encerrar o script
print("Concluído.")


ID: 48625, Nome: fulano silva, Acesso: fulano.silva
ID: 59843, Nome: beltrano oliveira, Acesso: beltrano.oliveira
ID: 15934, Nome: alguem marques, Acesso: alguem.marques
Concluído.


## **T**ransform

Utilize a API do OpenAI GPT-4 para gerar uma mensagem de marketing personalizada para cada usuário.

In [None]:
!pip install openai

In [4]:
import csv

# Nomes dos arquivos CSV
csv_file1 = 'SDW2023.csv'
csv_file2 = 'API.csv'

# Função para criar um dicionário de usuários a partir de um arquivo CSV
def create_user_dict(csv_file):
    user_dict = {}
    with open(csv_file, 'r', newline='') as file:
        csv_reader = csv.DictReader(file)
        for row in csv_reader:
            user_id = row['UserID']
            user_name = row['Name']
            user_access = row['Acesso']
            user_dict[user_id] = {'Name': user_name, 'Acesso': user_access}
    return user_dict

# Ler os dados dos dois arquivos CSV
user_data1 = create_user_dict(csv_file1)
user_data2 = create_user_dict(csv_file2)

# Combinar os dados de ambos os arquivos
combined_user_data = {**user_data1, **user_data2}

# Mostrar os dados combinados
for user_id, data in combined_user_data.items():
    print(f"ID: {user_id}, Nome: {data['Name']}, Acesso: {data['Acesso']}")

# Encerrar o script
print("Concluído.")


ID: 48625, Nome: fulano silva, Acesso: fulano.silva
ID: 59843, Nome: beltrano oliveira, Acesso: beltrano.oliveira
ID: 15934, Nome: alguem marques, Acesso: alguem.marques
ID: 35126, Nome: julia, Acesso: julia1
ID: 97823, Nome: pedro, Acesso: pedro1
ID: 63258, Nome: joao, Acesso: joao1
Concluído.


## **L**oad

Atualize a lista de "news" de cada usuário na API com a nova mensagem gerada.

In [6]:
import csv

# Nomes dos arquivos CSV
csv_file1 = 'SDW2023.csv'
csv_file2 = 'API.csv'

# Função para criar um dicionário de usuários a partir de um arquivo CSV
def create_user_dict(csv_file):
    user_dict = {}
    with open(csv_file, 'r', newline='') as file:
        csv_reader = csv.DictReader(file)
        for row in csv_reader:
            user_id = row['UserID']
            user_name = row['Name']
            user_access = row['Acesso']
            user_dict[user_id] = {'Name': user_name, 'Acesso': user_access}
    return user_dict

# Ler os dados dos dois arquivos CSV
user_data1 = create_user_dict(csv_file1)
user_data2 = create_user_dict(csv_file2)

# Combinar os dados de ambos os arquivos
combined_user_data = {**user_data1, **user_data2}

# Gerar mensagens de boas-vindas para cada usuário
for user_id, data in combined_user_data.items():
    user_name = data['Name']
    welcome_message = f"Bem-vindo, {user_name}! Seu acesso é: {data['Acesso']}"
    print(welcome_message)

# Encerrar o script
print("Concluído.")


Bem-vindo, fulano silva! Seu acesso é: fulano.silva
Bem-vindo, beltrano oliveira! Seu acesso é: beltrano.oliveira
Bem-vindo, alguem marques! Seu acesso é: alguem.marques
Bem-vindo, julia! Seu acesso é: julia1
Bem-vindo, pedro! Seu acesso é: pedro1
Bem-vindo, joao! Seu acesso é: joao1
Concluído.
