<a href="https://colab.research.google.com/github/helbert-guirra/-santander-dev-week-2023-etl/blob/main/Santander_Dev_Week_2023.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Santander Dev Week 2025 (ETL com Python)**

Contexto: Você é um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo é usar o poder da IA Generativa para criar mensagens de marketing personalizadas que serão entregues a cada cliente.

Condições do Problema:

Você recebeu uma planilha simples, em formato CSV ('SDW2023.csv'), com uma lista de IDs de usuário do banco:
UserID
1
2
3

Neste projeto, foi desenvolvido um pipeline ETL inspirado no desafio da
Santander Dev Week 2023, com o objetivo de personalizar a comunicação com
clientes por meio de mensagens de marketing.

Devido à indisponibilidade da API original utilizada no desafio, os dados
dos clientes passaram a ser extraídos de um arquivo CSV local, mantendo o
conceito de ETL e permitindo a adaptação do projeto a um cenário realista.

A etapa de transformação simula o uso de IA generativa para criar mensagens
personalizadas com base no perfil financeiro de cada cliente, enquanto a
etapa de carga persiste os dados transformados em arquivos locais, simulando
a integração com um sistema final.

Essa abordagem garante a continuidade do aprendizado, elimina dependências
externas e reforça a aplicação prática dos conceitos de Engenharia de Dados.

## Extract
*Extraia a lista de IDs de usuário a partir do arquivo CSV. Para cada ID, faça uma requisição GET para obter os dados do usuário correspondente. *

In [8]:
# =========================
# EXTRACT
# =========================
# Devido à indisponibilidade da API original da Santander Dev Week 2023,
# os dados dos clientes são extraídos diretamente de um arquivo CSV local,
# preservando o conceito de ETL.

from google.colab import files
import pandas as pd

# 1. Upload do arquivo CSV
uploaded = files.upload()

# 2. Leitura do CSV (use exatamente o nome do arquivo enviado)
df = pd.read_csv("clientes_santander.csv")

# 3. Transformação inicial para estrutura de usuários
users = []

for _, row in df.iterrows():
    user = {
        "id": int(row["UserID"]),
        "name": row["Name"],
        "account": {
            "id": int(row["AccountID"]),
            "number": row["AccountNumber"],
            "agency": str(row["Agency"]),
            "balance": float(row["Balance"]),
            "limit": float(row["AccountLimit"])
        },
        "card": {
            "id": int(row["CardID"]),
            "number": row["CardNumber"],
            "limit": float(row["CardLimit"])
        }
    }
    users.append(user)

users


Saving clientes_santander.csv to clientes_santander (1).csv


[{'id': 1,
  'name': 'Devweekerson',
  'account': {'id': 1,
   'number': '01.097954-4',
   'agency': '2030',
   'balance': 624.12,
   'limit': 1000.0},
  'card': {'id': 1, 'number': 'xxxx xxxx xxxx 1111', 'limit': 2000.0}},
 {'id': 2,
  'name': 'Ana Paula',
  'account': {'id': 2,
   'number': '01.234567-8',
   'agency': '2030',
   'balance': 1850.75,
   'limit': 2000.0},
  'card': {'id': 2, 'number': 'xxxx xxxx xxxx 2222', 'limit': 3500.0}},
 {'id': 3,
  'name': 'Carlos Eduardo',
  'account': {'id': 3,
   'number': '01.876543-2',
   'agency': '2030',
   'balance': 320.4,
   'limit': 800.0},
  'card': {'id': 3, 'number': 'xxxx xxxx xxxx 3333', 'limit': 1500.0}}]

# **Transform**

Nesta etapa, as mensagens de marketing são geradas de forma personalizada
simulando o comportamento de uma IA generativa, considerando o perfil
financeiro de cada cliente.

In [9]:

def generate_ai_news(user):
    balance = user["account"]["balance"]

    if balance < 500:
        return f"{user['name']}, investir pode ajudar a organizar suas finanças e crescer com segurança."
    elif balance < 1500:
        return f"{user['name']}, investir regularmente é o caminho para conquistar seus objetivos."
    else:
        return f"{user['name']}, potencialize seu patrimônio com investimentos estratégicos."

for user in users:
    news = generate_ai_news(user)
    print(news)

    user["news"] = [{
        "icon": "https://digitalinnovationone.github.io/santander-dev-week-2023-api/icons/credit.svg",
        "description": news
    }]


Devweekerson, investir regularmente é o caminho para conquistar seus objetivos.
Ana Paula, potencialize seu patrimônio com investimentos estratégicos.
Carlos Eduardo, investir pode ajudar a organizar suas finanças e crescer com segurança.


# **Load**

Nesta etapa, os dados transformados são carregados em um novo arquivo local,
simulando a persistência das informações em um sistema final, substituindo
a API original indisponível.


In [10]:
import pandas as pd

rows = []

for user in users:
    rows.append({
        "UserID": user["id"],
        "Name": user["name"],
        "Balance": user["account"]["balance"],
        "AccountLimit": user["account"]["limit"],
        "MarketingMessage": user["news"][0]["description"]
    })

df_final = pd.DataFrame(rows)
df_final.to_csv("clientes_santander_final.csv", index=False)

df_final


Unnamed: 0,UserID,Name,Balance,AccountLimit,MarketingMessage
0,1,Devweekerson,624.12,1000.0,"Devweekerson, investir regularmente é o caminh..."
1,2,Ana Paula,1850.75,2000.0,"Ana Paula, potencialize seu patrimônio com inv..."
2,3,Carlos Eduardo,320.4,800.0,"Carlos Eduardo, investir pode ajudar a organiz..."
