<a href="https://colab.research.google.com/github/Restrepo2000/DesafioETL/blob/main/DesafioETL.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Desafio Bootcamp Santader + DIO (ETL)**

O desafio proposto era criar uma pipeline ETL e com isso foi realizado uma pipeline de uma loja onde os dos clientes que compraram mais de 10 produtos da loja iriam receber uma mensagem com um cupom de desconto de até 30% para próxima compra na loja.

**EXTRACT**

Retirado dados de uma planilha CSV contendo os clientes e seus respectivos dados.

In [14]:
import pandas as pd

df = pd.read_csv('/clientes.csv')
user_ids = df['id'].tolist()

print(user_ids)

[1, 2, 3, 4, 5]


In [15]:
import json

users = []

for id in user_ids:
    user_details = df[df['id'] == id].to_dict(orient='records')[0]
    users.append(user_details)

print(json.dumps(users, indent=2))

[
  {
    "id": 1,
    "nome": "Joao",
    "sobrenome": "Silva",
    "idade": 30,
    "email": "joao.silva@example.com",
    "compras": 8
  },
  {
    "id": 2,
    "nome": "Maria",
    "sobrenome": "Santos",
    "idade": 28,
    "email": "maria.santos@example.com",
    "compras": 15
  },
  {
    "id": 3,
    "nome": "Carlos",
    "sobrenome": "Almeida",
    "idade": 35,
    "email": "carlos.almeida@example.com",
    "compras": 11
  },
  {
    "id": 4,
    "nome": "Ana",
    "sobrenome": "Rocha",
    "idade": 22,
    "email": "ana.rocha@example.com",
    "compras": 14
  },
  {
    "id": 5,
    "nome": "Pedro",
    "sobrenome": "Alves",
    "idade": 40,
    "email": "pedro.alves@example.com",
    "compras": 7
  }
]


**TRANSFORM**

Através dos dados extraídos, foram separados clientes que compraram mais de 10 produtos da loja e enviado mensagens aos mesmos com cupons de desconto de até 30% em produtos da loja.

In [14]:
import random
import string

df = pd.read_csv('clientes.csv')

# Agrupa as compras por usuário e conta o número de compras
compras_por_usuario = df.groupby('id')['compras'].sum()

# Obtém os IDs dos usuários que fizeram mais de 10 compras
usuarios_compras_mais_10 = compras_por_usuario[compras_por_usuario > 10].index

# Gera um número de cupom aleatório
cupons_desconto_mais_10 = {}
for usuario_id in usuarios_compras_mais_10:
    cupom_desconto = ''.join(random.choices(string.ascii_uppercase + string.digits, k=6))
    cupons_desconto[usuario_id] = cupom_desconto


# Imprime mensagem de cupom de desconto para esses usuários
for usuario_id in usuarios_compras_mais_10:
    usuario_detalhes = df[df['id'] == usuario_id].iloc[0]
    cupom_desconto = cupons_desconto[usuario_id]
    print(f"Olá {usuario_detalhes['nome']} {usuario_detalhes['sobrenome']}, obrigado por ter feito mais de 10 compras conosco. Estamos te enviando o cupom {cupom_desconto} que lhe da até 30% de desconto em nossa loja!")


Olá Maria Santos, obrigado por ter feito mais de 10 compras conosco. Estamos te enviando o cupom SPA57N que lhe da até 30% de desconto em nossa loja!
Olá Carlos Almeida, obrigado por ter feito mais de 10 compras conosco. Estamos te enviando o cupom 5H8PRI que lhe da até 30% de desconto em nossa loja!
Olá Ana Rocha, obrigado por ter feito mais de 10 compras conosco. Estamos te enviando o cupom 842145 que lhe da até 30% de desconto em nossa loja!


**LOAD**

Foram carregados as informações dos cupons gerando um novo arquivo .CSV nomeado de cupons_mais_10.


In [15]:
# Cria DataFrame com os cupons de desconto
cupons_df_mais_10 = pd.DataFrame.from_dict(cupons_desconto_mais_10, orient='index', columns=['cupom_10'])

# Salva o DataFrame em um arquivo CSV
cupons_df_mais_10.to_csv('cupons_mais_10.csv')

print("Dados de cupons de desconto carregados com sucesso!")

Dados de cupons de desconto carregados com sucesso!
