# Santander Dev Week 2023 (ETL com Python)

**Contexto:** Você é um cientista de dados no Santander e recebeu a tarefa de envolver seus clientes de maneira mais personalizada. Seu objetivo é usar funçoes python  para criar mensagens de marketing personalizadas que serão entregues a cada cliente.

**Condições do Problema:**

1. Você recebeu uma planilha simples, em formato XLSX ('dataset-vendas.xlsx'), apresentando tipos  de produtos e seus valores:
 '''
 -- Ebook
 -- Livro

'''

2. Irá desenvolver um imposto de 10% para Tipo Ebook, e 15% para Livro, assim tendo uma coluna com os valores respectivos de cada item ao imposto. Fazendo as devidas transformações.

3. Ao final desta manipulação, o  usuario digitara qual tipo de produto comprou e qual valor da compra, assim retornara uma msg do valor do imposto e sem, dependendo do seu Tipo.


## Extração

In [1]:
from pandas.io.excel import read_excel
import pandas as pd

df = read_excel('/content/dataset-vendas - Copia.xlsx')
df

Unnamed: 0,Codigo do produto,Nome do produto,Tipo,Preço
0,1000889,Desmistificando Business Inteligence,Ebook,6.309
1,1002334,BI na veia,Livro,42.0
2,1002767,Power BI: 10 dicas para o tratamento dos dados,Ebook,8.41
3,1004327,Tudo sobre o Power BI Desktop,Livro,35.0
4,1013793,O poder do DAX,Livro,24.01
5,1022450,A bruxaria da linguagem M,Livro,38.012
6,1037797,DAX avançado,Livro,27.0
7,1041119,Top 10 fórmulas DAX,Ebook,4.904
8,1078680,Dashboards brilhantes,Ebook,5.1795
9,1086543,M e suas nuances,Livro,25.99


## Transformação

In [2]:
# Renomeando as colunas, e arredondado Preço para duas casas decimais.
df.columns = ["Id_produto", "Nome_produto", "Tipo", "Preco"]
df


Unnamed: 0,Id_produto,Nome_produto,Tipo,Preco
0,1000889,Desmistificando Business Inteligence,Ebook,6.309
1,1002334,BI na veia,Livro,42.0
2,1002767,Power BI: 10 dicas para o tratamento dos dados,Ebook,8.41
3,1004327,Tudo sobre o Power BI Desktop,Livro,35.0
4,1013793,O poder do DAX,Livro,24.01
5,1022450,A bruxaria da linguagem M,Livro,38.012
6,1037797,DAX avançado,Livro,27.0
7,1041119,Top 10 fórmulas DAX,Ebook,4.904
8,1078680,Dashboards brilhantes,Ebook,5.1795
9,1086543,M e suas nuances,Livro,25.99


In [3]:

# Define o índice como a coluna 'Id_Produto'
df.set_index('Id_produto', inplace=True)

# Remove o índice e não mantém o índice anterior como uma coluna
df_reset = df.reset_index(drop=True)

# Exibe o DataFrame resultante
df


Unnamed: 0_level_0,Nome_produto,Tipo,Preco
Id_produto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1000889,Desmistificando Business Inteligence,Ebook,6.309
1002334,BI na veia,Livro,42.0
1002767,Power BI: 10 dicas para o tratamento dos dados,Ebook,8.41
1004327,Tudo sobre o Power BI Desktop,Livro,35.0
1013793,O poder do DAX,Livro,24.01
1022450,A bruxaria da linguagem M,Livro,38.012
1037797,DAX avançado,Livro,27.0
1041119,Top 10 fórmulas DAX,Ebook,4.904
1078680,Dashboards brilhantes,Ebook,5.1795
1086543,M e suas nuances,Livro,25.99


In [4]:
def calcular_imposto(tipo, preco):
    tipo = tipo.lower()  # Converte a entrada do usuário para letras minúsculas, assim usuário podera digitar tanto maiuscula, quanto minúsculo.
    if tipo == 'ebook':
        return preco * 0.10
    elif tipo == 'livro':
        return preco * 0.15
    else:
        return 0.0

# Solicitar ao usuário o tipo de produto e preço
tipo_produto = input("Digite o tipo de produto (Livro ou Ebook): ")
preco_produto = float(input("Digite o preço do produto: "))

# Calcular o imposto,e o valor total com imposto
imposto = calcular_imposto(tipo_produto, preco_produto)
valor_com_imposto = preco_produto + imposto

# Criar a mensagem de retorno
mensagem = f"Você comprou um {tipo_produto}.\n"
mensagem += f"Valor sem imposto: R${preco_produto:.2f}\n"
mensagem += f"Valor com imposto: R${valor_com_imposto:.2f}"
print(mensagem)

# Criar coluna Imposto
df['Imposto'] = df.apply(lambda row: calcular_imposto(row['Tipo'], row['Preco']), axis=1)



# Transforma as colunas 'Preco' e 'Imposto' em reais
df['Preco'] = df['Preco'].apply(lambda x: f"R${x:.2f}")
df['Imposto'] = df['Imposto'].apply(lambda x: f"R${x:.2f}")

# Exiba o DataFrame com as colunas formatadas
df

Digite o tipo de produto (Livro ou Ebook): livro
Digite o preço do produto: 42.00
Você comprou um livro.
Valor sem imposto: R$42.00
Valor com imposto: R$48.30


Unnamed: 0_level_0,Nome_produto,Tipo,Preco,Imposto
Id_produto,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
1000889,Desmistificando Business Inteligence,Ebook,R$6.31,R$0.63
1002334,BI na veia,Livro,R$42.00,R$6.30
1002767,Power BI: 10 dicas para o tratamento dos dados,Ebook,R$8.41,R$0.84
1004327,Tudo sobre o Power BI Desktop,Livro,R$35.00,R$5.25
1013793,O poder do DAX,Livro,R$24.01,R$3.60
1022450,A bruxaria da linguagem M,Livro,R$38.01,R$5.70
1037797,DAX avançado,Livro,R$27.00,R$4.05
1041119,Top 10 fórmulas DAX,Ebook,R$4.90,R$0.49
1078680,Dashboards brilhantes,Ebook,R$5.18,R$0.52
1086543,M e suas nuances,Livro,R$25.99,R$3.90


## **L**oad




In [5]:
pip install openpyxl



In [6]:
# Salvando o DataFrame em um arquivo Excel
df.to_excel('Vendas_produtos.xlsx', index=False, engine='openpyxl')

print("DataFrame salvo com sucesso em Vendas_produtos.xlsx")


DataFrame salvo com sucesso em Vendas_produtos.xlsx
