# Santander Ciência de Dados (ETL c/Python)

**Contexto:**</br>
Requisição de Serviço para Conversão de Dados de Excel para PDF com Mensagens Personalizadas

</br>**Descrição do Serviço:**</br>
Realizar conversão de Dados Excel para PDF: Realizar a conversão dos dados contidos no arquivo Excel para um arquivo PDF único.

</br>**Filtragem de Clientes:**</br>
Identificar os clientes que aniversariam durante a semana, com base na data de aniversário que está contida na coluna D do Excel.

</br>**Personalização das Mensagens:**</br>
Para cada cliente que aniversaria durante a semana, personalizar a mensagem no PDF. A mensagem deve incluir o nome com primeiro sobrenome ou nome composto do cliente, que está contido na coluna A do Excel, da seguinte forma:

```
"Olá {nome}, tudo bem? Essa semana você está aniversariando
e para comemorar estamos com uma promoção! A partir de R$30
em compras com pagamento por PIX, ganhe 10% de cashback na
sua conta!"
```

</br>**Formatação do PDF:**</br>
Inserir as mensagens personalizadas no PDF com um espaçamento de duas linhas entre elas.

</br>**Entregáveis Esperados:**</br>
Arquivo PDF único contendo todas as mensagens personalizadas conforme os critérios mencionados.

</br>**Observações Adicionais:**
* O arquivo Excel contém os dados dos clientes, com as colunas A contendo o nome completo, e a coluna D contendo a data de aniversário;
* O processo de conversão dos dados deve ser automatizado;</br>
* O PDF final deve ser de alta qualidade e legível.

# Extract

In [1]:
import pandas as pd
!pip install fpdf2

from fpdf import FPDF
from datetime import datetime, timedelta

df = pd.read_excel('Clientes_Planilha.xlsx')

#Verifica o conteúdo do DataFrame
print(df.head())

Collecting fpdf2
  Downloading fpdf2-2.7.6-py2.py3-none-any.whl (187 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/187.1 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m187.1/187.1 kB[0m [31m7.1 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: fpdf2
Successfully installed fpdf2-2.7.6
                          NOME                  EMAIL SEXO DATA DE NASCIMENTO  \
0                          NaN                    NaN  NaN                NaT   
1                 Sonia Farina  sonia***@yahoo.com.br    F         1973-10-20   
2  Sonia Lucia Leonel De Souza   sonin***@onda.com.br    F         1971-03-23   
3         Sonia Maria Da Silva   sonia***@hotmail.com    F         1997-09-02   
4  Sonia Regina Camargo Lenkiu  sonia***@yahoo.com.br    F         2005-04-17   

       ENDERECO NÚMERO  COMPLEMENTO        CEP       BAIRRO    CIDADE ESTADO  \
0           NaN    NaN          NaN        NaN     

In [2]:
# Definir datas atual e da próxima semana
data_atual = datetime.now()
data_inicio_semana = data_atual + timedelta(days=(7 - data_atual.weekday()))
data_fim_semana = data_inicio_semana + timedelta(days=7)

# Filtrar clientes com aniversário na próxima semana
clientes_aniversariantes = df[df['DATA DE NASCIMENTO'].apply(lambda x: (data_inicio_semana <= x.replace(year=data_atual.year) <= data_fim_semana))]

#Verifica o DataFrame dos clientes
print(clientes_aniversariantes)

                              NOME                                EMAIL SEXO  \
1                     Sonia Farina                sonia***@yahoo.com.br    F   
8                      Telma Souza                 sopma***@hotmail.com    F   
43        Vanessa Costa Dos Santos                 vanex***@hotmail.com    F   
45   Vanessa Cristiane Rocha Couto                 vanes***@hotmail.com    F   
89                Wivian Carradore                  wcarr***@bol.com.br    F   
135                    Neiva Zinke                   consu***@gmail.com    F   
282      Fernando Henrique Fischer  ferna***@construtoraelevacao.com.br    F   
370        Agatha Teixeira Conelio                 agath***@hotmail.com    F   
381               Adenilson Mendes                  rygie***@bol.com.br    F   

    DATA DE NASCIMENTO      ENDERECO NÚMERO  COMPLEMENTO        CEP  \
1           1973-10-20  Avenida S***    2**  AP 95 BL 02  81010-***   
8           1997-10-20  Rua Evang***    2**          NaN 

# Transform & Load

In [4]:
# Verifica se o DataFrame está vazio, caso contrário cria o PDF iterando com os clientes aniversariantes
if clientes_aniversariantes.empty:
    print("Nenhum cliente encontrado para a próxima semana.")
else:
    pdf = FPDF()
    pdf.add_page()
    pdf.set_font("helvetica", size=12)

    for _, row in clientes_aniversariantes.iterrows():
        nome = row['NOME']
        nome_sobrenome = nome.split()[0]
        if len(nome.split()) > 1:
          nome_sobrenome += " " + nome.split()[1]

        mensagem = f"Olá {nome_sobrenome}, tudo bem? Essa semana você está aniversariando e para comemorar estamos com uma promoção! A partir de R$30 em compras com pagamento por PIX, ganhe 10% de cashback na sua conta."

        pdf.multi_cell(0, 10, txt=mensagem, align="L")
        pdf.ln(20)  # Adiciona um espaçamento de duas linhas

    # Salvar o PDF
    pdf_output_file = "mensagens_aniversario_clientes.pdf"
    pdf.output(pdf_output_file)

    print(f'O arquivo {pdf_output_file} foi gerado com sucesso.')

    from google.colab import files
    files.download(pdf_output_file)

O arquivo mensagens_aniversario_clientes.pdf foi gerado com sucesso.


  pdf.multi_cell(0, 10, txt=mensagem, align="L")


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>