# Desafio - Programa de Trainee | MATH GROUP

## Autor: Michael Gustavo dos Santos Florentino  
**E-mail:** michaelgsf@hotmail.com  
**LinkedIn:** [www.linkedin.com/in/michaelgsf](https://www.linkedin.com/in/michaelgsf)  
**GitHub:** https://github.com/Michaelgsf  

---

## Introdução

Este notebook apresenta a solução para o desafio técnico proposto pelo **MATH GROUP** como parte do processo seletivo para o **Programa de Trainee**. O objetivo é demonstrar habilidades analíticas e de programação por meio da manipulação de dados e resolução de questões específicas baseadas em um conjunto de tabelas fornecidas.

O desafio envolve o processamento e análise de dados transacionais de clientes, respondendo a perguntas estratégicas sobre saldo, proporções e movimentações financeiras. A implementação foi realizada em Python, utilizando a biblioteca pandas para manipulação de dados e cálculos estatísticos.

---

## Estrutura da Solução

1. Criação das Tabelas - Os dados foram estruturados em DataFrames do pandas, simulando um banco de dados relacional.
2. Análises e Respostas - Cada pergunta do desafio foi resolvida utilizando operações eficientes em pandas, garantindo precisão nos cálculos.
3. Interpretação dos Resultados - Os resultados foram organizados e apresentados de forma clara, garantindo a compreensão das métricas extraídas.

A solução busca responder de maneira otimizada e objetiva a todas as questões propostas, garantindo clareza e eficiência na análise dos dados fornecidos.

---

## Entrega

A solução apresentada reflete não apenas a abordagem técnica, mas também a lógica aplicada para resolver cada questão de forma estruturada.

Estou animado em participar deste processo, contribuir com minha experiência e conhecimento e com a possíbilidade de trabalhar e aprender com a empresa.!

---

## Bibliotecas Utilizadas

```python
import pandas as pd
import numpy as np
```

Vamos à implementação da solução!


In [3]:
import pandas as pd

## Criação dos DataFrames  
Vamos criar as tabelas de clientes e transações conforme os dados fornecidos.

In [2]:
clientes = pd.DataFrame({
    'CD_CLIENTE': [1, 2, 3, 4, 5],
    'NM_CLIENTE': ['João', 'Maria', 'José', 'Adilson', 'Cleber']
})

transacoes = pd.DataFrame({
    'CD_CLIENTE': [1, 1, 1, 1, 1, 5, 5, 5, 5, 5, 3, 3, 3, 4],
    'DT_TRANSACAO': pd.to_datetime([
        '2021-08-28', '2021-09-09', '2021-09-17', '2021-11-15', '2021-12-24',
        '2021-10-28', '2021-11-07', '2021-12-05', '2021-12-14', '2021-12-21',
        '2021-10-05', '2021-11-05', '2021-12-05', '2021-10-09'
    ]),
    'CD_TRANSACAO': ['000', '110', '220', '110', '220', '110', '110', '220', '220', '220', '110', '110', '110', '000'],
    'VR_TRANSACAO': [20.00, 78.90, -58.00, 178.90, -110.37, 220.00, 380.00, -398.86, -33.90, -16.90, 720.90, 720.90, 720.90, 50.00]
})

## Qual cliente teve o maior saldo médio no mês 11?  
Para responder, calculamos o saldo médio de cada cliente durante o mês de novembro e identificamos aquele com o maior valor.

In [None]:
novembro = transacoes[transacoes['DT_TRANSACAO'].dt.month == 11]
saldo_medio = novembro.groupby('CD_CLIENTE')['VR_TRANSACAO'].mean().idxmax()
cliente_maior_saldo_medio = clientes.loc[clientes['CD_CLIENTE'] == saldo_medio]
print("Cliente com maior saldo médio em novembro:")
print(cliente_maior_saldo_medio)

## Qual é o saldo de cada cliente?  
Aqui, calculamos o saldo total de cada cliente com base em suas transações, considerando entradas (CashIn), saídas (CashOut) e CashBack recebidos.


In [4]:
saldos = transacoes.groupby('CD_CLIENTE')['VR_TRANSACAO'].sum().reset_index()
saldos = saldos.merge(clientes, on='CD_CLIENTE')
print("Saldo de cada cliente:")
print(saldos)

Saldo de cada cliente:
   CD_CLIENTE  VR_TRANSACAO NM_CLIENTE
0           1        109.43       João
1           3       2162.70       José
2           4         50.00    Adilson
3           5        150.34     Cleber


## Qual é o saldo médio de clientes que receberam CashBack?  
Para responder, filtramos os clientes que receberam pelo menos um CashBack e calculamos o saldo médio deles.

In [5]:
com_cashback = transacoes[transacoes['CD_TRANSACAO'] == '000']
saldo_medio_cashback = com_cashback.groupby('CD_CLIENTE')['VR_TRANSACAO'].mean()
print("Saldo médio dos clientes que receberam CashBack:")
print(saldo_medio_cashback)

Saldo médio dos clientes que receberam CashBack:
CD_CLIENTE
1    20.0
4    50.0
Name: VR_TRANSACAO, dtype: float64


## Qual o ticket médio das quatro últimas movimentações dos usuários?  
O ticket médio é a média dos valores das últimas quatro transações de cada cliente.

In [8]:
ultimas_transacoes = transacoes.groupby('CD_CLIENTE').tail(4)
ticket_medio = ultimas_transacoes.groupby('CD_CLIENTE')['VR_TRANSACAO'].mean()
print("Ticket médio das quatro últimas transações de cada usuário:")
print(ticket_medio)

Ticket médio das quatro últimas transações de cada usuário:
CD_CLIENTE
1     22.3575
3    720.9000
4     50.0000
5    -17.4150
Name: VR_TRANSACAO, dtype: float64


## Qual é a proporção entre Cash In e Cash Out mensal?  
Aqui, analisamos a relação entre depósitos (CashIn) e retiradas (CashOut) em cada mês para entender o fluxo financeiro.

In [7]:
transacoes['MES'] = transacoes['DT_TRANSACAO'].dt.month
cash_in_out = transacoes.pivot_table(index='MES', columns='CD_TRANSACAO', values='VR_TRANSACAO', aggfunc='sum', fill_value=0)
cash_in_out['PROPORCAO'] = abs(cash_in_out['110'] / cash_in_out['220'])
print("Proporção entre Cash In/Out mensal:")
print(cash_in_out['PROPORCAO'])

Proporção entre Cash In/Out mensal:
MES
8          NaN
9     1.360345
10         inf
11         inf
12    1.287252
Name: PROPORCAO, dtype: float64


## Qual a última transação de cada tipo para cada usuário?  
Identificamos a última ocorrência de cada tipo de transação (CashBack, CashIn e CashOut) para cada cliente.

In [9]:
ultima_transacao_tipo = transacoes.sort_values(by=['DT_TRANSACAO']).groupby(['CD_CLIENTE', 'CD_TRANSACAO']).last()
print("Última transação de cada tipo para cada usuário:")
print(ultima_transacao_tipo)

Última transação de cada tipo para cada usuário:
                        DT_TRANSACAO  VR_TRANSACAO  MES
CD_CLIENTE CD_TRANSACAO                                
1          000            2021-08-28         20.00    8
           110            2021-11-15        178.90   11
           220            2021-12-24       -110.37   12
3          110            2021-12-05        720.90   12
4          000            2021-10-09         50.00   10
5          110            2021-11-07        380.00   11
           220            2021-12-21        -16.90   12


## Qual a última transação de cada tipo para cada usuário por mês?  
Semelhante à análise anterior, mas aqui consideramos a última transação de cada tipo para cada mês, permitindo uma visão temporal mais detalhada.

In [10]:
ultima_transacao_tipo_mes = transacoes.sort_values(by=['DT_TRANSACAO']).groupby(['CD_CLIENTE', 'CD_TRANSACAO', 'MES']).last()
print("Última transação de cada tipo para cada usuário por mês:")
print(ultima_transacao_tipo_mes)

Última transação de cada tipo para cada usuário por mês:
                            DT_TRANSACAO  VR_TRANSACAO
CD_CLIENTE CD_TRANSACAO MES                           
1          000          8     2021-08-28         20.00
           110          9     2021-09-09         78.90
                        11    2021-11-15        178.90
           220          9     2021-09-17        -58.00
                        12    2021-12-24       -110.37
3          110          10    2021-10-05        720.90
                        11    2021-11-05        720.90
                        12    2021-12-05        720.90
4          000          10    2021-10-09         50.00
5          110          10    2021-10-28        220.00
                        11    2021-11-07        380.00
           220          12    2021-12-21        -16.90


## Qual a quantidade de usuários que movimentaram a conta?  
Nesta análise, contamos quantos clientes realizaram pelo menos uma transação no período analisado.


In [11]:
usuarios_ativos = transacoes['CD_CLIENTE'].nunique()
print("Quantidade de usuários que movimentaram a conta:", usuarios_ativos)

Quantidade de usuários que movimentaram a conta: 4


## Qual o balanço do final de 2021?  
Calculamos o saldo final de todas as contas ao término do ano de 2021, considerando todas as movimentações realizadas.

In [15]:
balanco_2021 = transacoes['VR_TRANSACAO'].sum()
print("Balanço final de 2021:", round(balanco_2021, 2))

Balanço final de 2021: 2472.47


## Quantos usuários que receberam CashBack continuaram interagindo com este banco?  
Verificamos quantos clientes que receberam pelo menos um CashBack realizaram transações subsequentes, mostrando sua continuidade na plataforma.


In [None]:
usuarios_cashback = cashback['CD_CLIENTE'].unique()
usuarios_interagiram = transacoes['CD_CLIENTE'].unique()
usuarios_continuaram = set(usuarios_cashback) & set(usuarios_interagiram)
print("Usuários que receberam CashBack e continuaram interagindo:", len(usuarios_continuaram))

## Qual a primeira e a última movimentação dos usuários com saldo maior que R$100?

Filtramos os clientes cujo saldo total seja superior a R$ 100 e identificamos sua primeira e última transação no período analisado.


In [16]:
usuarios_saldo_maior_100 = saldos[saldos['VR_TRANSACAO'] > 100]['CD_CLIENTE']
movimentacoes_filtradas = transacoes[transacoes['CD_CLIENTE'].isin(usuarios_saldo_maior_100)]
primeira_ultima_mov = movimentacoes_filtradas.groupby('CD_CLIENTE')['DT_TRANSACAO'].agg(['first', 'last'])
print("Primeira e última movimentação dos usuários com saldo maior que R$100:")
print(primeira_ultima_mov)

Primeira e última movimentação dos usuários com saldo maior que R$100:
                first       last
CD_CLIENTE                      
1          2021-08-28 2021-12-24
3          2021-10-05 2021-12-05
5          2021-10-28 2021-12-21


## Qual o balanço das últimas quatro movimentações de cada usuário?  
Aqui, calculamos a soma das quatro últimas transações de cada cliente, para entender o impacto financeiro recente de suas movimentações.


In [17]:
balanco_ultimas_quatro = ultimas_transacoes.groupby('CD_CLIENTE')['VR_TRANSACAO'].sum()
print("Balanço das últimas quatro movimentações de cada usuário:")
print(balanco_ultimas_quatro)

Balanço das últimas quatro movimentações de cada usuário:
CD_CLIENTE
1      89.43
3    2162.70
4      50.00
5     -69.66
Name: VR_TRANSACAO, dtype: float64


## Qual o ticket médio das últimas quatro movimentações de cada usuário?  
Nesta análise, determinamos a média das quatro últimas transações de cada cliente, ajudando a identificar padrões de consumo ou depósito.


In [19]:
ticket_medio_ultimas_quatro = ultimas_transacoes.groupby('CD_CLIENTE')['VR_TRANSACAO'].mean()
print("Ticket médio das últimas quatro movimentações de cada usuário:")
print(ticket_medio_ultimas_quatro)

Ticket médio das últimas quatro movimentações de cada usuário:
CD_CLIENTE
1     22.3575
3    720.9000
4     50.0000
5    -17.4150
Name: VR_TRANSACAO, dtype: float64


## Conclusão  

Este notebook apresentou minha resolução do **Desafio Técnico - Programa de Trainee** da **MATH GROUP**, abordando questões relacionadas à análise de dados transacionais de clientes.  

A solução foi desenvolvida utilizando a biblioteca pandas para manipulação e análise dos dados, garantindo cálculos eficientes e respostas precisas para cada questão proposta. Durante o desenvolvimento, foram aplicadas técnicas de limpeza, transformação e agregação de dados, assegurando que os resultados representassem corretamente a realidade financeira dos clientes.  

O código foi estruturado para garantir clareza, eficiência e reprodutibilidade, permitindo que futuras análises possam ser facilmente adaptadas ou expandidas.  

Estou entusiasmado por participar deste processo e grato pela oportunidade de demonstrar minhas habilidades analíticas e de programação. Fico à disposição para qualquer esclarecimento ou discussão sobre os métodos utilizados.  

Agradeço a oportunidade!
