In [118]:
import pandas as pd


#Carregando os dados
file_path = '/Users/lizmartns/teste-farmtech/teste-farmtech/data/Case_DS_ED_2026.xlsx'
df = pd.read_excel(file_path)

#Drop de valores nulos
df = df.dropna()

df


Unnamed: 0,ID_CLIENTE,ID_VENDA,DT_VENDA,VLR_VENDA,DT_VCT,DT_PGTO,SETOR,PRODUTO,CANAL,REGIAO,UF
0,A,1,2022-01-15,150000,2022-09-15,2022-09-16,Pecuária,Armazenagem,Revenda,Centro-Oeste,MS
1,B,2,2022-01-29,220000,2022-09-01,2022-08-25,Agricultura,Sementes,Direto,Sudeste,RJ
2,C,3,2022-02-28,145000,2022-09-01,2022-11-30,Agricultura,Defensivos,Direto,Sudeste,RJ
4,E,5,2022-03-10,95000,2022-09-30,2022-10-15,Agricultura,Fertilizantes,Direto,Sudeste,SP
5,F,6,2022-04-15,400000,2022-10-15,2023-02-06,Agricultura,Sementes,Marketplace,Sudeste,ES
...,...,...,...,...,...,...,...,...,...,...,...
94,AE,95,2022-12-26,180000,2023-05-22,2023-10-28,Agricultura,Sementes,Marketplace,Sul,PR
95,AT,96,2022-12-22,180000,2023-08-23,2023-08-17,Agroindústria,Maquinário,Direto,Centro-Oeste,GO
96,AX,97,2023-11-23,250000,2024-05-24,2024-05-05,Agroindústria,Serviços,Revenda,Centro-Oeste,MT
97,AR,98,2023-10-30,60000,2024-05-02,2024-05-02,Pecuária,Serviços,Marketplace,Sul,RS


In [119]:
# Conferindo os tipos de dados das colunas 
df.info()


<class 'pandas.core.frame.DataFrame'>
Index: 81 entries, 0 to 98
Data columns (total 11 columns):
 #   Column      Non-Null Count  Dtype         
---  ------      --------------  -----         
 0   ID_CLIENTE  81 non-null     object        
 1   ID_VENDA    81 non-null     int64         
 2   DT_VENDA    81 non-null     datetime64[ns]
 3   VLR_VENDA   81 non-null     int64         
 4   DT_VCT      81 non-null     datetime64[ns]
 5   DT_PGTO     81 non-null     datetime64[ns]
 6   SETOR       81 non-null     object        
 7   PRODUTO     81 non-null     object        
 8   CANAL       81 non-null     object        
 9   REGIAO      81 non-null     object        
 10  UF          81 non-null     object        
dtypes: datetime64[ns](3), int64(2), object(6)
memory usage: 7.6+ KB


In [120]:
# Criar colunas auxiliares
df['ANO_VENDA'] = df['DT_VENDA'].dt.year
df['PRAZO_CONTRATADO'] = (df['DT_VCT'] - df['DT_VENDA']).dt.days
df['TEMPO_ATE_PGTO'] = (df['DT_PGTO'] - df['DT_VENDA']).dt.days
df['ATRASO'] = (df['DT_PGTO'] - df['DT_VCT']).dt.days

In [121]:
# pergunta 1 : Quantos clientes únicos realizaram compras em 2022?

clientes_unicos_2022 = df[df['ANO_VENDA'] == 2022]['ID_CLIENTE'].nunique()

print(f"Clientes únicos em 2022: {clientes_unicos_2022}")

Clientes únicos em 2022: 26


In [122]:
# pergunta 2 : Qual a quantidade de vendas realizadas em 2022? E 2023?
vendas_2022 = len(df[df['ANO_VENDA'] == 2022])
vendas_2023 = len(df[df['ANO_VENDA'] == 2023])

print(f" Vendas em 2022: {vendas_2022} | Vendas em 2023: {vendas_2023}")


 Vendas em 2022: 43 | Vendas em 2023: 38


In [123]:
# pergunta 3 : Qual o Valor médio das vendas em 2022 e em 2023?

vlr_medio_2022 = df[df['ANO_VENDA'] == 2022]['VLR_VENDA'].mean()
vlr_medio_2023 = df[df['ANO_VENDA'] == 2023]['VLR_VENDA'].mean()

print(f"Valor médio 2022: R$ {vlr_medio_2022:,.2f} | Valor médio 2023: R$ {vlr_medio_2023:,.2f}")


Valor médio 2022: R$ 267,906.98 | Valor médio 2023: R$ 261,552.63


In [124]:
# pergunta 4: Qual o prazo contratado médio por ano (em dias)?
prazo_medio_ano = df.groupby('ANO_VENDA')['PRAZO_CONTRATADO'].mean()

print(f"Prazo médio contratado por ano:\n{prazo_medio_ano}")


Prazo médio contratado por ano:
ANO_VENDA
2022    192.930233
2023    192.394737
Name: PRAZO_CONTRATADO, dtype: float64


In [125]:
# pergunta 5 : Qual o tempo médio até o pagamento por ano (em dias)?
# considerado apenas vendas pagas para o cálculo do tempo médio até o pagamento
tempo_medio_pgto_ano = df[df['DT_PGTO'].notnull()].groupby('ANO_VENDA')['TEMPO_ATE_PGTO'].mean()

print(f"Tempo médio até pagamento por ano:\n{tempo_medio_pgto_ano}")


Tempo médio até pagamento por ano:
ANO_VENDA
2022    206.953488
2023    208.026316
Name: TEMPO_ATE_PGTO, dtype: float64


In [126]:
# pergunta 6 : Quantas vendas foram pagas em dia ou antecipadas?

vendas_em_dia = len(df[df['DT_PGTO'].notnull() & (df['DT_PGTO'] <= df['DT_VCT'])])

print(f"Vendas pagas em dia ou antecipadas: {vendas_em_dia}")


Vendas pagas em dia ou antecipadas: 34


In [127]:
# pergunta 7 : Quantas vendas em atraso > 90 dias?

hoje = pd.to_datetime('2024-01-01') # Data de referência para faturas em aberto
df['ATRASO_ATUAL'] = df.apply(lambda x: (x['DT_PGTO'] - x['DT_VCT']).days if pd.notnull(x['DT_PGTO']) 
                             else (hoje - x['DT_VCT']).days, axis=1)
vendas_atraso_90 = len(df[df['ATRASO_ATUAL'] > 90])

print(f"Vendas com atraso > 90 dias: {vendas_atraso_90}")



Vendas com atraso > 90 dias: 5


In [128]:
# pergunta 8 : Quantos clientes atrasaram > 90 dias?
clientes_atraso_90 = df[df['ATRASO_ATUAL'] > 90]['ID_CLIENTE'].nunique()

print(f"Clientes com atraso > 90 dias: {clientes_atraso_90}")


Clientes com atraso > 90 dias: 5


In [129]:
# Pergunta 9 : Qual o saldo a receber em 31/10/2022?
corte_1 = pd.to_datetime('2022-10-31')
# Saldo a receber: Vendas realizadas até o corte que não foram pagas até o corte
saldo_31_10_2022 = df[(df['DT_VENDA'] <= corte_1) & ((df['DT_PGTO'] > corte_1) | df['DT_PGTO'].isnull())]['VLR_VENDA'].sum()

print(f"Saldo a receber em 31/10/2022: R$ {saldo_31_10_2022:,.2f}")


Saldo a receber em 31/10/2022: R$ 5,560,000.00


In [130]:
# Pergunta 10 : Qual o saldo a receber em 31/08/2022?
corte_2 = pd.to_datetime('2022-08-31')
saldo_31_08_2022 = df[(df['DT_VENDA'] <= corte_2) & ((df['DT_PGTO'] > corte_2) | df['DT_PGTO'].isnull())]['VLR_VENDA'].sum()

print(f"Saldo a receber em 31/08/2022: R$ {saldo_31_08_2022:,.2f}")


Saldo a receber em 31/08/2022: R$ 7,275,000.00


In [131]:
# Pergunta 11: Calcule o percentual do valor pago no prazo.
vlr_total_pago = df[df['DT_PGTO'].notnull()]['VLR_VENDA'].sum()
vlr_pago_no_prazo = df[df['DT_PGTO'].notnull() & (df['DT_PGTO'] <= df['DT_VCT'])]['VLR_VENDA'].sum()
pct_vlr_no_prazo = (vlr_pago_no_prazo / vlr_total_pago) * 100 if vlr_total_pago > 0 else 0

print(f"% do Valor pago no prazo: {pct_vlr_no_prazo:.2f}%")

% do Valor pago no prazo: 47.81%


In [132]:
# Pergunta 12: Calcule o percentual de vendas pagas no prazo.
total_vendas_pagas = df['DT_PGTO'].notnull().sum()
pct_vendas_no_prazo = (vendas_em_dia / total_vendas_pagas) * 100 if total_vendas_pagas > 0 else 0

print(f"% de Vendas pagas no prazo: {pct_vendas_no_prazo:.2f}%")



% de Vendas pagas no prazo: 41.98%


In [133]:

# Pergunta 13 : Quantos clientes estavam ativos em 2023?
# Ativo = Realizou compra em 2023
clientes_ativos_2023 = df[df['ANO_VENDA'] == 2023]['ID_CLIENTE'].nunique()

print(f"Clientes ativos em 2023: {clientes_ativos_2023}")




Clientes ativos em 2023: 23


In [134]:
# Pergunta 14 : Calcule o prazo contratado médio ponderado (2022-2023).
# Ponderado pelo valor da venda
df_22_23 = df[df['ANO_VENDA'].isin([2022, 2023])]
prazo_ponderado = (df_22_23['PRAZO_CONTRATADO'] * df_22_23['VLR_VENDA']).sum() / df_22_23['VLR_VENDA'].sum()

print(f"Prazo médio ponderado (2022-2023): {prazo_ponderado:.2f} dias")




Prazo médio ponderado (2022-2023): 194.89 dias


In [135]:
# Pergunta 15 : Calcule o percentual do saldo em aberto com atraso > 90 dias no corte 31/12/2023.
corte_3 = pd.to_datetime('2023-12-31')
aberto_corte_3 = df[(df['DT_VENDA'] <= corte_3) & ((df['DT_PGTO'] > corte_3) | df['DT_PGTO'].isnull())]
saldo_total_aberto = aberto_corte_3['VLR_VENDA'].sum()
saldo_atraso_90 = aberto_corte_3[(corte_3 - aberto_corte_3['DT_VCT']).dt.days > 90]['VLR_VENDA'].sum()
pct_atraso_90_corte = (saldo_atraso_90 / saldo_total_aberto) * 100 if saldo_total_aberto > 0 else 0

print(f"% do Saldo aberto > 90 dias (31/12/2023): {pct_atraso_90_corte:.2f}%")



% do Saldo aberto > 90 dias (31/12/2023): 0.00%


In [136]:
# Pergunta 16: Calcule a Inadimplência financeira (atraso > 180 dias) no corte 31/12/2023. Absoluta e percentual.
saldo_atraso_180 = aberto_corte_3[(corte_3 - aberto_corte_3['DT_VCT']).dt.days > 180]['VLR_VENDA'].sum()
pct_inad_180 = (saldo_atraso_180 / saldo_total_aberto) * 100 if saldo_total_aberto > 0 else 0

print(f"Inadimplência (> 180 dias) em 31/12/2023: Absoluta R$ {saldo_atraso_180:,.2f} | Percentual {pct_inad_180:.2f}%")


Inadimplência (> 180 dias) em 31/12/2023: Absoluta R$ 0.00 | Percentual 0.00%


In [137]:
#Pergunta 17: Calcule o atraso médio para faturas pagas com atraso.
atraso_medio_pagas = df[df['ATRASO'] > 0]['ATRASO'].mean()

print(f"Atraso médio (faturas pagas com atraso): {atraso_medio_pagas:.2f} dias")



Atraso médio (faturas pagas com atraso): 32.66 dias


In [138]:
# Pergunta 18 : Qual seria o Churn absoluto de clientes em 2023?
# Churn = Clientes que compraram em 2022 mas não em 2023
clientes_2022_set = set(df[df['ANO_VENDA'] == 2022]['ID_CLIENTE'])
clientes_2023_set = set(df[df['ANO_VENDA'] == 2023]['ID_CLIENTE'])
churn_absoluto = len(clientes_2022_set - clientes_2023_set)

print(f"Churn absoluto em 2023: {churn_absoluto}")



Churn absoluto em 2023: 16


In [139]:
# Pergunta 19: Quantos novos clientes em 2023?

novos_clientes_2023 = len(clientes_2023_set - clientes_2022_set)

print(f"Novos clientes em 2023: {novos_clientes_2023}")



Novos clientes em 2023: 13


In [140]:
# Pergunta 20: Qual foi a participação do faturamento do ano de 2023?
faturamento_total = df['VLR_VENDA'].sum()
faturamento_2023 = df[df['ANO_VENDA'] == 2023]['VLR_VENDA'].sum()
part_faturamento_2023 = (faturamento_2023 / faturamento_total) * 100

print(f"Participação do faturamento em 2023: {part_faturamento_2023:.2f}%")



Participação do faturamento em 2023: 46.32%
