<a href="https://colab.research.google.com/github/vicensi/Projetos/blob/main/Indicadores_Performance_Redes_de_Varejo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# <font color='blue'>Business Analytics</font>

# <font color='blue'>Marketing Analytics</font>

## <font color='blue'>Análise de Indicadores de Performance em Redes de Varejo</font>

In [1]:
# Versão da Linguagem Python
from platform import python_version
print('Versão da Linguagem Python Usada Neste Jupyter Notebook:', python_version())

Versão da Linguagem Python Usada Neste Jupyter Notebook: 3.10.12


![title](imagens/projeto3.png)

## Marketing Analytics

Marketing Analytics compreende os processos e tecnologias que permitem aos profissionais de Marketing avaliar o sucesso de suas iniciativas.

Isso é feito medindo o desempenho das campanhas de Marketing, coletando os dados e analisando os resultados. Marketing Analytics utiliza métricas importantes de negócios, como ROI (Retorno Sobre o Investimento), Atribuição de Marketing e Eficácia Geral do Marketing. Em outras palavras, o Marketing Analytics mostra se os programas de Marketing estão sendo efetivos ou não.

Marketing Analytics reúne dados de todos os canais de marketing e os consolida em uma visão de marketing comum. A partir dessa visão comum, você pode extrair resultados analíticos que podem fornecer assistência inestimável para impulsionar os esforços de marketing.

## O Que São KPIs (Indicadores Chave de Performance)?

Leia o manual em pdf no Capítulo 6.

## Como Definir os KPIs?

Leia o manual em pdf no Capítulo 6.

## Definindo o Problema

Leia o manual em pdf no Capítulo 6.

## Instalando e Carregando os Pacotes

In [2]:
# Para atualizar um pacote, execute o comando abaixo no terminal ou prompt de comando:
# pip install -U nome_pacote

# Para instalar a versão exata de um pacote, execute o comando abaixo no terminal ou prompt de comando:
# !pip install nome_pacote==versão_desejada

# Depois de instalar ou atualizar o pacote, reinicie o jupyter notebook.

# Instala o pacote watermark.
# Esse pacote é usado para gravar as versões de outros pacotes usados neste jupyter notebook.
!pip install -q -U watermark

In [3]:
# Instala o Plotly
!pip install -q plotly

In [4]:
# Imports
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib
import plotly
import matplotlib.pyplot as plt

import plotly.graph_objs as go
from datetime import datetime, timedelta


## Carregando os Dados

In [5]:
# Carrega os dados
dados = pd.read_csv("/content/drive/MyDrive/pythonAtualizado/Analise KPI Rede de varejo/dados/dataset.csv", header = 0, encoding = 'unicode_escape')

In [6]:
# Visualiza os dados
dados.head()

Unnamed: 0,NumeroFatura,CodigoProduto,NomeProduto,Quantidade,DataVenda,ValorUnitario,IdCliente,Pais
0,536365,21730,GLASS STAR FROSTED T-LIGHT HOLDER,6,12/1/2010 8:26,4.25,17850.0,Brasil
1,536365,85123A,WHITE HANGING HEART T-LIGHT HOLDER,6,12/1/2010 8:26,2.55,17850.0,Brasil
2,536365,71053,WHITE METAL LANTERN,6,12/1/2010 8:26,3.39,17850.0,Brasil
3,536365,84406B,CREAM CUPID HEARTS COAT HANGER,8,12/1/2010 8:26,2.75,17850.0,Brasil
4,536365,84029G,KNITTED UNION FLAG HOT WATER BOTTLE,6,12/1/2010 8:26,3.39,17850.0,Brasil


Nota: Cada linha (registro) representa um item de um pedido. Observe que a coluna NumeroFatura se repete indicando que é um mesmo pedido com itens diferentes. Para cada item temos o produto, a quantidade, o valor unitário, o cliente e o país.

In [7]:
# Shape
dados.shape

(541800, 8)

In [8]:
# Tipos de dados
dados.dtypes

NumeroFatura      object
CodigoProduto     object
NomeProduto       object
Quantidade         int64
DataVenda         object
ValorUnitario    float64
IdCliente        float64
Pais              object
dtype: object

In [9]:
# Describe
dados.describe()

Unnamed: 0,Quantidade,ValorUnitario,IdCliente
count,541800.0,541800.0,406725.0
mean,9.551739,4.611581,15287.754038
std,218.103033,96.769576,1713.475925
min,-80995.0,-11062.06,12346.0
25%,1.0,1.25,13954.0
50%,3.0,2.08,15152.0
75%,10.0,4.13,16791.0
max,80995.0,38970.0,18287.0


In [10]:
# Verificando valores nulos
dados.isna().sum()

NumeroFatura          0
CodigoProduto         0
NomeProduto        1454
Quantidade            0
DataVenda             0
ValorUnitario         0
IdCliente        135075
Pais                  0
dtype: int64

In [11]:
# Range de datas do período que ocorreram as vendas
# (observe que devido ao tipo de dado da coluna o resultado será incorreto)
print('Data Mínima:', dados['DataVenda'].min())
print('Data Máxima:', dados['DataVenda'].max())

Data Mínima: 1/10/2011 10:04
Data Máxima: 9/9/2011 9:52


In [12]:
# Converte a coluna de data para o tipo data
dados.DataVenda = pd.to_datetime(dados.DataVenda)

In [13]:
# Tipos de dados
dados.dtypes

NumeroFatura             object
CodigoProduto            object
NomeProduto              object
Quantidade                int64
DataVenda        datetime64[ns]
ValorUnitario           float64
IdCliente               float64
Pais                     object
dtype: object

In [14]:
# Range de datas do período que ocorreram as vendas, agora sim com tipo de dado correto
print('Data Mínima:', dados['DataVenda'].min())
print('Data Máxima:', dados['DataVenda'].max())

Data Mínima: 2010-12-01 08:26:00
Data Máxima: 2011-12-09 12:50:00


In [15]:
# Países para os quais ocorreram vendas
dados['Pais'].unique()

array(['Brasil', 'Uruguai', 'Australia', 'Holanda', 'Alemanha', 'Noruega',
       'Irlanda', 'Espanha', 'Poland', 'Portugal', 'Italy', 'Belgium',
       'Lithuania', 'Japan', 'Iceland', 'Channel Islands', 'Dinamarca',
       'Cyprus', 'Sweden', 'Austria', 'Israel', 'Finland', 'Bahrain',
       'Greece', 'Hong Kong', 'Cingapura', 'Iraque', 'Equador',
       'Saudi Arabia', 'Czech Republic', 'Canada', 'China', 'Inglaterra',
       'USA', 'Chile', 'Malta', 'Paraguai'], dtype=object)

### Indicador 1 - Faturamento Mensal

Faturamento = Quantidade * Valor_Unitario

In [16]:
# Extrai o mês da fatura
dados['AnoMes'] = dados['DataVenda'].map(lambda date: 100 * date.year + date.month)

In [17]:
# Visualiza os dados
dados.head()

Unnamed: 0,NumeroFatura,CodigoProduto,NomeProduto,Quantidade,DataVenda,ValorUnitario,IdCliente,Pais,AnoMes
0,536365,21730,GLASS STAR FROSTED T-LIGHT HOLDER,6,2010-12-01 08:26:00,4.25,17850.0,Brasil,201012
1,536365,85123A,WHITE HANGING HEART T-LIGHT HOLDER,6,2010-12-01 08:26:00,2.55,17850.0,Brasil,201012
2,536365,71053,WHITE METAL LANTERN,6,2010-12-01 08:26:00,3.39,17850.0,Brasil,201012
3,536365,84406B,CREAM CUPID HEARTS COAT HANGER,8,2010-12-01 08:26:00,2.75,17850.0,Brasil,201012
4,536365,84029G,KNITTED UNION FLAG HOT WATER BOTTLE,6,2010-12-01 08:26:00,3.39,17850.0,Brasil,201012


In [18]:
# Calcula o faturamento
dados["Faturamento"] = dados["Quantidade"] * dados["ValorUnitario"]

In [19]:
# Visualiza os dados
dados.head()

Unnamed: 0,NumeroFatura,CodigoProduto,NomeProduto,Quantidade,DataVenda,ValorUnitario,IdCliente,Pais,AnoMes,Faturamento
0,536365,21730,GLASS STAR FROSTED T-LIGHT HOLDER,6,2010-12-01 08:26:00,4.25,17850.0,Brasil,201012,25.5
1,536365,85123A,WHITE HANGING HEART T-LIGHT HOLDER,6,2010-12-01 08:26:00,2.55,17850.0,Brasil,201012,15.3
2,536365,71053,WHITE METAL LANTERN,6,2010-12-01 08:26:00,3.39,17850.0,Brasil,201012,20.34
3,536365,84406B,CREAM CUPID HEARTS COAT HANGER,8,2010-12-01 08:26:00,2.75,17850.0,Brasil,201012,22.0
4,536365,84029G,KNITTED UNION FLAG HOT WATER BOTTLE,6,2010-12-01 08:26:00,3.39,17850.0,Brasil,201012,20.34


In [20]:
# Agrupa o faturamento por mês/ano
df_faturamento = dados.groupby(['AnoMes']).agg({'Faturamento': sum}).reset_index()

In [21]:
# Tabela de dados
df_faturamento

Unnamed: 0,AnoMes,Faturamento
0,201012,748957.02
1,201101,560000.26
2,201102,498062.65
3,201103,683267.08
4,201104,493207.121
5,201105,723333.51
6,201106,691123.12
7,201107,681300.111
8,201108,682680.51
9,201109,1019687.622


### Visualização do Indicador 1

In [22]:
# Plot
fig = go.Figure()
# Definição dos dados no plot
fig.add_trace(go.Scatter(x = df_faturamento['AnoMes'],
                        y = df_faturamento['Faturamento'],))

# Layout
fig.update_layout(xaxis = {"type": "category"},
                        title = 'Faturamento Mensal')

# Plot da figura
fig.show()

### Indicador 2 - Taxa Percentual de Crescimento Mensal

Taxa Percentual de Crescimento Mensal = Faturamento Mensal / Faturamento Mensal Anterior * 100

In [23]:
# Usamos a função pct_change() para calcular a variação percentual mensal
df_faturamento['CrescimentoMensal'] = df_faturamento['Faturamento'].pct_change()

In [24]:
# Tabela de dados
df_faturamento

Unnamed: 0,AnoMes,Faturamento,CrescimentoMensal
0,201012,748957.02,
1,201101,560000.26,-0.252293
2,201102,498062.65,-0.110603
3,201103,683267.08,0.37185
4,201104,493207.121,-0.278163
5,201105,723333.51,0.466592
6,201106,691123.12,-0.04453
7,201107,681300.111,-0.014213
8,201108,682680.51,0.002026
9,201109,1019687.622,0.493653


### Visualização do Indicador 2

In [67]:
# Plot
fig = go.Figure()
# Definição dos dados no plot (filtramos o mês 12 de 2011 pois não temos dados suficientes)
fig.add_trace(go.Scatter(x = df_faturamento.query("AnoMes < 201112")['AnoMes'],
                        y = df_faturamento.query("AnoMes < 201112")['CrescimentoMensal'],))

# Layout
fig.update_layout(xaxis = {"type": "category"},
                        title = 'Taxa Percentual de Crescimento Mensal')

# Plot da figura

fig.show()

### Indicador 3 - Clientes Ativos Por Mês em um País (Brasil)

Clientes ativos são aqueles que fizeram pelo menos uma compra em cada mês.

In [26]:
# Cria um dataframe somente com dados do Brasil
dados_brasil = dados.query("Pais=='Brasil'").reset_index(drop = True)

In [27]:
# Usuários ativos são aqueles que fizeram pelo menos uma compra
df_ativos_mes = dados_brasil.groupby('AnoMes')['IdCliente'].nunique().reset_index()

In [28]:
# Dados
df_ativos_mes

Unnamed: 0,AnoMes,IdCliente
0,201012,871
1,201101,684
2,201102,714
3,201103,923
4,201104,817
5,201105,985
6,201106,943
7,201107,899
8,201108,867
9,201109,1177


### Visualização do Indicador 3

In [68]:
# Plot
fig = go.Figure()
# Definição dos dados no plot
fig.add_trace(go.Bar(x = df_ativos_mes['AnoMes'],
                    y = df_ativos_mes['IdCliente'],))

# Layout
fig.update_layout(xaxis = {"type": "category"},
                        title = 'Clientes Ativos Por Mês em um País (Brasil)')

# Plot da figura

fig.show()

### Indicador 4 - Total de Itens Comprados Por Mês em um País (Brasil)

Total de itens comprados por mês.

In [30]:
# Agrupa os dados para calcular o total de itens comprados por mês no Brasil
df_itens_mes = dados_brasil.groupby('AnoMes')['Quantidade'].sum().reset_index()

In [31]:
# Dados
df_itens_mes

Unnamed: 0,AnoMes,Quantidade
0,201012,298101
1,201101,237381
2,201102,225641
3,201103,279843
4,201104,257666
5,201105,306452
6,201106,258522
7,201107,324129
8,201108,319804
9,201109,458490


### Visualização do Indicador 4

In [69]:
# Plot
fig = go.Figure()
# Definição dos dados no plot
fig.add_trace(go.Bar(x = df_itens_mes['AnoMes'],
                    y = df_itens_mes['Quantidade'],))

# Layout
fig.update_layout(xaxis = {"type": "category"},
                        title = 'Total de Itens Comprados Por Mês em um País (Brasil)')

# Plot da figura

fig.show()

### Indicador 5 - Faturamento Médio Mensal em um País (Brasil)

Faturamento médio por mês em um país.

In [33]:
# Calcula o faturamento médio
df_faturamento_medio = dados_brasil.groupby('AnoMes')['Faturamento'].mean().reset_index()

In [34]:
# Dados
df_faturamento_medio

Unnamed: 0,AnoMes,Faturamento
0,201012,16.86586
1,201101,13.61468
2,201102,16.093027
3,201103,16.716166
4,201104,15.77338
5,201105,17.713823
6,201106,16.714748
7,201107,15.723497
8,201108,17.315899
9,201109,18.931723


### Visualização do Indicador 5

In [70]:
# Plot
fig = go.Figure()
# Definição dos dados no plot
fig.add_trace(go.Bar(x = df_faturamento_medio['AnoMes'],
                    y = df_faturamento_medio['Faturamento'],))

# Layout
fig.update_layout(xaxis = {"type": "category"},
                        title = 'Faturamento Médio Mensal em um País (Brasil)')

# Plot da figura

fig.show()

In [36]:
# Calcula o faturamento total por mês
df_faturamento_total = dados_brasil.groupby('AnoMes')['Faturamento'].sum().reset_index()

In [37]:
# Dados
df_faturamento_total

Unnamed: 0,AnoMes,Faturamento
0,201012,676742.62
1,201101,434308.3
2,201102,408247.91
3,201103,559707.39
4,201104,442254.041
5,201105,596459.86
6,201106,554478.35
7,201107,565479.841
8,201108,539130.5
9,201109,862018.152


In [71]:
# Plot
fig = go.Figure()
# Definição dos dados no plot
fig.add_trace(go.Bar(x = df_faturamento_total['AnoMes'],
                    y = df_faturamento_total['Faturamento'],))

# Layout
fig.update_layout(xaxis = {"type": "category"},
                        title = 'Faturamento Total Mensal em um País (Brasil)')

# Plot da figura

fig.show()

### Indicador 6 - Diferença de Faturamento ao Longo do Tempo Entre Clientes Novos e Antigos

Para calcular esse indicador precisaremos de um pouco mais de criatividade. O que é um cliente novo ou antigo?

Vamos considerar cliente novo aquele com baixo volume de compras e cliente antigo aquele com alto volume de compras.

In [39]:
# Vamos encontrar a data de menor volume de compras de cada cliente
df_compra_minima = dados.groupby('IdCliente')["DataVenda"].min().reset_index()

In [40]:
# Ajustamos os nomes das colunas
df_compra_minima.columns = ['IdCliente', 'Data_Menor_Compra']

In [41]:
# Vamos extrair o mês em que ocorreu o menor volume de compras de cada cliente
df_compra_minima['Mes_Menor_Compra_Mensal'] = df_compra_minima['Data_Menor_Compra'].map(lambda date: 100 * date.year + date.month)


In [42]:
# Dados
df_compra_minima.head()

Unnamed: 0,IdCliente,Data_Menor_Compra,Mes_Menor_Compra_Mensal
0,12346.0,2011-01-18 10:01:00,201101
1,12347.0,2010-12-07 14:57:00,201012
2,12348.0,2010-12-16 19:09:00,201012
3,12349.0,2011-11-21 09:51:00,201111
4,12350.0,2011-02-02 16:01:00,201102


In [43]:
# Vamos fazer um merge entre o dataset original e o dataset de volume de compras
dados_compras = pd.merge(dados, df_compra_minima, on = "IdCliente")
dados_compras.head()

Unnamed: 0,NumeroFatura,CodigoProduto,NomeProduto,Quantidade,DataVenda,ValorUnitario,IdCliente,Pais,AnoMes,Faturamento,Data_Menor_Compra,Mes_Menor_Compra_Mensal
0,536365,21730,GLASS STAR FROSTED T-LIGHT HOLDER,6,2010-12-01 08:26:00,4.25,17850.0,Brasil,201012,25.5,2010-12-01 08:26:00,201012
1,536365,85123A,WHITE HANGING HEART T-LIGHT HOLDER,6,2010-12-01 08:26:00,2.55,17850.0,Brasil,201012,15.3,2010-12-01 08:26:00,201012
2,536365,71053,WHITE METAL LANTERN,6,2010-12-01 08:26:00,3.39,17850.0,Brasil,201012,20.34,2010-12-01 08:26:00,201012
3,536365,84406B,CREAM CUPID HEARTS COAT HANGER,8,2010-12-01 08:26:00,2.75,17850.0,Brasil,201012,22.0,2010-12-01 08:26:00,201012
4,536365,84029G,KNITTED UNION FLAG HOT WATER BOTTLE,6,2010-12-01 08:26:00,3.39,17850.0,Brasil,201012,20.34,2010-12-01 08:26:00,201012


In [44]:
# Vamos criar uma nova coluna de tipo de usuário e preencher como Novo
dados_compras['TipoUsuario'] = 'Novo'

In [45]:
# Dados
dados_compras['TipoUsuario'].value_counts()

TipoUsuario
Novo    406725
Name: count, dtype: int64

In [46]:
# Dados
dados_compras.head()

Unnamed: 0,NumeroFatura,CodigoProduto,NomeProduto,Quantidade,DataVenda,ValorUnitario,IdCliente,Pais,AnoMes,Faturamento,Data_Menor_Compra,Mes_Menor_Compra_Mensal,TipoUsuario
0,536365,21730,GLASS STAR FROSTED T-LIGHT HOLDER,6,2010-12-01 08:26:00,4.25,17850.0,Brasil,201012,25.5,2010-12-01 08:26:00,201012,Novo
1,536365,85123A,WHITE HANGING HEART T-LIGHT HOLDER,6,2010-12-01 08:26:00,2.55,17850.0,Brasil,201012,15.3,2010-12-01 08:26:00,201012,Novo
2,536365,71053,WHITE METAL LANTERN,6,2010-12-01 08:26:00,3.39,17850.0,Brasil,201012,20.34,2010-12-01 08:26:00,201012,Novo
3,536365,84406B,CREAM CUPID HEARTS COAT HANGER,8,2010-12-01 08:26:00,2.75,17850.0,Brasil,201012,22.0,2010-12-01 08:26:00,201012,Novo
4,536365,84029G,KNITTED UNION FLAG HOT WATER BOTTLE,6,2010-12-01 08:26:00,3.39,17850.0,Brasil,201012,20.34,2010-12-01 08:26:00,201012,Novo


In [47]:
# Um cliente antigo é aquele cujo volume de compras no mês é maior que o volume mínimo
# Se for verdadeiro, mudamos a coluna TipoUsuario para "Antigo" e se não, mantemos como "Novo"
dados_compras.loc[dados_compras['AnoMes'] > dados_compras['Mes_Menor_Compra_Mensal'], 'TipoUsuario'] = 'Antigo'

In [48]:
# Dados
dados_compras['TipoUsuario'].value_counts()

TipoUsuario
Antigo    287549
Novo      119176
Name: count, dtype: int64

In [49]:
# Agora calculamos o faturamento por tipo de usuário por mês
df_faturamento_user_mes = dados_compras.groupby(['AnoMes', 'TipoUsuario'])['Faturamento'].sum().reset_index()

In [50]:
# Removemos o mês 12 de 2011 pois não temos dados suficientes
df_faturamento_user_mes = df_faturamento_user_mes.query("AnoMes != 201012 and AnoMes != 201112")

In [51]:
# Dados
df_faturamento_user_mes

Unnamed: 0,AnoMes,TipoUsuario,Faturamento
1,201101,Antigo,271616.52
2,201101,Novo,203457.86
3,201102,Antigo,287024.77
4,201102,Novo,149521.38
5,201103,Antigo,390034.53
6,201103,Novo,189930.08
7,201104,Antigo,306283.6
8,201104,Novo,119764.251
9,201105,Antigo,532392.34
10,201105,Novo,115858.74


### Visualização do Indicador 6

In [74]:
# Plot
fig = go.Figure()
# Definição dos dados no plot
fig.add_trace(go.Scatter(x = df_faturamento_user_mes.query("TipoUsuario == 'Antigo'")['AnoMes'],
                        y = df_faturamento_user_mes.query("TipoUsuario == 'Antigo'")['Faturamento'],
                        name = 'Cliente Antigo'))
fig.add_trace(go.Scatter(x = df_faturamento_user_mes.query("TipoUsuario == 'Novo'")['AnoMes'],
                        y = df_faturamento_user_mes.query("TipoUsuario == 'Novo'")['Faturamento'],
                        name = 'Cliente Novo'))

# Layout
fig.update_layout(xaxis = {"type": "category"},
                        title = 'Diferença de Faturamento ao Longo do Tempo Entre Clientes Novos e Antigos')

# Plot da figura

fig.show()

### Indicador 7 - Taxa de Novos Clientes

Como definimos clientes novos e antigos no indicador 6, agora podemos usar os dados e calcular a proporção de novos clientes ao longo do tempo.

In [53]:
# Calcula a taxa de novos clientes
df_taxa_novos_clientes = dados_compras.query("TipoUsuario == 'Novo'").groupby(['AnoMes'])['IdCliente'].nunique() / dados_compras.query("TipoUsuario == 'Antigo'").groupby(['AnoMes'])['IdCliente'].nunique()


In [54]:
# Ajustamos índice e removemos valores ausentes
df_taxa_novos_clientes = df_taxa_novos_clientes.reset_index()
df_taxa_novos_clientes = df_taxa_novos_clientes.dropna()

In [55]:
# Dados
df_taxa_novos_clientes

Unnamed: 0,AnoMes,IdCliente
1,201101,1.162983
2,201102,0.909091
3,201103,0.758621
4,201104,0.498333
5,201105,0.34875
6,201106,0.28799
7,201107,0.238155
8,201108,0.205412
9,201109,0.296813
10,201110,0.328052


### Visualização do Indicador 7

In [75]:
# Plot
fig = go.Figure()
# Definição dos dados no plot
fig.add_trace(go.Bar(x = df_taxa_novos_clientes.query("AnoMes > 201101 and AnoMes < 201112")['AnoMes'],
                    y = df_taxa_novos_clientes.query("AnoMes > 201101 and AnoMes < 201112")['IdCliente'],))

# Layout
fig.update_layout(xaxis = {"type": "category"},
                        title = 'Taxa de Novos Clientes')

# Plot da figura

fig.show()

### Indicador 8 - Taxa Mensal de Retenção de Clientes

Taxa Mensal de Retenção de Clientes  = Clientes do Mês Anterior / Total de Clientes Ativos

In [57]:
# Agrupamos os dados por cliente e mês e somamos o faturamento
dados_compras_clientes = dados_compras.groupby(['IdCliente', 'AnoMes'])['Faturamento'].sum().reset_index()

In [58]:
# Dados
dados_compras_clientes.head()

Unnamed: 0,IdCliente,AnoMes,Faturamento
0,12346.0,201101,0.0
1,12347.0,201012,711.79
2,12347.0,201101,475.39
3,12347.0,201104,636.25
4,12347.0,201106,382.52


In [59]:
# Agora definimos a retenção com uma tabela cruzada
df_ret = pd.crosstab(dados_compras_clientes['IdCliente'], dados_compras_clientes['AnoMes']).reset_index()

In [60]:
# Dados
df_ret.head()

AnoMes,IdCliente,201012,201101,201102,201103,201104,201105,201106,201107,201108,201109,201110,201111,201112
0,12346.0,0,1,0,0,0,0,0,0,0,0,0,0,0
1,12347.0,1,1,0,0,1,0,1,0,1,0,1,0,1
2,12348.0,1,1,0,0,1,0,0,0,0,1,0,0,0
3,12349.0,0,0,0,0,0,0,0,0,0,0,0,1,0
4,12350.0,0,0,1,0,0,0,0,0,0,0,0,0,0


In [61]:
# Extraímos os meses
meses = df_ret.columns[2:]
meses

Index([201101, 201102, 201103, 201104, 201105, 201106, 201107, 201108, 201109,
       201110, 201111, 201112],
      dtype='object', name='AnoMes')

In [62]:
# O loop abaixo vai calcular a retenção ao longo dos meses

# Lista para gravar o resulatdo
lista_ret = []

# Loop
for i in range(len(meses)-1):
    dados_retencao = {}
    mes_corrente = meses[i+1]
    mes_anterior = meses[i]
    dados_retencao['AnoMes'] = int(mes_corrente)
    dados_retencao['TotalUser'] = df_ret[mes_corrente].sum()
    dados_retencao['TotalRetido'] = df_ret[(df_ret[mes_corrente] > 0) & (df_ret[mes_anterior] > 0)][mes_corrente].sum()
    lista_ret.append(dados_retencao)

lista_ret

[{'AnoMes': 201102, 'TotalUser': 798, 'TotalRetido': 299},
 {'AnoMes': 201103, 'TotalUser': 1020, 'TotalRetido': 345},
 {'AnoMes': 201104, 'TotalUser': 899, 'TotalRetido': 346},
 {'AnoMes': 201105, 'TotalUser': 1079, 'TotalRetido': 399},
 {'AnoMes': 201106, 'TotalUser': 1051, 'TotalRetido': 464},
 {'AnoMes': 201107, 'TotalUser': 993, 'TotalRetido': 415},
 {'AnoMes': 201108, 'TotalUser': 980, 'TotalRetido': 433},
 {'AnoMes': 201109, 'TotalUser': 1302, 'TotalRetido': 465},
 {'AnoMes': 201110, 'TotalUser': 1425, 'TotalRetido': 552},
 {'AnoMes': 201111, 'TotalUser': 1711, 'TotalRetido': 690},
 {'AnoMes': 201112, 'TotalUser': 683, 'TotalRetido': 440}]

In [63]:
# Dados
df_ret_final = pd.DataFrame(lista_ret)
df_ret_final.head()

Unnamed: 0,AnoMes,TotalUser,TotalRetido
0,201102,798,299
1,201103,1020,345
2,201104,899,346
3,201105,1079,399
4,201106,1051,464


Agora calculamos a proporção para encontrar o indicador.

In [64]:
# Calculamos o indicador
df_ret_final['TaxaRetencao'] = df_ret_final['TotalRetido'] / df_ret_final['TotalUser']
df_ret_final

Unnamed: 0,AnoMes,TotalUser,TotalRetido,TaxaRetencao
0,201102,798,299,0.374687
1,201103,1020,345,0.338235
2,201104,899,346,0.384872
3,201105,1079,399,0.369787
4,201106,1051,464,0.441484
5,201107,993,415,0.417925
6,201108,980,433,0.441837
7,201109,1302,465,0.357143
8,201110,1425,552,0.387368
9,201111,1711,690,0.403273


### Visualização do Indicador 8

In [76]:
# Plot
fig = go.Figure()
# Definição dos dados no plot
fig.add_trace(go.Scatter(x = df_ret_final.query("AnoMes < 201112")['AnoMes'],
                        y = df_ret_final.query("AnoMes < 201112")['TaxaRetencao'],
                        name = "taxa"))

# Layout
fig.update_layout(xaxis = {"type": "category"},
                        title = 'Taxa Mensal de Retenção de Clientes')

# Plot da figura

fig.show()

# Fim