# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [56]:
# Step 1 - Importing the data base
import pandas
tabela = pandas.read_csv("cancelamentos.csv")

In [None]:
# Step 2- Visualization of the data base
display(tabela)

In [None]:
# Step 3- Data Cleaning - error handling
# 3.1. - Null Values
tabela = tabela.dropna()
# 3.2. - Unnecessary columns
tabela = tabela.drop("CustomerID",axis=1)
#
display(tabela.info())

In [None]:
# Step 4 - Starting the data analysis
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))
display(tabela["duracao_contrato"].value_counts(normalize=True).map("{:.1%}".format))
display(tabela.groupby("duracao_contrato").count())
# display(tabela.groupby("duracao_contrato").mean())
# display(tabela.groupby("assinatura").mean())

In [None]:
import plotly.express as px
# for column in tabela.columns:
#   graphic = px.histogram(tabela, x=column,color="cancelou")
#   graphic.show()

# 4.1. Main reasons for cancellations
# a. 100% of monthly contract customers cancelled the subscription
graphic = px.histogram(tabela, x="duracao_contrato",color="cancelou")
graphic.show()

# b. 100% of the customers with 50+ cancelled the subscription
graphic = px.histogram(tabela, x="idade",color="cancelou")
graphic.show()

# c. 100% of the customers that called more than 5x, cancelled the subscription
graphic = px.histogram(tabela, x="ligacoes_callcenter",color="cancelou")
graphic.show()

# d. 100% of the customers who are overdue for more than 20 days cancelled their subscription
graphic = px.histogram(tabela, x="dias_atraso",color="cancelou")
graphic.show()

In [57]:
# Step 5 - Proposed solutions
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

# a. Excluding monthly subscriptions, cancellations drop from 56% to 46% 
# Exclude monthly payment or deesconto para 
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

# b. acompanhamento dos clientes com mais de 50 anos, 
# entender quais os problemas que mais levam ao cancelamento
tabela = tabela[tabela["idade"]<50]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

# c. acomapanhamento dos clientes que estao ligando para o callcenter
# recuperar clientes, impedindo que ele ligue mais de 5x, 
# melhorar equipe de atuação nos problemas do call center
tabela = tabela[tabela["ligacoes_callcenter"]<5]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

# d. acompanhamento para os clientes nunca passarem os 20 dias atraso, 
# forma de pagamento facilitada, contato com eles
tabela = tabela[tabela["dias_atraso"]<=20]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

#a

cancelou
1.0    56.7%
0.0    43.3%
Name: proportion, dtype: object

cancelou
0.0    53.9%
1.0    46.1%
Name: proportion, dtype: object

cancelou
0.0    63.3%
1.0    36.7%
Name: proportion, dtype: object

cancelou
0.0    81.2%
1.0    18.8%
Name: proportion, dtype: object

cancelou
0.0    87.8%
1.0    12.2%
Name: proportion, dtype: object

In [None]:
# Após todas essas mudanças, o % de cancelamento cai de 56 para 12