# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.


In [None]:
# Passoa a passo
# 1. Importar a base de dados

import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")

# Passo 2: Visualizar a base de dados

display(tabela)

In [None]:
# Passo 3: Tratamento de dados
# - Valores que estão vazios

tabela = tabela.dropna() # Apaga as colunas vazias
display(tabela)

# - Valores que estão incorretos
# - Valores que não ajudam atrapalham

tabela = tabela.drop("CustomerID", axis=1) # Apaga a coluna inteira
display(tabela)




In [None]:
# Passo 4: Análise inicial dos dados

# # então descobrimos que contrato mensal é ruim, vamos tirar ele e continuar analisando
# tabela = tabela[tabela["duracao_contrato"]!="Monthly"]

display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format)) # Mostra a porcentagem de cancelamentos


display(tabela["duracao_contrato"].value_counts(normalize=True).map("{:.1%}".format)) # Mostra a porcentagem de cancelamentos por duração de contrato


display(tabela.groupby("duracao_contrato").mean(numeric_only=True)) # Mostra a média de cancelamentos por duração de contrato
display(tabela.groupby("assinatura").mean(numeric_only=True)) # Mostra a média de cancelamentos por assinatura 




In [None]:
# Passo 5: Análise mais completa
import plotly.express as px


display(tabela)

# grafico = px.histogram(tabela, x="assinatura", color="cancelou")
# grafico.show()

grafico = px.histogram(tabela, x="assinatura", color="cancelou")
grafico.show()


for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
    grafico.show()



In [None]:
#RESULTADOS
# 1. Quanto mais tempo de contrato, menor a taxa de cancelamento ; Mensal precisa ser diminuido
# 2. Dias de atraso maiores que 20 geram mais cancelamentos ; Atrasos precisam ser diminuidos
# 3. Ligações no call center maiores que 5 geram mais cancelamentos ; Ligações precisam ser diminuidas

In [None]:
display(tabela)

In [None]:
tabela = tabela[tabela["duracao_contrato"] != "Monthly"]
tabela = tabela[tabela["dias_atraso"] < 20]
tabela = tabela[tabela["ligacoes_callcenter"] < 5]
display(tabela)

In [None]:
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format)) # Mostra a porcentagem de cancelamentos

# Passo 6: Conclusão
# Reduzimos a porcentagem de cancelamentos de 56,7% para 18,4%