# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
#Passo 1: Importar a base de dados
import pandas as pd

tabela = pd.read_csv('cancelamentos.csv')
display(tabela)

In [None]:
#Passo 2: Analisar e tratar a base de dados
tabela = tabela.drop(columns='CustomerID')
tabela = tabela.dropna()
display(tabela.info())


In [None]:
#Passo 3: Aplicar filtros para verificar o cancelamento
display(tabela['cancelou'].value_counts())
display(tabela['cancelou'].value_counts(normalize=True))

In [None]:
#Passo 4: Verificar em graficos 
import plotly.express as px
for coluna in tabela:
    grafico = px.histogram(tabela, x= coluna, color='cancelou',text_auto=True)
    grafico.show()

In [None]:
#Passo 5: Procurar maiores falhas e aplicar filtro para resolver

 #Todos os contratos MENSAIS cancelaram
tabela = tabela[tabela['duracao_contrato']!= 'Monthly']
 #Todos que atrasaram mais de 20 dias cancelaram
tabela = tabela[tabela['dias_atraso']<=20]
 #Todos que gastaram menos que 500 cancelaram
tabela = tabela[tabela['total_gasto']>=500]
 #Todos que ligaram mais que 5 vezes cancelaram
tabela = tabela[tabela['ligacoes_callcenter']<=5]

display(tabela['cancelou'].value_counts(normalize=True).map('{:.1%}'.format))
#Apos resolver alguns problemas, é verificado que conseguimos diminuir drasticamente o numero de cancelamentos
#Feito por: Erik Souza