# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
#Passo 1 = Abrir a tabela proposta no case dentro do Python.
#Passo 2 = Vizualizar a tabela.

import pandas as pd 

tabela = pd.read_csv('cancelamentos_sample.csv')

#Passo 3 = Eliminar todas as colunas inúteis para a Análise de dados.
tabela = tabela.drop('CustomerID', axis=1)

display(tabela)

In [None]:
#Passo 4 = Eliminar as linhas vazias/não preenchidas da tabela de dados.
display(tabela.info())
tabela = (tabela.dropna())
display(tabela.info())

In [None]:
#Passo 5 = Contar o número de pessoas que cancelaram a assinatura da empresa.
display(tabela['cancelou'].value_counts())
display(tabela['cancelou'].value_counts(normalize=True))
display(tabela['cancelou'].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
#Passo 6 = Identificar quais colunas mais impactam no cancelamento.
#!pip install plotly

import plotly.express as px

for coluna in tabela.columns:
#criar o gráfico
    grafico = px.histogram(tabela, x=coluna, color='cancelou')
#exibir o gráfico
    grafico.show()


In [None]:
#Transformar a análise em melhora para evitar cancelamentos futuros.
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
tabela = tabela[tabela["ligacoes_callcenter"]<5]
tabela = tabela[tabela["dias_atraso"]<=20]
display(tabela)
display(tabela['cancelou'].value_counts())
display(tabela['cancelou'].value_counts(normalize=True))
display(tabela['cancelou'].value_counts(normalize=True).map("{:.1%}".format))