# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo a passo do projeto

# Passo 1: Importar a base de dados
 ## instalar pandas: pip install pandas numpy openpyxl
import pandas as pd 

tabela = pd.read_csv("cancelamentos.csv")

In [None]:
# Passo 2: Visualizar a base de dados

 ## eliminar colunas inúteis ou vazias
tabela = tabela.drop(columns="CustomerID")
 ## tabela = tabela.drop(columns=["CustomerID", "idade", "sexo"])

display(tabela)

In [None]:
# Passo 3: Corrigir as cagadas da base de dados
display(tabela.info())

# eliminar linhas com valores vazios
tabela = tabela.dropna()

display(tabela.info())

In [None]:
# Passo 4: Análise inicial dos cancelamentos
 ## Quantas pessoas cancelaram e quantas não cancelaram
display(tabela["cancelou"].value_counts())
 
 ## em percentual
display(tabela["cancelou"].value_counts(normalize= True))
#display(tabela["cancelou"].value_counts(normalize= True).map("{:.1%}".format))


In [None]:
# Passo 5: Análise dos cancelamentos
 ## Gráficos/Dashboards
import plotly.express as px

for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
    grafico.show()

In [None]:
# Passo 6: Insights

 ## clientes com assinatura mensal cancelam mais
   ### Sugestão: oferecer desconto nos planos anuais e trimestrais
 ## clientes que ligam mais de 4 vezes para o call center cancelam
   ### Sugestão: criar processo para resolver o problema do cliente em no máximo 3 ligações
 ## clientes que atrasam mais de 20 dias cancelam
   ### Sugestão: criar política de resolução  de atrasos em até 10 dias (equipe financeira)

tabela = tabela[tabela["duracao_contrato"] != "Monthly"]
tabela = tabela[tabela["ligacoes_callcenter"] <= 4]
tabela = tabela[tabela["dias_atraso"] <= 20]

# valores atualizados após uso das sugestões
display(tabela["cancelou"].value_counts())
 ## em percentual
display(tabela["cancelou"].value_counts(normalize= True))