# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo a Passo do projeto:

# Passo 1: Importar a base de dados
import pandas as pd
tabela = pd.read_csv("cancelamentos.csv")

# Passo 2: Visualizar a base de dados
    
tabela = tabela.drop(columns="CustomerID")
display(tabela)
# Colunas inúteis - informações que não te ajudam, te atrapalham



In [None]:
# Passo 3: Tratamento de Dados - Corrigir os erros da base de dados
# valores vazios na base de dados
# formato das informações está correto 

# valores vazios - excluir as linhas que têm valores vazios
tabela = tabela.dropna()
display(tabela.info())



In [5]:
# Passo 4: Atualizar o cancelamento dos clientes

# quantas pessoas cancelaram e quantas não cancelaram
display(tabela["duracao_contrato"].value_counts())

# em percentual
display(tabela["duracao_contrato"].value_counts(normalize=True))

duracao_contrato
Annual       354396
Quarterly    353060
Monthly      174207
Name: count, dtype: int64

In [None]:
# Passo 5: Analisar a causa de cancelamento dos cliente ()

# importar a biblioteca de graficos

import plotly.express as px


for coluna in tabela.columns:
    # criar o gráfico
    grafico = px.histogram(tabela, x=coluna, color="cancelou" )

    # exibir o gráfico
    grafico.show()

In [10]:
# clientes do contrato mensal TODOS cancelam
    # ofercer desconto nos planos anuais e trimestrais
# clientes que ligam mais do que 4 vezes para o call center, cancelam
    # criar um processo para resolver o problema do cliente em no máximo 3 ligações
# clientes que atrasaram mais de 20 dias, cancelaram
    # política de resolver atrasos em até 10 dias (equipe financeira)

tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
tabela = tabela[tabela["ligacoes_callcenter"]<=4]
tabela = tabela[tabela["dias_atraso"]<=20]

display(tabela["cancelou"].value_counts())
# em percentual
display(tabela["cancelou"].value_counts(normalize=True))

cancelou
0.0    379032
1.0     85448
Name: count, dtype: int64

cancelou
0.0    0.816035
1.0    0.183965
Name: proportion, dtype: float64