# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.


In [1]:
# Passo a passo do projeto
# Passo 1: Importar a base de dados de clientes
# Passo 2: Visualizar a base de dados
# Passo 3: Corrigir os erros da base de dados 
# Passo 4: Análise dos cancelamentos
# Passo 5: Análise da causa de cancelamento
# !pip install pandas numpy openpyxl nbformat ipykernel plotly

In [2]:
# Passo 1: Importar a base de dados de clientes
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")

#Passo 2: Visualizar a base de dados
tabela = tabela.drop(columns="CustomerID")
display(tabela)

In [3]:
# Passo 3: Corrigir os erros da base de dados 
display(tabela.info())
tabela = tabela.dropna()
display(tabela.info())

In [4]:
# Passo 4: Análise dos cancelamentos

display(tabela["cancelou"].value_counts())

display(tabela["cancelou"].value_counts(normalize=True))

display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [5]:
# Passo 5: Análise da causa de cancelamento 
import plotly.express as px

for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")

    grafico.show()

In [6]:
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]

tabela = tabela[tabela["ligacoes_callcenter"]<=4]

tabela = tabela[tabela["dias_atraso"]<=20]

display(tabela["cancelou"].value_counts(normalize=True))