# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

In [None]:
# Importe de bibliotecas
import pandas as pd
import numpy as np
import plotly.express as px

In [None]:
# Carregamento de dados
tabela = pd.read_csv('data/cancelamentos.csv')

# Limpando a tabela
tabela = tabela.drop(columns="CustomerID")
tabela

In [None]:
# Verificando qualidade dos dados
display(tabela.info())
tabela = tabela.dropna()
display(tabela.info())

In [None]:
# Análise inicial dos dados
# Quantos cancelamentos temos na base de dados?
display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))

In [None]:
# Análise a causa dos cancelamentos dos clientes
for coluna in tabela.columns:
    grafico = px.histogram(tabela,x=coluna,color="cancelou",text_auto=True)
    grafico.show()

In [None]:
# Filtrando dados inconsistentes
condicao = tabela["ligacoes_callcenter"] <= 4
tabela = tabela[condicao]

condicao = tabela["dias_atraso"] <= 20
tabela = tabela[condicao]

condicao = tabela["duracao_contrato"] != "Monthly"
tabela = tabela[condicao]

display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))