# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
#!pip install pandas openpyxl numpy nbformat plotly ipykernel
# pandas -> trabalha com base de dados
# plotly -> Criar graficos dinâmicos

# Passo a passo
# Passo 1: Importar a base de dados
import pandas

tabela = pandas.read_csv("cancelamentos.csv")

In [None]:
# Passo 2: Visualizar a base de dados (Entender as informações e encontrar problemas)
# Informações inúteis
tabela = tabela.drop(columns="CustomerID") # Retirar coluna de ID do cliente 
display(tabela)

In [None]:
# Passo 3: Resolver os problemas da base de dados
# Informações no formato errado
display(tabela.info())
# Informações vazias
tabela = tabela.dropna()
display(tabela.info())

In [None]:
# Passo 4: Análise Inicial(Quantos clientes cancelaram, qual o % de clientes)
# Contar na coluna de cancelamento quantos cancelaram 
display(tabela["cancelou"].value_counts())
# Em percentual
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))



In [None]:
# Passo 5: Analisar a causa dos cancelamentos dos clientes
# Quero entender como cada coluna da base de dados impacta no cancelamento do cliente
# Criando graficos
import plotly.express as px
for coluna in tabela.columns:
    # Cria o grafico
    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)
    # Exiba o grafico 
    grafico.show()

In [None]:
"""
*Clientes que ligaram mais de 4 vezes para o callcenter, cancelam
    -Vamos criar uma alerta para quando o cliente estiver ligando pela 3º vez.

*Todos os clientes mensais cancelaram
    -Vamos incentivar os clientes mensais a migrarem para outros contratos

*Todos os clientes com mais de 20 dias de atraso, cancelaram
    -Ligar um alerta para o time de cobrança quando o cliente bater 10 dias de atraso

    # Uma vez resolvido esses problemas, observar como a taxa de cancelamento se comporta.
"""

In [None]:
#Resolvendo o problema do callcenter - O que acontece?
condicao = tabela["ligacoes_callcenter"] <=4
tabela = tabela[condicao]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
#Resolvendo o problema de clientes mensais que cancelaram - O que acontece?
condicao = tabela["duracao_contrato"] != "Monthly"
tabela = tabela[condicao]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))


In [None]:
#Resolvendo o problema de clientes com mais de 20 dias de atraso
condicao = tabela["dias_atraso"] < 20
tabela = tabela[condicao]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))