# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

1. passo 1: importar base de dados
2. passo 2: vizualizar a base de dados
  . entender quais informaçoes eu tenho disponivel
  . procurar problemas da base de dados
3. passo 3: corrigir os problemas
4. passo 4: analise dos cancelamentos(quantos cancelaram, quantos nao e %)]
5. passo 5: analise das causas dos cancelamentos dos clientes



In [None]:
# passo 1: importar base de dados
#!pip install pandas numpy openpyxl nbformat ipykernel plotly
import pandas as pd

tabela = pd.read_csv('cancelamentos.csv')


# passo 2: vizualizar a base de dados
  # entender quais informaçoes eu tenho disponivel
  # procurar problemas da base de dados

# colunas inuteis - informação que não te ajuda, te atrapalha
tabela = tabela.drop(columns="CustomerID")
display(tabela)


In [None]:
# passo 3: corrigir os problemas

# informaçoes vazias ou no formato errado
tabela = tabela.dropna() # NaN - informação vazia
# tabela = tabela.drop_duplicates()
display(tabela.info())

In [None]:
# passo 4: analise dos cancelamentos(quantos cancelaram, quantos nao e %)
display(tabela["cancelou"].value_counts())

#em percentual = normalizado
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
# passo 5: analise das causas dos cancelamentos dos clientes
import plotly.express as px 

#cria o grafico
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)
    grafico.show()
    


In [None]:
# clientes do contrato mensal TODOS cancelam
    # ofercer desconto nos planos anuais e trimestrais
# clientes que ligam mais do que 4 vezes para o call center, cancelam
    # criar um processo para resolver o problema do cliente em no máximo 3 ligações
# clientes que atrasaram mais de 20 dias, cancelaram
    # política de resolver atrasos em até 10 dias (equipe financeira)

tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
tabela = tabela[tabela["ligacoes_callcenter"]<=4]
tabela = tabela[tabela["dias_atraso"]<=20]

display(tabela["cancelou"].value_counts())
# em percentual
display(tabela["cancelou"].value_counts(normalize=True))