# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link



In [None]:
# Passo a passo
# Passo 1: Importar base de dados
# Passo 2: Visualizar base de dados
# Passo 3: Corrigir cagadas da base de dados
# Passo 4: Análise dos cancelamentos
# Passo 5: Análise da causa dos cancelamentos (como as colunas impactam no cancelamento?)
# Passo a passo do projeto
# Passo 1: Importar a base de dados
#!pip install pandas numpy openpyxl nbformat ipykernel plotly


In [None]:
# Passo 1: Importar base de dados

import pandas as pd

# Passo 2: Visualizar base de dados
tabela = pd.read_csv("cancelamentos.csv")

#colunas inutis - informações que nao me ajudam e so me atrapalham apagando coluna CustomerID
tabela = tabela.drop(columns="CustomerID")

display(tabela)

In [None]:
# Passo 3: Corrigir cagadas da base de dados
display(tabela.info())
#Corrigindo valores vazios
#Excluindo linhas vazios
tabela = tabela.dropna()
display(tabela.info())



In [None]:
# Passo 4: Análise inicial dos cancelamentos

# quantas pessoas cancelaram e quantas não cancelaram
display(tabela["cancelou"].value_counts())

# em percentual
display(tabela["cancelou"].value_counts(normalize=True))

In [None]:
# Passo 5: Análise das causas dos cancelamentos (como as colunas da base impactam no cancelamento)
# gráficos/dashboards

import plotly.express as px

#para cada coluna da minha tabela
for coluna in tabela.columns:
  #criar o grafico
  grafico = px.histogram(tabela,x=coluna,color="cancelou")
  #exibir o grafico
  grafico.show()


In [None]:
# analise das causas dos cancelamentos

# se um cliente ligar mais de 4x para o call center ele vai cancelar
  #criar um processo que

# se um cliente atrasar o pagamento masi de 20 dias ele vai cancelar o plano 

# todos os clientes do contrato mensal cancelaram
# para filtrar uma tabela é tabela = tabela[condição]

#condicao
#tabela["duracao_contrato"]!="Monthly"
#tabela["ligacoes_callcenter"]<=4
#tabela["dias_atrasos"]<=20

tabela = tabela[tabela["duracao_contrato"]!="Monthly"] #sem duração do contrato mensal

tabela = tabela[tabela["ligacoes_callcenter"]<=4] #sem ligação do call center acima de 4x

tabela = tabela[tabela["dias_atraso"]<=20] #sem atraso  de pagamento maior do que 20x 


display(tabela["cancelou"].value_counts(normalize=True))