# Projeto Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

##### Passo 0 - Entender qual o problema

É importante compreender o problema apresentado para que seja possível analisar e relacionar as principais causas e motivos.

##### Passo 1 - Importar a base de dados (biblioteca Pandas)

In [None]:
import pandas as pd 
tabela = pd.read_csv("cancelamentos.csv")

##### Passo 2 - Vizualizar os dados e consultar as informações dos dados

In [None]:
display(tabela)
tabela.info()

##### Passo 3 - Tratar os dados

In [None]:
#Excluir colunas inúteis
tabela = tabela.drop(columns="CustomerID", axis=1)
display(tabela)

#Excluir os valores vazios
tabela = tabela.dropna()
tabela.info()

##### Passo 4 - Análise geral os dados

In [None]:
#Quantas pessoas cancelaram e quantas não cancelaram?
print(tabela["cancelou"].value_counts())

#Qual o percentual?
print(tabela["cancelou"].value_counts(normalize=True))

##### Passo 5 - Criar gráficos relacionando a coluna que deseja analisar (cancelamento) com cada uma das outras colunas que pode ser a causa do problema

Importar a biblioteca plotly.express

In [None]:
import plotly.express as px

for coluna in tabela.columns:
  grafico=px.histogram(tabela, x=coluna, color="cancelou")
  grafico.show()

##### Passo 6 - Conclusão das análises considerando as principais causas

    Após análise foram destacadas como possíveis causas de cancelamento as seguintes colunas: idade, ligacoes_callcenter, dias_atraso e duracao_contrato.

É interessante ir traçando junto à análise quais possíveis insights ajudariam a solucionar o problema.

### cancelou x idade

Análise feite através dos gráficos gerados anteriormente: Clientes acima de 50 anos TODOS cancelaram;

Insight: Oferecer programação para o público acima de 50 anos.

In [None]:
tabela = tabela[tabela["idade"]<=50]
display(tabela["cancelou"].value_counts())
#percentual
display(tabela["cancelou"].value_counts(normalize=True))

Quando retiramos os clientes acima de 50 anos e relacionamos com a coluna de cancelamento (cancelou) podemos observar a diminuição no número de cancelamentos (passa de 57% para 36%).

### cancelou x ligacoes_callcenter

Análise feite através dos gráficos gerados anteriormente: Clientes que ligaram mais de 4x TODOS cancelaram;

Insight: Criar política para resolucionar os problemas dos cliente em até 3 ligações.

In [None]:
tabela = tabela[tabela["ligacoes_callcenter"]<=4]
display(tabela["cancelou"].value_counts())
#percentual
display(tabela["cancelou"].value_counts(normalize=True))

Quando retiramos os clientes que ligaram 4x ou mais para o call center e relacionamos com a coluna de cancelamento (cancelou) podemos observar a diminuição no número de cancelamentos (passa de 36% para 21%).

### cancelou x dias_atraso

Análise feite através dos gráficos gerados anteriormente: Clientes com 20 dias ou mais de atraso cancelaram;

Insight: Entrar em contato com os clientes antes dos 15 dias de atraso (financeiro).

In [None]:
tabela = tabela[tabela["dias_atraso"]<=20]
display(tabela["cancelou"].value_counts())
#percentual
display(tabela["cancelou"].value_counts(normalize=True))

Quando retiramos os clientes com 20 dias ou mais de atraso e relacionamos com a coluna de cancelamento (cancelou) podemos observar a diminuição no número de cancelamentos (passa de 21% para 15%).

### cancelou x duracao_contrato

Análise feite através dos gráficos gerados anteriormente: clientes com planos mensais TODOS cancelaram.

Insight: Oferecer descontos em planos trimestrais e anuais.

In [None]:
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
display(tabela["cancelou"].value_counts())
#percentual
display(tabela["cancelou"].value_counts(normalize=True))

Quando retiramos os clientes com planos mensais e relacionamos com a coluna de cancelamento (cancelou) podemos observar a diminuição no número de cancelamentos (passa de 15% para 9%).

OBS.:
Para sair de 57% de cancelamento para 9% as ações foram somadas.