# Análise de Dados com Python

### Desafio:

Você trabalha em uma empresa de telecom e tem clientes de vários serviços diferentes, entre os principais: internet e telefone.

O problema é que, analisando o histórico dos clientes dos últimos anos, você percebeu que a empresa está com Churn de mais de 26% dos clientes.

Isso representa uma perda de milhões para a empresa.

O que a empresa precisa fazer para resolver isso?

Base de Dados: https://drive.google.com/drive/folders/1T7D0BlWkNuy_MDpUHuBG44kT80EmRYIs?usp=sharing <br>
Link Original do Kaggle: https://www.kaggle.com/radmirzosimov/telecom-users-dataset

In [51]:
# Passo 1: Importar a base de dados.
import pandas as pd

tabela = pd.read_csv("telecom_users.csv")


# Passo 2: Visualizar a base de dados(BD).
    # Entender as informacoes da BD.
    # Descobrir as "cagadas" da BD.
    # Excluir colunas inúteis.
colunas_nao_excluir = ["Churn", "TotalGasto", "FormaPagamento",
                       "TipoContrato", "ServicoSuporteTecnico", 
                       "ServicoSegurancaOnline", "ServicoInternet", 
                       "MesesComoClientes"]
for coluna in tabela.columns:
    if coluna in colunas_nao_excluir:
        print("Beleza, não excluimos a coluna {}".format(coluna))
    else:
        # axis = 0 -> eixo x.
        # axis = 1 -> eixo y.
        tabela = tabela.drop(coluna, axis=1)
    
display(tabela)

Beleza, não excluimos a coluna ServicoInternet
Beleza, não excluimos a coluna ServicoSegurancaOnline
Beleza, não excluimos a coluna ServicoSuporteTecnico
Beleza, não excluimos a coluna TipoContrato
Beleza, não excluimos a coluna FormaPagamento
Beleza, não excluimos a coluna TotalGasto
Beleza, não excluimos a coluna Churn


Unnamed: 0,ServicoInternet,ServicoSegurancaOnline,ServicoSuporteTecnico,TipoContrato,FormaPagamento,TotalGasto,Churn
0,Nao,SemInternet,SemInternet,2 anos,CartaoCredito,1734.65,Nao
1,Fibra,Nao,Nao,Mensal,CartaoCredito,3973.2,Nao
2,Fibra,Nao,Nao,Mensal,DebitoAutomatico,2869.85,Sim
3,DSL,Nao,Nao,Mensal,BoletoEletronico,238.5,Nao
4,DSL,Sim,Nao,Mensal,BoletoEletronico,119.5,Nao
...,...,...,...,...,...,...,...
5981,Fibra,Sim,Nao,Mensal,BoletoEletronico,95,Sim
5982,DSL,Sim,Sim,2 anos,CartaoCredito,2198.3,Nao
5983,Nao,SemInternet,SemInternet,Mensal,BoletoEletronico,306.05,Nao
5984,Fibra,Nao,Nao,Mensal,BoletoEletronico,1200.15,Sim


In [48]:
# Passo 3: Tratamento de dados (solucionar os problemas da BD)
# Tipo certo de informações.
    
tabela["TotalGasto"] = pd.to_numeric(tabela["TotalGasto"], errors="coerce")
    
# Excluir informações vazias.
# Excluir colunas completamente vazias:
tabela = tabela.dropna(how="all", axis=1)

# Excluir linhas que possuem alguma informação vazia:
tabela = tabela.dropna(how="any", axis=0)

print(tabela.info())

<class 'pandas.core.frame.DataFrame'>
Int64Index: 5975 entries, 0 to 5985
Data columns (total 7 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   ServicoInternet         5975 non-null   object 
 1   ServicoSegurancaOnline  5975 non-null   object 
 2   ServicoSuporteTecnico   5975 non-null   object 
 3   TipoContrato            5975 non-null   object 
 4   FormaPagamento          5975 non-null   object 
 5   TotalGasto              5975 non-null   float64
 6   Churn                   5975 non-null   object 
dtypes: float64(1), object(6)
memory usage: 373.4+ KB
None


In [49]:
# Passo 4: Análise Inicial dos dados.
# Como estão os cancelamentos? (26%) - Coluna "churn"("{:.2f}".format)
print(tabela["Churn"].value_counts())
print(tabela["Churn"].value_counts(normalize=True).map("{:.2%}".format))


Nao    4388
Sim    1587
Name: Churn, dtype: int64
Nao    73.44%
Sim    26.56%
Name: Churn, dtype: object


In [50]:
# Passo 5: Descobrir o mmotivo dos cancelamentos
import plotly.express as px

# Criar gráfico
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="Churn", text_auto=True)

# Exibir gráfico
    grafico.show()
    

### Conclusões e Ações
Escreva aqui suas conclusões:

- Clientes com contrato mensal tem MUITO mais chance de cancelar:
    - Podemos fazer promoções para o cliente ir para o contrato anual
    
- Familias maiores tendem a cancelar menos do que famílias menores
    - Podemos fazer promoções pra pessoa pegar uma linha adicional de telefone
    
- MesesComoCliente baixos tem MUITO cancelamento. Clientes com pouco tempo como cliente tendem a cancelar muito
    - A primeira experiência do cliente na operadora pode ser ruim
    - Talvez a captação de clientes tá trazendo clientes desqualificados
    - Ideia: a gente pode criar incentivo pro cara ficar mais tempo como cliente
    
- Quanto mais serviços o cara tem, menos chance dele cancelar
    - podemos fazer promoções com mais serviços pro cliente
    
- Tem alguma coisa no nosso serviço de Fibra que tá fazendo os clientes cancelarem
    - Agir sobre a fibra
    
- Clientes no boleto tem MUITO mais chance de cancelar, então temos que fazer alguma ação para eles irem para as outras formas de pagamento