# Análise de Dados com Python

### Desafio:

Você trabalha em uma empresa de telecom e tem clientes de vários serviços diferentes, entre os principais: internet e telefone.

O problema é que, analisando o histórico dos clientes dos últimos anos, você percebeu que a empresa está com Churn de mais de 26% dos clientes.

Isso representa uma perda de milhões para a empresa.

O que a empresa precisa fazer para resolver isso?

Base de Dados: https://drive.google.com/drive/folders/1T7D0BlWkNuy_MDpUHuBG44kT80EmRYIs?usp=sharing <br>
Link Original do Kaggle: https://www.kaggle.com/radmirzosimov/telecom-users-dataset

In [36]:
import pandas as pd

# Passo 1 - importar a base de dados para o python
table = pd.read_csv('../data_bases/telecom_users.csv')

# Passo 2 - Visualizar base de dados
def view_db(table):
    return table.drop("Unnamed: 0", axis = 1)
    
table = view_db(table)

In [None]:
# Passo 3 - Tratamento de dados
def process_db(table):
    table['TotalGasto'] = pd.to_numeric(table['TotalGasto'], errors = 'coerce')
    table = table.dropna(how = 'all', axis = 1)
    table = table.dropna(how = 'any', axis = 0)
    table = table.drop_duplicates()
    return table
    
table = process_db(table) 

In [None]:
# Passo 4 - Análise inicial 
def analysis_db(table):
    print(table['Churn'].value_counts())
    print(table['Churn'].value_counts(normalize=True).map('{:.1%}'.format))
    
analysis_db(table)

In [68]:
# Passo 5 - Análise detalhada
import plotly.express as px

def draw_graphic(table):
    # Criar gráfico
    column = 'MesesComoCliente'
    graphic = px.histogram(table, x = column, color = 'Churn', color_discrete_sequence = ['black', 'gray'])
    # Exibir gráfico 
    graphic.show()
    
draw_graphic(table)

ValueError: Value of 'x' is not the name of a column in 'data_frame'. Expected one of ['IDCliente', 'Genero', 'Aposentado', 'Casado', 'Dependentes', 'MesesComoCliente', 'ServicoTelefone', 'MultiplasLinhas', 'ServicoInternet', 'ServicoSegurancaOnline', 'ServicoBackupOnline', 'ProtecaoEquipamento', 'ServicoSuporteTecnico', 'ServicoStreamingTV', 'ServicoFilmes', 'TipoContrato', 'FaturaDigital', 'FormaPagamento', 'ValorMensal', 'TotalGasto', 'Churn'] but received: 1

In [48]:
display(table)

Unnamed: 0,IDCliente,Genero,Aposentado,Casado,Dependentes,MesesComoCliente,ServicoTelefone,MultiplasLinhas,ServicoInternet,ServicoSegurancaOnline,...,ProtecaoEquipamento,ServicoSuporteTecnico,ServicoStreamingTV,ServicoFilmes,TipoContrato,FaturaDigital,FormaPagamento,ValorMensal,TotalGasto,Churn
0,7010-BRBUU,Masculino,0,Sim,Sim,72,Sim,Sim,Nao,SemInternet,...,SemInternet,SemInternet,SemInternet,SemInternet,2 anos,Nao,CartaoCredito,24.10,1734.65,Nao
1,9688-YGXVR,Feminino,0,Nao,Nao,44,Sim,Nao,Fibra,Nao,...,Sim,Nao,Sim,Nao,Mensal,Sim,CartaoCredito,88.15,3973.20,Nao
2,9286-DOJGF,Feminino,1,Sim,Nao,38,Sim,Sim,Fibra,Nao,...,Nao,Nao,Nao,Nao,Mensal,Sim,DebitoAutomatico,74.95,2869.85,Sim
3,6994-KERXL,Masculino,0,Nao,Nao,4,Sim,Nao,DSL,Nao,...,Nao,Nao,Nao,Sim,Mensal,Sim,BoletoEletronico,55.90,238.50,Nao
4,2181-UAESM,Masculino,0,Nao,Nao,2,Sim,Nao,DSL,Sim,...,Sim,Nao,Nao,Nao,Mensal,Nao,BoletoEletronico,53.45,119.50,Nao
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5981,0684-AOSIH,Masculino,0,Sim,Nao,1,Sim,Nao,Fibra,Sim,...,Nao,Nao,Sim,Sim,Mensal,Sim,BoletoEletronico,95.00,95.00,Sim
5982,5982-PSMKW,Feminino,0,Sim,Sim,23,Sim,Sim,DSL,Sim,...,Sim,Sim,Sim,Sim,2 anos,Sim,CartaoCredito,91.10,2198.30,Nao
5983,8044-BGWPI,Masculino,0,Sim,Sim,12,Sim,Nao,Nao,SemInternet,...,SemInternet,SemInternet,SemInternet,SemInternet,Mensal,Sim,BoletoEletronico,21.15,306.05,Nao
5984,7450-NWRTR,Masculino,1,Nao,Nao,12,Sim,Sim,Fibra,Nao,...,Sim,Nao,Sim,Sim,Mensal,Sim,BoletoEletronico,99.45,1200.15,Sim


^C


### Conclusões e Ações

- Clientes tem muitas chances de cancelas nos primeiros mese 
    - 
    - 