## 🔍 Problema de Negócio Visualizado

Uma operadora de serviços de telecomunicação está enfrentando dificuldades para reter clientes, o que afeta diretamente sua receita recorrente e estabilidade operacional. Muitos cancelamentos acontecem sem que a empresa consiga agir de forma preventiva. 

O objetivo deste projeto é aplicar técnicas de **Machine Learning** para prever a probabilidade de um cliente encerrar o contrato, possibilitando a criação de estratégias de **retenção mais eficazes**.

## 📚 Dicionário dos Dados

O dataset, disponibilizado pela IBM, possui informações sobre mais de 7.000 clientes, contendo atributos contratuais, demográficos e de uso de serviços.

- `customerID`: Identificador único do cliente  
- `gender`: Gênero do cliente  
- `SeniorCitizen`: Se o cliente é idoso (1) ou não (0)  
- `Partner`: Se o cliente tem cônjuge (Yes/No)  
- `Dependents`: Se o cliente possui dependentes (Yes/No)  
- `tenure`: Tempo de permanência do cliente (em meses)  
- `PhoneService`: Se possui serviço telefônico  
- `MultipleLines`: Se possui múltiplas linhas telefônicas  
- `InternetService`: Tipo de serviço de internet (DSL, Fiber optic ou None)  
- `OnlineSecurity`: Se contratou serviço de segurança online  
- `OnlineBackup`: Se contratou backup online  
- `DeviceProtection`: Se possui proteção para dispositivo  
- `TechSupport`: Se possui suporte técnico contratado  
- `StreamingTV`: Se contratou serviço de streaming de TV  
- `StreamingMovies`: Se contratou serviço de streaming de filmes  
- `Contract`: Tipo de contrato (Month-to-month, One year, Two year)  
- `PaperlessBilling`: Se o cliente utiliza fatura digital  
- `PaymentMethod`: Forma de pagamento  
- `MonthlyCharges`: Valor mensal da cobrança  
- `TotalCharges`: Total já pago pelo cliente  
- `Churn`: Se o cliente cancelou o serviço no último mês (Yes/No)

#### Import das bibliotecas

In [5]:
# Manipulação e visualização de dados
import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt
import seaborn as sns 

# Controle de warnings 
import warnings
warnings.filterwarnings('ignore')
pd.set_option('display.max_columns', None)


In [2]:
df = pd.read_parquet("../data/dados_banco.parquet")

In [6]:
df.head(5)

Unnamed: 0,customerID,gender,SeniorCitizen,Partner,Dependents,tenure,PhoneService,MultipleLines,InternetService,OnlineSecurity,OnlineBackup,DeviceProtection,TechSupport,StreamingTV,StreamingMovies,Contract,PaperlessBilling,PaymentMethod,MonthlyCharges,TotalCharges,Churn
0,7590-VHVEG,Female,0,Yes,No,1,No,No phone service,DSL,No,Yes,No,No,No,No,Month-to-month,Yes,Electronic check,29.85,29.85,No
1,5575-GNVDE,Male,0,No,No,34,Yes,No,DSL,Yes,No,Yes,No,No,No,One year,No,Mailed check,56.95,1889.5,No
2,3668-QPYBK,Male,0,No,No,2,Yes,No,DSL,Yes,Yes,No,No,No,No,Month-to-month,Yes,Mailed check,53.85,108.15,Yes
3,7795-CFOCW,Male,0,No,No,45,No,No phone service,DSL,Yes,No,Yes,Yes,No,No,One year,No,Bank transfer (automatic),42.3,1840.75,No
4,9237-HQITU,Female,0,No,No,2,Yes,No,Fiber optic,No,No,No,No,No,No,Month-to-month,Yes,Electronic check,70.7,151.65,Yes
