# 📊 Relatório Final: Projeto de Previsão de Churn

## 1. Introdução

Neste projeto, desenvolvi um modelo de **previsão de churn** (cancelamento) de clientes de uma empresa de telecomunicações. O objetivo é identificar quais clientes têm maior probabilidade de sair da empresa, permitindo que estratégias preventivas sejam adotadas.

O dataset utilizado foi o "Telco Customer Churn", disponível no [Kaggle](https://www.kaggle.com/blastchar/telco-customer-churn). Ele contém informações sobre os clientes, incluindo serviços contratados, tempo de contrato, gastos e status de cancelamento.

---

## 2. Objetivo do Projeto

- Analisar os fatores que contribuem para o cancelamento de clientes.
- Criar um modelo preditivo para classificar clientes com risco de churn.
- Entregar um dashboard interativo e uma interface web para prever churn com base em inputs do usuário.

---

## 3. Metodologia

### 3.1. EDA (Análise Exploratória de Dados)

Realizei uma análise exploratória para entender melhor as características dos dados:
- Distribuição do target (`Churn`)
- Correlação entre variáveis numéricas
- Análise por categorias (contrato, método de pagamento, etc.)

### 3.2. Pré-processamento de Dados

As variáveis categóricas foram transformadas usando `OneHotEncoder`, e os valores nulos foram tratados. As principais variáveis incluídas no modelo são:

| Variável | Descrição |
|----------|-----------|
| `gender` | Gênero do cliente |
| `SeniorCitizen` | Se é idoso |
| `Partner` | Possui parceiro(a) |
| `Dependents` | Possui dependentes |
| `tenure` | Tempo de contrato |
| `PhoneService` | Possui serviço telefônico |
| `MultipleLines` | Possui múltiplas linhas |
| `InternetService` | Tipo de internet |
| `Contract` | Tipo de contrato |
| `PaperlessBilling` | Fatura sem papel |
| `PaymentMethod` | Método de pagamento |
| `MonthlyCharges` | Valor mensal pago |
| `TotalCharges` | Valor total pago |

### 3.3. Modelagem

Foi treinado um modelo de **Random Forest Classifier**, que obteve os seguintes resultados:

| Métrica | Valor |
|---------|-------|
| Acurácia | 78% |
| ROC-AUC | 0.86 |
| Recall (Classe 1 - Churn) | 44% |
| Precisão (Classe 1 - Churn) | 76% |

---

## 4. Resultados

- O modelo conseguiu identificar corretamente a maioria dos clientes não churning (classe 0).
- Para clientes que realmente cancelaram, o modelo tem boa precisão, mas ainda pode ser aprimorado.
- As variáveis mais importantes foram: `Contract`, `MonthlyCharges`, `TotalCharges`.

---

## 5. Conclusão

Este projeto demonstra como técnicas de Ciência de Dados podem ser usadas para resolver problemas reais, como prever o cancelamento de clientes. Com ajustes adicionais (como balanceamento de classes, hiperparâmetros e feature engineering), o desempenho do modelo pode ser ainda melhor.

---

## 6. Referências

- Dataset: [Telco Customer Churn - Kaggle](https://www.kaggle.com/blastchar/telco-customer-churn)
- Ferramentas utilizadas: Python, Pandas, Scikit-learn, Streamlit, GitHub

---

## 7. Links Úteis

- [GitHub do Projeto](https://github.com/seu_usuario/seu_projeto)
- [Dashboard / Interface Web](http://localhost:8501) (se aplicável)