#Challenge Telecom X: análise de evasão de clientes - Parte 2

##Relatório de Análise e Modelagem Preditiva de Evasão de Clientes (Churn)

###1. Análise Crítica e Comparação dos Modelos
Neste projeto, foi desenvolvido dois modelos de classificação para prever a evasão de clientes (Churn): Regressão Logística e Árvore de Decisão. A escolha de modelos com e sem a necessidade de normalização dos dados foi uma estratégia inteligente para demonstrar o impacto do pré-processamento.

|Métrica(para Churn = 1)|Regressão Logística|Árvore de Decisão|
|-----------------------|-------------------|-----------------|
|Precisão               |	   0.64	        |        0.48     |
|Recall	                |      0.53	        |        0.50     |
|F1-Score               |	   0.58	        |        0.49     |
|Acurácia               |	   0.81	        |        0.74     |


- Regressão Logística (Modelo com Normalização):
```
Justificativa: Escolhido por ser um modelo linear e interpretável, ideal para problemas de classificação binária. A normalização foi essencial para este modelo, pois variáveis com escalas muito diferentes (tenure e Charges.Total) poderiam ter um peso desproporcional. A normalização garante que o modelo avalie a importância de cada variável de forma justa.
```
```
Desempenho: Apresentou o melhor desempenho geral, especialmente na precisão da classe Churn (0.64), indicando que, quando o modelo prevê que um cliente vai sair, ele está correto em 64% das vezes. A acurácia de 0.81 também é boa, mas deve ser interpretada com cautela devido ao desequilíbrio das classes. O modelo não demonstrou sinais claros de overfitting ou underfitting, mostrando boa capacidade de generalização.
```
- Árvore de Decisão (Modelo sem Normalização):
```
Justificativa: Escolhido por ser um modelo intuitivo e que não exige normalização, o que nos permitiu compará-lo diretamente com a Regressão Logística. Modelos baseados em árvore não são sensíveis à escala dos dados, pois operam com base em decisões de "maior que" ou "menor que".
```
```
Desempenho: Teve um desempenho inferior em todas as métricas comparado à Regressão Logística. A precisão para a classe Churn foi de apenas 0.48. O modelo parece ter um problema de overfitting, pois ele se ajustou demais aos dados de treino, perdendo a capacidade de generalizar bem para os dados de teste. Isso é comum em Árvores de Decisão sem parametrização (como a limitação da profundidade), que se tornam excessivamente complexas.
```
###2. Identificação dos Principais Fatores de Evasão
Com base na análise de importância das variáveis, tanto da Regressão Logística quanto da Árvore de Decisão, podemos identificar os principais fatores que influenciam a evasão.

- Fatores que Aumentam o Risco de Evasão:
```
Tempo de Contrato (tenure): A variável com maior importância para ambos os modelos. A correlação negativa e o coeficiente da Regressão Logística confirmaram o que a análise exploratória já havia mostrado: clientes com pouco tempo de contrato têm uma probabilidade muito maior de dar Churn.
```
```
Serviço de Internet de Fibra Óptica (InternetService_Fiber optic): Ter este tipo de serviço aumenta a chance de evasão. Isso pode estar relacionado a problemas de qualidade do serviço ou ao seu alto custo.
```
```
Contrato Mensal (Contract_Month-to-month): Esta variável foi a mais importante para a Regressão Logística, com um coeficiente positivo muito alto. Faz todo o sentido, pois clientes com contratos mensais têm mais liberdade e menos fidelidade à empresa.
```
```
Cobrança por Boleto/Cheque Eletrônico (PaperlessBilling_Yes/PaymentMethod_Electronic check): O uso desses métodos de pagamento também se correlacionou positivamente com a evasão.
```

- Fatores que Diminuem o Risco de Evasão (Aumentam a Retenção):
```
Tempo de Contrato de 2 Anos (Contract_Two year): A Regressão Logística mostrou que esta é a variável que mais diminui o risco de evasão. Clientes que optam por contratos longos são muito mais leais.
```
```
Suporte Técnico e Segurança Online (TechSupport_Yes, OnlineSecurity_Yes): Ter estes serviços de valor agregado, que garantem uma experiência mais segura e assistida, também diminui significativamente o risco de Churn.
```
###3. Estratégias de Retenção Baseadas nos Resultados
- Com as descobertas da análise, podem ser feitas as seguintes estratégias de retenção:
```
Foco em Clientes Novos: A empresa deve investir mais em programas de fidelização e acompanhamento para clientes nos primeiros meses de contrato, pois é a fase mais crítica para a evasão. Uma equipe de sucesso do cliente poderia entrar em contato com esses clientes para garantir que a experiência inicial seja a melhor possível.
```
```
Incentivar Contratos de Longo Prazo: Oferecer descontos atraentes ou benefícios extras para clientes que migrarem de contratos mensais para contratos anuais ou de dois anos. Os modelos confirmaram que contratos mais longos são o principal indicador de retenção.
```
```
Investigar a Qualidade do Serviço de Fibra Óptica: A forte correlação da evasão com o serviço de fibra óptica sugere que há um problema. É crucial que a área técnica investigue possíveis falhas ou lentidões.
```
```
Promover Serviços de Valor Agregado: A empresa deve reforçar a importância de serviços como Suporte Técnico e Segurança Online, pois eles foram identificados como fatores chave para a lealdade do cliente. Uma campanha de marketing focada nos benefícios desses serviços poderia ser uma ótima iniciativa.
```
```
Revisar os Métodos de Pagamento: Avaliar se a cobrança via boleto/cheque eletrônico está associada a clientes menos engajados ou que têm maior propensão a reclamar e cancelar. A empresa poderia incentivar o uso de métodos de pagamento automático (como débito em conta) com benefícios.
```
-Dicionário de dados
```
customerID: número de identificação único de cada cliente
Churn: se o cliente deixou ou não a empresa
gender: gênero (masculino e feminino)
SeniorCitizen: informação sobre um cliente ter ou não idade igual ou maior que 65 anos
Partner: se o cliente possui ou não um parceiro ou parceira
Dependents: se o cliente possui ou não dependentes
tenure: meses de contrato do cliente
PhoneService: assinatura de serviço telefônico
MultipleLines: assisnatura de mais de uma linha de telefone
InternetService: assinatura de um provedor internet
OnlineSecurity: assinatura adicional de segurança online
OnlineBackup: assinatura adicional de backup online
DeviceProtection: assinatura adicional de proteção no dispositivo
TechSupport: assinatura adicional de suporte técnico, menos tempo de espera
StreamingTV: assinatura de TV a cabo
StreamingMovies: assinatura de streaming de filmes
Contract: tipo de contrato
PaperlessBilling: se o cliente prefere receber online a fatura
PaymentMethod: forma de pagamento
Charges.Monthly: total de todos os serviços do cliente por mês
Charges.Total: total gasto pelo cliente
```