# 📊 Telecom X - Análise de Evasão de Clientes

Este notebook tem como objetivo analisar o problema de evasão (churn) de clientes da empresa Telecom X.  
O objetivo é identificar padrões e comportamentos que ajudem a empresa a compreender melhor os fatores que contribuem para o cancelamento de serviços.

---

In [None]:
# Pacotes principais
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import json

# Estilo dos gráficos
sns.set(style="whitegrid")
plt.rcParams["figure.figsize"] = (10, 6)


In [None]:
# Carregar dados do JSON
with open('TelecomX_Data.json', 'r', encoding='utf-8') as f:
    data_json = json.load(f)

# Normalizar JSON aninhado
df = pd.json_normalize(data_json)
df.head()

In [None]:
# Ver estrutura
df.info()

In [None]:
# Verificar valores nulos
print("Valores nulos por coluna:")
print(df.isnull().sum())

# Verificar duplicatas
print(f"Total de registros duplicados: {df.duplicated().sum()}")

In [None]:
# Converter valores monetários de Total para float
df["account.Charges.Total"] = pd.to_numeric(df["account.Charges.Total"], errors='coerce')

# Remover linhas com churn vazio
df = df[df["Churn"].isin(["Yes", "No"])]


In [None]:
# Criar coluna 'Contas Diárias'
df["DailyCharges"] = df["account.Charges.Monthly"] / 30
df["DailyCharges"] = df["DailyCharges"].round(2)
df[["account.Charges.Monthly", "DailyCharges"]].head()

In [None]:
# Estatísticas descritivas
df.describe(include='all')

In [None]:
# Distribuição da evasão
sns.countplot(data=df, x="Churn", palette="pastel")
plt.title("Distribuição da Evasão de Clientes")
plt.show()

In [None]:
# Evasão por tipo de contrato
sns.countplot(data=df, x="account.Contract", hue="Churn", palette="Set2")
plt.title("Churn por Tipo de Contrato")
plt.show()

In [None]:
# Boxplot: Total gasto vs Churn
sns.boxplot(data=df, x="Churn", y="account.Charges.Total", palette="Set3")
plt.title("Total Gasto por Clientes - Churn vs Não Churn")
plt.show()

In [None]:
# Correlação entre variáveis numéricas
corr = df[["account.Charges.Monthly", "account.Charges.Total", "customer.tenure", "DailyCharges"]].corr()
sns.heatmap(corr, annot=True, cmap="coolwarm", fmt=".2f")
plt.title("Correlação entre Variáveis Numéricas")
plt.show()

## 🧠 Conclusões e Insights

- Clientes com contratos mensais têm maior taxa de evasão.
- Quanto menor o tempo de contrato (tenure), maior a chance de churn.
- Faturas mensais altas não necessariamente indicam churn, mas valores baixos com contratos curtos tendem a mostrar maior evasão.

## 📌 Recomendações

- Oferecer descontos ou benefícios para clientes com contratos mensais.
- Monitorar clientes com menor tempo de casa e ações de fidelização antecipada.
- Explorar modelos preditivos para atuar proativamente sobre grupos de risco.

---