# üìä Telecom X - An√°lise de Evas√£o de Clientes

Este notebook tem como objetivo analisar o problema de evas√£o (churn) de clientes da empresa Telecom X.  
O objetivo √© identificar padr√µes e comportamentos que ajudem a empresa a compreender melhor os fatores que contribuem para o cancelamento de servi√ßos.

---

In [None]:
# Pacotes principais
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import json

# Estilo dos gr√°ficos
sns.set(style="whitegrid")
plt.rcParams["figure.figsize"] = (10, 6)


In [None]:
# Carregar dados do JSON
with open('TelecomX_Data.json', 'r', encoding='utf-8') as f:
    data_json = json.load(f)

# Normalizar JSON aninhado
df = pd.json_normalize(data_json)
df.head()

In [None]:
# Ver estrutura
df.info()

In [None]:
# Verificar valores nulos
print("Valores nulos por coluna:")
print(df.isnull().sum())

# Verificar duplicatas
print(f"Total de registros duplicados: {df.duplicated().sum()}")

In [None]:
# Converter valores monet√°rios de Total para float
df["account.Charges.Total"] = pd.to_numeric(df["account.Charges.Total"], errors='coerce')

# Remover linhas com churn vazio
df = df[df["Churn"].isin(["Yes", "No"])]


In [None]:
# Criar coluna 'Contas Di√°rias'
df["DailyCharges"] = df["account.Charges.Monthly"] / 30
df["DailyCharges"] = df["DailyCharges"].round(2)
df[["account.Charges.Monthly", "DailyCharges"]].head()

In [None]:
# Estat√≠sticas descritivas
df.describe(include='all')

In [None]:
# Distribui√ß√£o da evas√£o
sns.countplot(data=df, x="Churn", palette="pastel")
plt.title("Distribui√ß√£o da Evas√£o de Clientes")
plt.show()

In [None]:
# Evas√£o por tipo de contrato
sns.countplot(data=df, x="account.Contract", hue="Churn", palette="Set2")
plt.title("Churn por Tipo de Contrato")
plt.show()

In [None]:
# Boxplot: Total gasto vs Churn
sns.boxplot(data=df, x="Churn", y="account.Charges.Total", palette="Set3")
plt.title("Total Gasto por Clientes - Churn vs N√£o Churn")
plt.show()

In [None]:
# Correla√ß√£o entre vari√°veis num√©ricas
corr = df[["account.Charges.Monthly", "account.Charges.Total", "customer.tenure", "DailyCharges"]].corr()
sns.heatmap(corr, annot=True, cmap="coolwarm", fmt=".2f")
plt.title("Correla√ß√£o entre Vari√°veis Num√©ricas")
plt.show()

## üß† Conclus√µes e Insights

- Clientes com contratos mensais t√™m maior taxa de evas√£o.
- Quanto menor o tempo de contrato (tenure), maior a chance de churn.
- Faturas mensais altas n√£o necessariamente indicam churn, mas valores baixos com contratos curtos tendem a mostrar maior evas√£o.

## üìå Recomenda√ß√µes

- Oferecer descontos ou benef√≠cios para clientes com contratos mensais.
- Monitorar clientes com menor tempo de casa e a√ß√µes de fideliza√ß√£o antecipada.
- Explorar modelos preditivos para atuar proativamente sobre grupos de risco.

---