# 📊 Análisis de Evasión de Clientes – Telecom X

Este notebook analiza los datos de clientes de una empresa de telecomunicaciones para identificar patrones de cancelación (churn).

## 🔧 Librerías necesarias

In [None]:
import pandas as pd
import requests
import plotly.express as px

## 📥 Extracción de datos

In [None]:
url = "https://raw.githubusercontent.com/sthemonica/alura-voz/refs/heads/main/Dados/Telco-Customer-Churn.json"
response = requests.get(url)
data = response.json()

df_plano = pd.json_normalize(data)
print("✅ Datos cargados exitosamente")

## 🔍 Exploración inicial

In [None]:
# Información general
df_plano.info()

# Duplicados
print(f"🔍 Número de duplicados: {df_plano.duplicated().sum()}")

# Nulos por columna
print("🔍 Nulos por columna:\n", df_plano.isnull().sum())

# Vacíos o blancos
print("🔍 Valores en blanco por columna:\n", df_plano.apply(lambda x: x.astype(str).str.strip() == '').sum())

In [None]:
# Valores únicos por columna
for col in df_plano.columns:
    print(f"\n🧠 Columna: {col}")
    print(f"Valores únicos: {df_plano[col].nunique()}")
    if df_plano[col].nunique() < 50:
        print(df_plano[col].unique())
        print('-' * 50)

## 🧹 Transformación de columnas

In [None]:
# Convertir 'account.Charges.Total' a numérico
df_plano['account.Charges.Total'] = pd.to_numeric(df_plano['account.Charges.Total'], errors='coerce')
print(f"Tipo de dato de 'account.Charges.Total': {df_plano['account.Charges.Total'].dtype}")

# Eliminar filas sin valor en 'Churn'
df_plano = df_plano[df_plano['Churn'].str.strip() != '']
print(f"✅ Filas después de limpiar 'Churn': {len(df_plano)}")

## 📈 Estadísticas y limpieza extra

In [None]:
# Estadísticas básicas
print(df_plano.describe(include='all'))

# Eliminar columna temporal si existe
df_plano = df_plano.drop('Cuentas_Diarias', errors='ignore')

## 📊 Visualización con Plotly

In [None]:
fig = px.histogram(
    df_plano,
    x='customer.gender',
    color='Churn',
    barmode='group',
    text_auto=True,
    title='📊 Cancelaciones por Género'
)
fig.update_layout(xaxis_title='Género', yaxis_title='Cantidad de Clientes')
fig.show()