In [2]:
# =========================================
# DESAFÍO TELECOM X - ANÁLISIS DE CHURN
# =========================================

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

sns.set(style="whitegrid")
plt.style.use("default")

# =========================================
# CARGA DE DATOS
# =========================================

df = pd.read_json("/content/sample_data/anscombe.json")
df.head()

# =========================================
# EXPLORACIÓN INICIAL
# =========================================

df.info()

df.describe(include="all")

df.isnull().sum()

# =========================================
# LIMPIEZA Y TRANSFORMACIÓN (ETL)
# =========================================

# Convertir columnas numéricas
columnas_numericas = ['tenure', 'MonthlyCharges', 'TotalCharges']

for col in columnas_numericas:
    if col in df.columns:
        df[col] = pd.to_numeric(df[col], errors='coerce')

# Eliminar valores nulos
df = df.dropna()

# Convertir Churn a variable binaria
if 'Churn' in df.columns:
    df['Churn'] = df['Churn'].map({'Yes': 1, 'No': 0})

# =========================================
# ANÁLISIS EXPLORATORIO DE DATOS (EDA)
# =========================================

# Distribución general de Churn
if 'Churn' in df.columns:
    df['Churn'].value_counts(normalize=True)

    sns.countplot(data=df, x='Churn')
    plt.title('Distribución de Evasión de Clientes')
    plt.show()

# =========================================
# Churn vs Tipo de contrato
# =========================================

if 'Contract' in df.columns:
    sns.countplot(data=df, x='Contract', hue='Churn')
    plt.title('Churn según tipo de contrato')
    plt.xticks(rotation=45)
    plt.show()

# =========================================
# Churn vs Antigüedad del cliente
# =========================================

if 'tenure' in df.columns:
    sns.boxplot(data=df, x='Churn', y='tenure')
    plt.title('Antigüedad del cliente vs Churn')
    plt.show()

# =========================================
# Churn vs Cargos mensuales
# =========================================

if 'MonthlyCharges' in df.columns:
    sns.boxplot(data=df, x='Churn', y='MonthlyCharges')
    plt.title('Cargos mensuales vs Churn')
    plt.show()

# =========================================
# CONCLUSIONES FINALES
# =========================================

print("""
CONCLUSIONES DEL ANÁLISIS DE EVASIÓN DE CLIENTES – TELECOM X

El análisis exploratorio de los datos permitió identificar patrones relevantes
relacionados con la evasión de clientes.

Se observó que los clientes con contratos de tipo mensual presentan una mayor
probabilidad de cancelar el servicio en comparación con aquellos que cuentan
con contratos de mayor duración.

Asimismo, los clientes con menor antigüedad tienden a abandonar el servicio con
mayor frecuencia, lo que sugiere oportunidades de mejora en las estrategias de
retención temprana.

Por otro lado, los clientes con cargos mensuales más elevados muestran una mayor
tasa de evasión, lo cual podría estar relacionado con una percepción negativa
del costo-beneficio del servicio.

En conclusión, el tipo de contrato, la antigüedad del cliente y los cargos
mensuales son factores clave que influyen en la evasión de clientes. Estos
hallazgos pueden servir como base para el desarrollo de modelos predictivos
por parte del equipo de ciencia de datos.
""")

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 44 entries, 0 to 43
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   Series  44 non-null     object 
 1   X       44 non-null     int64  
 2   Y       44 non-null     float64
dtypes: float64(1), int64(1), object(1)
memory usage: 1.2+ KB

CONCLUSIONES DEL ANÁLISIS DE EVASIÓN DE CLIENTES – TELECOM X

El análisis exploratorio de los datos permitió identificar patrones relevantes
relacionados con la evasión de clientes.

Se observó que los clientes con contratos de tipo mensual presentan una mayor
probabilidad de cancelar el servicio en comparación con aquellos que cuentan
con contratos de mayor duración.

Asimismo, los clientes con menor antigüedad tienden a abandonar el servicio con
mayor frecuencia, lo que sugiere oportunidades de mejora en las estrategias de
retención temprana.

Por otro lado, los clientes con cargos mensuales más elevados muestran una mayor
tasa de evasión, 