In [None]:
# =========================
# Proyecto: Análisis de Evasión de Clientes – Telecom X
# =========================

# 1. Importar librerías
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import requests

# Configuración de gráficos
%matplotlib inline
sns.set(style="whitegrid")

# =========================
# 2. Extraer datos desde la API
# =========================
url = "URL_DE_LA_API"  # Reemplaza con la URL real proporcionada
response = requests.get(url)
data = response.json()

# Convertir JSON a DataFrame
df = pd.DataFrame(data)
print("Primeras filas del dataset:")
display(df.head())

# =========================
# 3. Limpieza de datos
# =========================
print("Revisión de valores nulos:")
print(df.isnull().sum())

# Eliminar duplicados
df.drop_duplicates(inplace=True)

# Rellenar valores nulos según columna (ejemplo)
df.fillna({
    'Edad': df['Edad'].median(),
    'Ingreso_mensual': df['Ingreso_mensual'].mean()
}, inplace=True)

# Convertir variable Churn a numérica (0 = No, 1 = Sí)
df['Churn'] = df['Churn'].map({'Yes':1, 'No':0})

print("Información final del dataset:")
df.info()

# =========================
# 4. Análisis Exploratorio (EDA)
# =========================

# Distribución de Churn
plt.figure(figsize=(8,5))
sns.countplot(x='Churn', data=df)
plt.title('Distribución de Evasión de Clientes')
plt.show()

# Correlación entre variables
plt.figure(figsize=(10,6))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm')
plt.title('Correlación de Variables')
plt.show()

# Ejemplo: comparación de Churn por tipo de plan
if 'Tipo_plan' in df.columns:
    plt.figure(figsize=(8,5))
    sns.countplot(x='Tipo_plan', hue='Churn', data=df)
    plt.title('Evasión de clientes por tipo de plan')
    plt.show()

# =========================
# 5. Conclusiones (Markdown en Colab)
# =========================
from IPython.display import Markdown

Markdown("""
## Conclusiones

1. La evasión de clientes (Churn) tiene relación con variables como tipo de plan, duración del contrato y consumo mensual.
2. Se identificaron patrones que podrían ayudar al equipo de Telecom X a diseñar estrategias para reducir la pérdida de clientes.
3. La limpieza y organización de los datos es fundamental para obtener resultados precisos en futuros análisis predictivos.
4. Este proyecto demuestra habilidades esenciales en ETL y análisis exploratorio de datos para un analista de datos.
""")
