<a href="https://colab.research.google.com/github/marelycarcamo/challenge2-TelecomX/blob/main/TelecomX_LATAM.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---
# **DESAFIO TELECOMX LATAM**
---

## Descripción del Proyecto

Has sido contratado como asistente de análisis de datos en Telecom X y formarás parte del proyecto "Churn de Clientes". La empresa enfrenta una alta tasa de cancelaciones y necesita comprender los factores que llevan a la pérdida de clientes.

Tu desafío será recopilar, procesar y analizar los datos, utilizando Python y sus principales bibliotecas para extraer información valiosa. A partir de tu análisis, el equipo de Data Science podrá avanzar en modelos predictivos y desarrollar estrategias para reducir la evasión.

### Objetivo: Análisis de Evasión de Clientes

---
#📌 Extracción
---

### Obtener Datos
Importar los datos de la API de Telecom X. Estos datos están disponibles en formato JSON y contienen información esencial sobre los clientes, incluyendo datos demográficos, tipo de servicio contratado y estado de evasión.

In [2]:
#Importar librerías
import requests
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')
import matplotlib.pyplot as plt
import seaborn as sns

In [3]:
url = 'https://raw.githubusercontent.com/marelycarcamo/challenge2-TelecomX/refs/heads/main/TelecomX_Data.json'
# Descargar datos
response = requests.get(url)
datos_json = response.json()
datos_json[0]

{'customerID': '0002-ORFBO',
 'Churn': 'No',
 'customer': {'gender': 'Female',
  'SeniorCitizen': 0,
  'Partner': 'Yes',
  'Dependents': 'Yes',
  'tenure': 9},
 'phone': {'PhoneService': 'Yes', 'MultipleLines': 'No'},
 'internet': {'InternetService': 'DSL',
  'OnlineSecurity': 'No',
  'OnlineBackup': 'Yes',
  'DeviceProtection': 'No',
  'TechSupport': 'Yes',
  'StreamingTV': 'Yes',
  'StreamingMovies': 'No'},
 'account': {'Contract': 'One year',
  'PaperlessBilling': 'Yes',
  'PaymentMethod': 'Mailed check',
  'Charges': {'Monthly': 65.6, 'Total': '593.3'}}}

#📊 Carga y análisis

#### **Objetivo**
Analizar las relaciones, distribuciones y calidad de los datos tabulares.

#### Crear un Dataframe
Aplanar el dataset creando el dataframe.

In [4]:
# 1. Crear DataFrame
df = pd.json_normalize(datos_json, sep='_')

#### 1. Primer Vistazo a los Datos.
Comprender la estructura básica de los datos con los 5 primeros registros.

In [5]:
# Visualizar 10 registros para comprender su estructura.
df.sample(20)

Unnamed: 0,customerID,Churn,customer_gender,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_InternetService,...,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_Contract,account_PaperlessBilling,account_PaymentMethod,account_Charges_Monthly,account_Charges_Total
860,1217-VASWC,No,Male,1,Yes,No,43,Yes,No,Fiber optic,...,Yes,Yes,No,Yes,Yes,One year,Yes,Bank transfer (automatic),100.55,4304.0
1506,2165-VOEGB,Yes,Female,0,No,Yes,46,Yes,No,Fiber optic,...,Yes,No,Yes,Yes,Yes,One year,Yes,Bank transfer (automatic),105.2,4822.85
4647,6366-XIVKZ,No,Female,0,Yes,Yes,13,Yes,No,DSL,...,No,Yes,No,No,Yes,Month-to-month,Yes,Mailed check,63.15,816.8
1714,2434-EEVDB,No,Female,0,Yes,No,64,Yes,Yes,Fiber optic,...,No,Yes,No,Yes,No,Two year,Yes,Credit card (automatic),94.6,5948.7
3384,4697-LUPSU,No,Male,0,Yes,Yes,2,Yes,No,No,...,No internet service,No internet service,No internet service,No internet service,No internet service,One year,No,Mailed check,20.2,34.75
6961,9586-JGQKH,No,Female,0,Yes,No,64,Yes,Yes,Fiber optic,...,Yes,No,Yes,Yes,Yes,Two year,Yes,Bank transfer (automatic),105.4,6794.75
2622,3655-SNQYZ,No,Female,0,Yes,Yes,69,Yes,Yes,Fiber optic,...,Yes,Yes,Yes,Yes,Yes,Two year,No,Credit card (automatic),113.25,7895.15
1104,1563-IWQEX,No,Female,0,No,No,12,Yes,No,No,...,No internet service,No internet service,No internet service,No internet service,No internet service,Month-to-month,No,Mailed check,19.7,220.35
4040,5529-GIBVH,No,Female,0,No,No,47,Yes,No,No,...,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Mailed check,20.15,1046.2
2885,4001-TSBTV,No,Female,0,Yes,Yes,58,Yes,No,Fiber optic,...,Yes,Yes,No,Yes,No,Month-to-month,Yes,Electronic check,91.55,5511.65


#### 3. **Conocer Tipo de Datos**
- Identificar formato de variables y primeros indicios de nulos.
- **Resultado:** float64(1), int64(2), object(18).

In [6]:
# 3. Verificar tipos de datos y nulos por columna
print(f"\nDimensiones: {df.shape[0]} filas, {df.shape[1]} columnas\n")
df.info()


Dimensiones: 7267 filas, 21 columnas

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7267 entries, 0 to 7266
Data columns (total 21 columns):
 #   Column                     Non-Null Count  Dtype  
---  ------                     --------------  -----  
 0   customerID                 7267 non-null   object 
 1   Churn                      7267 non-null   object 
 2   customer_gender            7267 non-null   object 
 3   customer_SeniorCitizen     7267 non-null   int64  
 4   customer_Partner           7267 non-null   object 
 5   customer_Dependents        7267 non-null   object 
 6   customer_tenure            7267 non-null   int64  
 7   phone_PhoneService         7267 non-null   object 
 8   phone_MultipleLines        7267 non-null   object 
 9   internet_InternetService   7267 non-null   object 
 10  internet_OnlineSecurity    7267 non-null   object 
 11  internet_OnlineBackup      7267 non-null   object 
 12  internet_DeviceProtection  7267 non-null   object 
 13  internet_

In [7]:
#### Corrección de nombres de columnas
df = df.rename(columns={
    'internet_StreamingWovies': 'internet_StreamingMovies',
    'customer_Dependency': 'customer_Dependents',
    'phone_PhonesService': 'phone_PhoneService'
})

df.columns.tolist()

['customerID',
 'Churn',
 'customer_gender',
 'customer_SeniorCitizen',
 'customer_Partner',
 'customer_Dependents',
 'customer_tenure',
 'phone_PhoneService',
 'phone_MultipleLines',
 'internet_InternetService',
 'internet_OnlineSecurity',
 'internet_OnlineBackup',
 'internet_DeviceProtection',
 'internet_TechSupport',
 'internet_StreamingTV',
 'internet_StreamingMovies',
 'account_Contract',
 'account_PaperlessBilling',
 'account_PaymentMethod',
 'account_Charges_Monthly',
 'account_Charges_Total']

In [8]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7267 entries, 0 to 7266
Data columns (total 21 columns):
 #   Column                     Non-Null Count  Dtype  
---  ------                     --------------  -----  
 0   customerID                 7267 non-null   object 
 1   Churn                      7267 non-null   object 
 2   customer_gender            7267 non-null   object 
 3   customer_SeniorCitizen     7267 non-null   int64  
 4   customer_Partner           7267 non-null   object 
 5   customer_Dependents        7267 non-null   object 
 6   customer_tenure            7267 non-null   int64  
 7   phone_PhoneService         7267 non-null   object 
 8   phone_MultipleLines        7267 non-null   object 
 9   internet_InternetService   7267 non-null   object 
 10  internet_OnlineSecurity    7267 non-null   object 
 11  internet_OnlineBackup      7267 non-null   object 
 12  internet_DeviceProtection  7267 non-null   object 
 13  internet_TechSupport       7267 non-null   objec

In [9]:
df.head()

Unnamed: 0,customerID,Churn,customer_gender,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_InternetService,...,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_Contract,account_PaperlessBilling,account_PaymentMethod,account_Charges_Monthly,account_Charges_Total
0,0002-ORFBO,No,Female,0,Yes,Yes,9,Yes,No,DSL,...,Yes,No,Yes,Yes,No,One year,Yes,Mailed check,65.6,593.3
1,0003-MKNFE,No,Male,0,No,No,9,Yes,Yes,DSL,...,No,No,No,No,Yes,Month-to-month,No,Mailed check,59.9,542.4
2,0004-TLHLJ,Yes,Male,0,No,No,4,Yes,No,Fiber optic,...,No,Yes,No,No,No,Month-to-month,Yes,Electronic check,73.9,280.85
3,0011-IGKFF,Yes,Male,1,Yes,No,13,Yes,No,Fiber optic,...,Yes,Yes,No,Yes,Yes,Month-to-month,Yes,Electronic check,98.0,1237.85
4,0013-EXCHZ,Yes,Female,1,Yes,No,3,Yes,No,Fiber optic,...,No,No,Yes,Yes,No,Month-to-month,Yes,Mailed check,83.9,267.4


In [10]:
# Función de limpieza

def generar_reporte_limpieza(df):
    reporte = {}

    filas, columnas = df.shape
    reporte['filas'], reporte['columnas'] = filas, columnas

    # Valores nulos
    nulos = df.isnull().sum()
    reporte['nulos'] = nulos.to_dict()

    # Celdas vacías (evitando FutureWarning)
    vacíos = df.apply(lambda col: col.astype(str).map(lambda x: x.strip() == '')).sum()
    reporte['vacíos'] = vacíos.to_dict()

    # Duplicados
    duplicados = df.duplicated().sum()
    reporte['duplicados'] = duplicados

    # Tipos de datos
    tipos = df.dtypes.apply(str)
    reporte['tipos_de_dato'] = tipos.to_dict()

    # Valores únicos
    únicos = df.nunique()
    reporte['valores_únicos'] = únicos.to_dict()

    # Filas completamente vacías
    filas_vacías = df.isnull().all(axis=1).sum()
    reporte['filas_completamente_vacías'] = filas_vacías

    # Informe
    print("===== REPORTE DE LIMPIEZA =====")
    print(f"Dimensiones del DataFrame: {filas} filas x {columnas} columnas\n")

    print("Valores nulos por columna:")
    for col, count in nulos.items():
        print(f"  {col}: {count}")

    print("\nCeldas vacías por columna:")
    for col, count in vacíos.items():
        print(f"  {col}: {count}")

    print(f"\nFilas duplicadas: {duplicados}")

    print("\nTipos de datos:")
    for col, tipo in tipos.items():
        print(f"  {col}: {tipo}")

    print("\nValores únicos por columna:")
    for col, count in únicos.items():
        print(f"  {col}: {count}")



    filas, columnas = df.shape
    reporte['filas'], reporte['columnas'] = filas, columnas

    # Valores nulos
    nulos = df.isnull().sum()
    columnas_con_nulos = nulos[nulos > 0]
    reporte['nulos'] = nulos.to_dict()

    # Celdas vacías
    vacíos = df.apply(lambda col: col.astype(str).map(lambda x: x.strip() == '')).sum()
    columnas_con_vacíos = vacíos[vacíos > 0]
    reporte['vacíos'] = vacíos.to_dict()

    # Duplicados fila completa
    duplicados = df.duplicated().sum()
    reporte['duplicados'] = duplicados

    # Tipos de datos y valores únicos
    reporte['tipos_de_dato'] = df.dtypes.apply(str).to_dict()
    reporte['valores_únicos'] = df.nunique().to_dict()

    # Filas completamente vacías
    filas_vacías = df.isnull().all(axis=1).sum()
    reporte['filas_completamente_vacías'] = filas_vacías

    # ==== Impresión de resumen amigable ====
    print("\n\n===== RESUMEN DEL ANÁLISIS 🕵🏻=====")
    if duplicados > 0:
        print(f"- Se encontraron {duplicados} filas duplicadas ➤ df.drop_duplicates(inplace=True)")

    if not columnas_con_nulos.empty:
        print(f"- {len(columnas_con_nulos)} columnas contienen valores nulos:")
        for col in columnas_con_nulos.index:
            print(f"   • {col}: {columnas_con_nulos[col]} nulos")


    if not columnas_con_vacíos.empty:
        print(f"- {len(columnas_con_vacíos)} columnas contienen celdas vacías (espacios o texto vacío):")
        for col in columnas_con_vacíos.index:
            print(f"   • {col}: {columnas_con_vacíos[col]} vacíos")


    if filas_vacías > 0:
        print(f"- Hay {filas_vacías} filas completamente vacías ➤ df.dropna(how='all', inplace=True)")

    if duplicados == 0 and filas_vacías == 0 and columnas_con_nulos.empty and columnas_con_vacíos.empty:
        print("- No se encontraron problemas. ¡El dataset está limpio y listo para usar! 🎉")
    return reporte

In [11]:
#Generar reporte con la función 'generar_reporte_limpieza'
reporte = generar_reporte_limpieza(df)

===== REPORTE DE LIMPIEZA =====
Dimensiones del DataFrame: 7267 filas x 21 columnas

Valores nulos por columna:
  customerID: 0
  Churn: 0
  customer_gender: 0
  customer_SeniorCitizen: 0
  customer_Partner: 0
  customer_Dependents: 0
  customer_tenure: 0
  phone_PhoneService: 0
  phone_MultipleLines: 0
  internet_InternetService: 0
  internet_OnlineSecurity: 0
  internet_OnlineBackup: 0
  internet_DeviceProtection: 0
  internet_TechSupport: 0
  internet_StreamingTV: 0
  internet_StreamingMovies: 0
  account_Contract: 0
  account_PaperlessBilling: 0
  account_PaymentMethod: 0
  account_Charges_Monthly: 0
  account_Charges_Total: 0

Celdas vacías por columna:
  customerID: 0
  Churn: 224
  customer_gender: 0
  customer_SeniorCitizen: 0
  customer_Partner: 0
  customer_Dependents: 0
  customer_tenure: 0
  phone_PhoneService: 0
  phone_MultipleLines: 0
  internet_InternetService: 0
  internet_OnlineSecurity: 0
  internet_OnlineBackup: 0
  internet_DeviceProtection: 0
  internet_TechSuppor

In [12]:
# Vacíos o en blanco
df.apply(lambda x: x.astype(str).str.strip() == '').sum()

Unnamed: 0,0
customerID,0
Churn,224
customer_gender,0
customer_SeniorCitizen,0
customer_Partner,0
customer_Dependents,0
customer_tenure,0
phone_PhoneService,0
phone_MultipleLines,0
internet_InternetService,0


In [13]:
#Cambiando la columna "account.Charges.Total" a Float

df['account_Charges_Total'] = pd.to_numeric(df['account_Charges_Total'], errors='coerce')
print(df['account_Charges_Total'].dtype)

float64


In [14]:
# Eliminando los registros de Churn

df = df[df['Churn'].str.strip() != '']
print("Número de filas después de eliminar las vacías en 'Churn':", len(df))

Número de filas después de eliminar las vacías en 'Churn': 7043


In [15]:
# Verificar vacios en columna Churn y columna account_Changes_Total
# Vacíos o en blanco
df.apply(lambda x: x.astype(str).str.strip() == '').sum()

Unnamed: 0,0
customerID,0
Churn,0
customer_gender,0
customer_SeniorCitizen,0
customer_Partner,0
customer_Dependents,0
customer_tenure,0
phone_PhoneService,0
phone_MultipleLines,0
internet_InternetService,0


In [16]:
# Contar los valores únicos en cada columna
print(df.nunique())

customerID                   7043
Churn                           2
customer_gender                 2
customer_SeniorCitizen          2
customer_Partner                2
customer_Dependents             2
customer_tenure                73
phone_PhoneService              2
phone_MultipleLines             3
internet_InternetService        3
internet_OnlineSecurity         3
internet_OnlineBackup           3
internet_DeviceProtection       3
internet_TechSupport            3
internet_StreamingTV            3
internet_StreamingMovies        3
account_Contract                3
account_PaperlessBilling        2
account_PaymentMethod           4
account_Charges_Monthly      1585
account_Charges_Total        6530
dtype: int64


---
#🔧 Transformación
---

In [17]:
# =============================================================================
# 1. CONVERSIÓN DE COLUMNAS DE "SÍ/NO" A BINARIAS (1/0)
# =============================================================================

# Lista de columnas que contienen respuestas de Sí/No que queremos convertir
columnas_binarias = [
    'Churn',                   # ¿Abandonó el cliente?
    'customer_Partner',        # ¿Tiene pareja?
    'customer_Dependents',     # ¿Tiene dependientes?
    'phone_PhoneService',      # ¿Tiene servicio telefónico?
    'account_PaperlessBilling' # ¿Usa facturación digital?
]

# Recorremos cada columna en la lista
for columna in columnas_binarias:

    # Verificamos si la columna existe en el dataframe
    if columna in df.columns:

        # Antes de cambiar, mostramos cómo lucen los valores originales
        print(f"\nValores únicos en '{columna}' ANTES de conversión:")
        print(df[columna].value_counts(dropna=False))

        # Aplicamos la conversión a binario
        # - Donde diga "Yes" ponemos 1
        # - Donde diga "No" ponemos 0
        df[columna] = df[columna].map({'Yes': 1, 'No': 0})

        # Mostramos los resultados después del cambio
        print(f"\nValores únicos en '{columna}' DESPUÉS de conversión:")
        print(df[columna].value_counts(dropna=False))
        print(f"✓ Columna '{columna}' convertida a binario")

    else:
        print(f"\n⚠ Advertencia: La columna '{columna}' no existe en el dataframe")


Valores únicos en 'Churn' ANTES de conversión:
Churn
No     5174
Yes    1869
Name: count, dtype: int64

Valores únicos en 'Churn' DESPUÉS de conversión:
Churn
0    5174
1    1869
Name: count, dtype: int64
✓ Columna 'Churn' convertida a binario

Valores únicos en 'customer_Partner' ANTES de conversión:
customer_Partner
No     3641
Yes    3402
Name: count, dtype: int64

Valores únicos en 'customer_Partner' DESPUÉS de conversión:
customer_Partner
0    3641
1    3402
Name: count, dtype: int64
✓ Columna 'customer_Partner' convertida a binario

Valores únicos en 'customer_Dependents' ANTES de conversión:
customer_Dependents
No     4933
Yes    2110
Name: count, dtype: int64

Valores únicos en 'customer_Dependents' DESPUÉS de conversión:
customer_Dependents
0    4933
1    2110
Name: count, dtype: int64
✓ Columna 'customer_Dependents' convertida a binario

Valores únicos en 'phone_PhoneService' ANTES de conversión:
phone_PhoneService
Yes    6361
No      682
Name: count, dtype: int64

Valores ú

In [18]:
df.sample(3)

Unnamed: 0,customerID,Churn,customer_gender,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_InternetService,...,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_Contract,account_PaperlessBilling,account_PaymentMethod,account_Charges_Monthly,account_Charges_Total
3246,4530-NDRKU,0,Female,0,1,1,42,1,No,No,...,No internet service,No internet service,No internet service,No internet service,No internet service,One year,1,Electronic check,19.05,761.85
3834,5243-SAOTC,0,Male,0,0,0,54,1,Yes,Fiber optic,...,Yes,No,No,No,No,Month-to-month,1,Bank transfer (automatic),79.85,4308.25
6841,9436-ZBZCT,1,Male,0,0,0,14,1,Yes,Fiber optic,...,No,No,Yes,Yes,No,Month-to-month,1,Electronic check,89.95,1178.4


In [19]:
# =============================================================================
# MANEJO DE COLUMNAS CON MÚLTIPLES VALORES (YES/NO/NO SERVICE)
# =============================================================================

"""
Problema:
- Algunas columnas como servicios adicionales tienen 3 valores posibles:
  • "Yes" (tiene el servicio adicional)
  • "No" (no tiene el servicio adicional)
  • "No internet service" (no tiene servicio base de internet)

Solución:
1. Identificar las columnas problemáticas
2. Convertir "No internet service" a "No" (0) porque:
   - Si no tiene el servicio base, es equivalente a no tener el servicio adicional
   - Mantiene la lógica binaria
3. Luego aplicar la conversión estándar a binario
"""

# Lista de columnas con valores múltiples (basado en tu análisis previo)
columnas_multivalor = [
    'internet_OnlineSecurity',
    'internet_OnlineBackup',
    'internet_DeviceProtection',
    'internet_TechSupport',
    'internet_StreamingTV',
    'internet_StreamingMovies',
    'phone_MultipleLines'  # Esta puede tener "No phone service"
]

# Recorremos cada columna problemática
for columna in columnas_multivalor:

    # Verificamos si la columna existe
    if columna in df.columns:

        print(f"\nProcesando columna compleja: {columna}")
        print("Valores únicos ANTES de limpieza:")
        print(df[columna].value_counts(dropna=False))

        # Paso 1: Convertir valores de "no service" a "No"
        # - Esto normaliza las respuestas
        df[columna] = df[columna].replace({
            'No internet service': 'No',
            'No phone service': 'No',
        })

        print("\nValores después de convertir 'No service' a 'No':")
        print(df[columna].value_counts(dropna=False))

        # Paso 2: Ahora aplicamos la conversión binaria estándar
        df[columna] = df[columna].map({'Yes': 1, 'No': 0})

        print("\nValores DESPUÉS de conversión binaria:")
        print(df[columna].value_counts(dropna=False))
        print(f"✓ Columna {columna} normalizada y convertida a binario")

    else:
        print(f"\n⚠ La columna {columna} no existe en el DataFrame")



Procesando columna compleja: internet_OnlineSecurity
Valores únicos ANTES de limpieza:
internet_OnlineSecurity
No                     3498
Yes                    2019
No internet service    1526
Name: count, dtype: int64

Valores después de convertir 'No service' a 'No':
internet_OnlineSecurity
No     5024
Yes    2019
Name: count, dtype: int64

Valores DESPUÉS de conversión binaria:
internet_OnlineSecurity
0    5024
1    2019
Name: count, dtype: int64
✓ Columna internet_OnlineSecurity normalizada y convertida a binario

Procesando columna compleja: internet_OnlineBackup
Valores únicos ANTES de limpieza:
internet_OnlineBackup
No                     3088
Yes                    2429
No internet service    1526
Name: count, dtype: int64

Valores después de convertir 'No service' a 'No':
internet_OnlineBackup
No     4614
Yes    2429
Name: count, dtype: int64

Valores DESPUÉS de conversión binaria:
internet_OnlineBackup
0    4614
1    2429
Name: count, dtype: int64
✓ Columna internet_Online

In [20]:
df.sample(3)

Unnamed: 0,customerID,Churn,customer_gender,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_InternetService,...,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_Contract,account_PaperlessBilling,account_PaymentMethod,account_Charges_Monthly,account_Charges_Total
1428,2055-PDADH,1,Female,1,0,0,3,1,0,Fiber optic,...,0,0,0,0,0,Month-to-month,1,Electronic check,70.4,204.7
5655,7722-CVFXN,0,Male,0,1,1,54,1,1,Fiber optic,...,1,0,1,1,1,One year,1,Electronic check,105.2,5637.85
4969,6789-HJBWG,0,Female,0,0,0,12,1,0,DSL,...,1,0,0,0,0,Month-to-month,1,Electronic check,49.4,611.65


In [21]:
# Calculate daily charges
df['Cuentas_Diarias'] = df['account_Charges_Monthly'] / 30

# Display the monthly and daily charges for the first few rows
display(df[['account_Charges_Monthly', 'Cuentas_Diarias']].head())

# Remove the temporary 'Cuentas_Diarias' column if it's not needed later
# df_plano = df.drop('Cuentas_Diarias', axis=1, errors='ignore') # Uncomment if you want to drop the column

Unnamed: 0,account_Charges_Monthly,Cuentas_Diarias
0,65.6,2.186667
1,59.9,1.996667
2,73.9,2.463333
3,98.0,3.266667
4,83.9,2.796667


In [22]:
df.columns.tolist()[-1:]

['Cuentas_Diarias']

### Análisis Descriptivo

In [23]:
df.describe()

Unnamed: 0,Churn,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_OnlineSecurity,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_PaperlessBilling,account_Charges_Monthly,account_Charges_Total,Cuentas_Diarias
count,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7032.0,7043.0
mean,0.26537,0.162147,0.483033,0.299588,32.371149,0.903166,0.421837,0.286668,0.344881,0.343888,0.290217,0.384353,0.387903,0.592219,64.761692,2283.300441,2.158723
std,0.441561,0.368612,0.499748,0.45811,24.559481,0.295752,0.493888,0.452237,0.475363,0.475038,0.453895,0.486477,0.487307,0.491457,30.090047,2266.771362,1.003002
min,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,18.25,18.8,0.608333
25%,0.0,0.0,0.0,0.0,9.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,35.5,401.45,1.183333
50%,0.0,0.0,0.0,0.0,29.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,70.35,1397.475,2.345
75%,1.0,0.0,1.0,1.0,55.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,89.85,3794.7375,2.995
max,1.0,1.0,1.0,1.0,72.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,118.75,8684.8,3.958333


### Visualizaciones

In [24]:
pip install plotly



#### 7. Distribución de Evasión
**OBJETIVO:** Comprender la distribución de la variable "churn" (evasión) entre los clientes.

###### Recuento de Evasión por Variables Categóricas

In [25]:
# Distribución de la variable objetivo 'Churn'

import pandas as pd
import plotly.express as px

# Suponiendo que ya tienes tu DataFrame llamado df y la columna 'Churn'
# Paso 1: Contar los valores de 'Churn'
churn_counts = df['Churn'].value_counts().reset_index()
churn_counts.columns = ['Churn', 'Cantidad']

# Paso 2: Opcional - renombrar valores si son booleanos o 0/1
etiquetas = {0: 'No Evasión', 1: 'Evasión'}
churn_counts['Churn'] = churn_counts['Churn'].map(etiquetas)

# Paso 3: Crear el gráfico de pastel interactivo
fig = px.pie(
    churn_counts,
    names='Churn',             # Nombre que aparecerá en cada sector
    values='Cantidad',         # Tamaño de cada sector
    title='Distribución de Clientes con Evasión',
    color='Churn',             # Asegura que los colores estén bien asignados
    color_discrete_map={'No Evasión': 'mediumseagreen', 'Evasión': 'orchid'}, # Personalización de colores
    hole=0.4                   # Si deseas un donut chart, pon 0.4, si no, déjalo en 0
)


# Paso 4: Personalizar etiquetas y diseño
fig.update_traces(
    textinfo='label+percent',   # Muestra el nombre y porcentaje
    insidetextfont=dict(color='white', size=14)

)

fig.update_layout(
     title=dict(
        text='Distribución de Evasión',  # Título
        x=0.5,                        # Centrado (x=0.5)
        font=dict(size=20, color='white')  # Tamaño 20 y color blanco para el título
    ),
    font=dict(
        size=14,                      # Tamaño de fuente 14 para el gráfico en general
        color='white'                 # Color blanco para los textos del gráfico
    ),
    title_font_size=20,
    legend_title='Categoría',
    legend=dict(orientation="h", y=-0.1),
    margin=dict(t=50, l=50, r=50, b=50),
     # Opcional: Personaliza el fondo para que luzca más profesional (transparente en este caso)
    plot_bgcolor='rgba(0, 0, 0, 0)',
    paper_bgcolor='rgba(0, 0, 0, 0)'

)

 # Opcional: Personaliza el fondo para que luzca más profesional (transparente en este caso)


fig.show()

In [27]:
# Verifica los valores únicos en 'Churn'
print("Valores únicos en Churn antes del mapeo:", df['Churn'].unique())

# Mapea los valores de Churn, solo si son 0 o 1
df['Churn'] = df['Churn'].apply(lambda x: 'No Evasión' if x == 0 else ('Evasión' if x == 1 else x))

# Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())


# Crear el histograma con Plotly Express:
fig = px.histogram(
    df,
    x='account_Contract',                                   # Variable categórica (género en este caso)
    color='Churn',                                         # Separamos las barras por estado de Churn
    color_discrete_map={                                   # Asignamos colores personalizados
        'No Evasión': 'mediumseagreen',
        'Evasión': 'orchid'
    },
    barmode='group',                                      # Las barras se agrupan lado a lado
    title='Distribución de Evasión por Contrato',
    text_auto=True                                        # Muestra automáticamente el conteo sobre cada barra
)

fig.update_traces(
    insidetextfont=dict(color='white', size=14)
)

# Personalizamos el layout del gráfico:
fig.update_layout(
    title=dict(
        text='Distribución de Evasión por Contrato',  # Título
        x=0.5,                        # Centrado (x=0.5)
        font=dict(size=20, color='white')  # Tamaño 20 y color blanco para el título
    ),
    font=dict(
        size=14,                      # Tamaño de fuente 14 para el gráfico en general
        color='white'                 # Color blanco para los textos del gráfico
    ),
    legend=dict(
        title='Estado de Churn',      # Título de la leyenda
        font=dict(size=14, color='white')
    ),
    xaxis=dict(
        title=dict(
            text='Duración del Contrato',    # Etiqueta para el eje x
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    yaxis=dict(
        title=dict(
            text='Cantidad',              # Etiqueta para el eje y
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    # Opcional: Personaliza el fondo para que luzca más profesional (transparente en este caso)
    plot_bgcolor='rgba(0, 0, 0, 0)',
    paper_bgcolor='rgba(0, 0, 0, 0)'
)

# Muestra el gráfico de forma interactiva.
fig.show()

Valores únicos en Churn antes del mapeo: ['No Evasión' 'Evasión']
Valores únicos en Churn después del mapeo: ['No Evasión' 'Evasión']


In [28]:
px.histogram(df, x = 'account_PaymentMethod', text_auto = True, color = 'Churn',   color_discrete_map={'No Evasión': 'mediumseagreen', 'Evasión': 'orchid'}, barmode = 'group',title="Distribución de Evasión por Método de Pago")


import plotly.express as px

# Verifica los valores únicos en 'Churn'
print("Valores únicos en Churn antes del mapeo:", df['Churn'].unique())

# Mapea los valores de Churn, solo si son 0 o 1
df['Churn'] = df['Churn'].apply(lambda x: 'No Evasión' if x == 0 else ('Evasión' if x == 1 else x))

# Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())

# Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x='account_PaymentMethod',
    color='Churn',
    color_discrete_map={
        'No Evasión': 'mediumseagreen',
        'Evasión': 'orchid'
    },
    barmode='group',
    title='Distribución de Evasión por Método de Pago',
    text_auto=True
)

fig.update_traces(
    insidetextfont=dict(color='white', size=14)
)

fig.update_layout(
    title=dict(
        text='Distribución de Evasión por Método de Pago',
        x=0.5,
        font=dict(size=20, color='white')
    ),
    font=dict(
        size=14,
        color='white'
    ),
    legend=dict(
        title='Estado de Churn',
        font=dict(size=14, color='white')
    ),
    xaxis=dict(
        title=dict(
            text='Método de Pago',
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    yaxis=dict(
        title=dict(
            text='Cantidad',
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    plot_bgcolor='rgba(0, 0, 0, 0)',
    paper_bgcolor='rgba(0, 0, 0, 0)'
)

fig.show()


Valores únicos en Churn antes del mapeo: ['No Evasión' 'Evasión']
Valores únicos en Churn después del mapeo: ['No Evasión' 'Evasión']


In [31]:
import plotly.express as px

# Verifica los valores únicos en 'Churn'
print("Valores únicos en Churn antes del mapeo:", df['Churn'].unique())

# Mapea los valores de Churn, solo si son 0 o 1
# Asegurarse de que la columna Churn esté en un formato que se pueda mapear (por ejemplo, 0 o 1)
# Si ya está mapeada a 'No Evasión'/'Evasión', este paso no es necesario,
# pero lo mantenemos por si la celda se ejecuta de forma independiente.
if df['Churn'].dtype in ['int64', 'float64']:
    df['Churn'] = df['Churn'].apply(lambda x: 'No Evasión' if x == 0 else ('Evasión' if x == 1 else x))


# Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())

# Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x='account_PaperlessBilling',  # Corregido el nombre de la columna aquí
    color='Churn',
    color_discrete_map={
        'No Evasión': 'mediumseagreen',
        'Evasión': 'orchid'
    },
    barmode='group',
    title='Distribución de Evasión por Método de Facturación',
    text_auto=True
)

fig.update_traces(
    insidetextfont=dict(color='white', size=14)
)

# Actualizar etiquetas del eje X
fig.update_xaxes(
    tickvals=['No', 'Sí'],
    ticktext=['Facturación no online', 'Facturación online']
)

fig.update_layout(
    title=dict(
        text='Distribución de Evasión por Método de Facturación', # Título corregido para reflejar la variable
        x=0.5,
        font=dict(size=20, color='white')
    ),
    font=dict(
        size=14,
        color='white'
    ),
    legend=dict(
        title='Estado de Churn',
        font=dict(size=14, color='white')
    ),
    xaxis=dict(
        title=dict(
            text='Facturación Electrónica', # Etiqueta del eje X corregida
            font=dict(size=14, color='white')
        ),
        tickvals=[0, 1], # Añadido para mostrar 0 y 1 en el eje X si la columna es numérica
        ticktext=['No', 'Sí'], # Añadido para etiquetar 0 y 1 como No/Sí
        tickfont=dict(size=14, color='white')
    ),
    yaxis=dict(
        title=dict(
            text='Cantidad',
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    plot_bgcolor='rgba(0, 0, 0, 0)',
    paper_bgcolor='rgba(0, 0, 0, 0)'
)

fig.show()

Valores únicos en Churn antes del mapeo: ['No Evasión' 'Evasión']
Valores únicos en Churn después del mapeo: ['No Evasión' 'Evasión']


In [30]:
# Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())


# Crear el histograma con Plotly Express:
fig = px.histogram(
    df,
    x='customer_tenure',                                   # Variable categórica (género en este caso)
    color='Churn',                                         # Separamos las barras por estado de Churn
    color_discrete_map={                                   # Asignamos colores personalizados
        'No Evasión': 'mediumseagreen',
        'Evasión': 'orchid'
    },
    barmode='group',                                      # Las barras se agrupan lado a lado
    title='Distribución de Evasión por Meses de Permanencia del Cliente',
    text_auto=True                                        # Muestra automáticamente el conteo sobre cada barra
)

fig.update_traces(
    insidetextfont=dict(color='white', size=14)
)

# Personalizamos el layout del gráfico:
fig.update_layout(
    title=dict(
        text='Distribución de Evasión por Meses de Permanencia del Cliente',  # Título
        x=0.5,                        # Centrado (x=0.5)
        font=dict(size=20, color='white')  # Tamaño 20 y color blanco para el título
    ),
    font=dict(
        size=14,                      # Tamaño de fuente 14 para el gráfico en general
        color='white'                 # Color blanco para los textos del gráfico
    ),
    legend=dict(
        title='Estado de Churn',      # Título de la leyenda
        font=dict(size=14, color='white')
    ),
    xaxis=dict(
        title=dict(
            text='Meses de Permanencia',    # Etiqueta para el eje x
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    yaxis=dict(
        title=dict(
            text='Cantidad',              # Etiqueta para el eje y
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    # Opcional: Personaliza el fondo para que luzca más profesional (transparente en este caso)
    plot_bgcolor='rgba(0, 0, 0, 0)',
    paper_bgcolor='rgba(0, 0, 0, 0)'
)

# Muestra el gráfico de forma interactiva.
fig.show()

Valores únicos en Churn después del mapeo: ['No Evasión' 'Evasión']


In [26]:
# import plotly.express as px

# # Verifica los valores únicos en 'Churn'
print("Valores únicos en Churn antes del mapeo:", df['Churn'].unique())

# # Mapea los valores de Churn, solo si son 0 o 1
df['Churn'] = df['Churn'].apply(lambda x: 'No Evasión' if x == 0 else ('Evasión' if x == 1 else x))

# # Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())

# Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x='customer_gender',
    color='Churn',
    color_discrete_map={
        'No Evasión': 'mediumseagreen',
        'Evasión': 'orchid'
    },
    barmode='group',
    title='Comparativa de la Distribución de Evasión por Género',
    text_auto=True
)

fig.update_traces(
    insidetextfont=dict(color='white', size=14)
)

fig.update_layout(
    title=dict(
        text='Comparativa de la Distribución de Evasión por Género',
        x=0.5,
        font=dict(size=20, color='white')
    ),
    font=dict(
        size=14,
        color='white'
    ),
    legend=dict(
        title='Estado de Churn',
        font=dict(size=14, color='white')
    ),
    xaxis=dict(
        title=dict(
            text='Género del Cliente',
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    yaxis=dict(
        title=dict(
            text='Cantidad',
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    plot_bgcolor='rgba(0, 0, 0, 0)',
    paper_bgcolor='rgba(0, 0, 0, 0)'
)

fig.show()
# Verifica los valores únicos en 'Churn'
print("Valores únicos en Churn antes del mapeo:", df['Churn'].unique())

# Mapea los valores de Churn, solo si son 0 o 1
df['Churn'] = df['Churn'].apply(lambda x: 'No Evasión' if x == 0 else ('Evasión' if x == 1 else x))

# Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())

Valores únicos en Churn antes del mapeo: [0 1]
Valores únicos en Churn después del mapeo: ['No Evasión' 'Evasión']


Valores únicos en Churn antes del mapeo: ['No Evasión' 'Evasión']
Valores únicos en Churn después del mapeo: ['No Evasión' 'Evasión']


In [29]:
# Verifica los valores únicos en 'Churn'
print("Valores únicos en Churn antes del mapeo:", df['Churn'].unique())

# Mapea los valores de Churn, solo si son 0 o 1
df['Churn'] = df['Churn'].apply(lambda x: 'No Evasión' if x == 0 else ('Evasión' if x == 1 else x))

# Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())


# Crear el histograma con Plotly Express:
fig = px.histogram(
    df,
    x='customer_SeniorCitizen',                                   # Variable categórica (género en este caso)
    color='Churn',                                         # Separamos las barras por estado de Churn
    color_discrete_map={                                   # Asignamos colores personalizados
        'No Evasión': 'mediumseagreen',
        'Evasión': 'orchid'
    },
    barmode='group',                                      # Las barras se agrupan lado a lado
    title='Distribución de Evasión en Clientes por Grupo Etareo',
    text_auto=True                                        # Muestra automáticamente el conteo sobre cada barra
)

fig.update_traces(
    insidetextfont=dict(color='white', size=14)
)

# Actualizar etiquetas del eje X
fig.update_xaxes(
    tickvals=[0, 1],
    ticktext=['clientes<65', 'clientes>=65']
)


# Personalizamos el layout del gráfico:
fig.update_layout(
    title=dict(
        text='Distribución de Evasión en Clientes por Grupo Etareo',  # Título
        x=0.5,                        # Centrado (x=0.5)
        font=dict(size=20, color='white')  # Tamaño 20 y color blanco para el título
    ),
    font=dict(
        size=14,                      # Tamaño de fuente 14 para el gráfico en general
        color='white'                 # Color blanco para los textos del gráfico
    ),
    legend=dict(
        title='Estado de Churn',      # Título de la leyenda
        font=dict(size=14, color='white')
    ),
    xaxis=dict(
        title=dict(
           text= "",    # Etiqueta para el eje x
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    yaxis=dict(
        title=dict(
            text='Cantidad',              # Etiqueta para el eje y
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),

    # Opcional: Personaliza el fondo para que luzca más profesional (transparente en este caso)
    plot_bgcolor='rgba(0, 0, 0, 0)',
    paper_bgcolor='rgba(0, 0, 0, 0)'
)

# Muestra el gráfico de forma interactiva.
fig.show()

Valores únicos en Churn antes del mapeo: ['No Evasión' 'Evasión']
Valores únicos en Churn después del mapeo: ['No Evasión' 'Evasión']


In [34]:
import plotly.express as px

# Verifica los valores únicos en 'Churn'
print("Valores únicos en Churn antes del mapeo:", df['Churn'].unique())

# Mapea los valores de Churn, solo si son 0 o 1
# Asegurarse de que la columna Churn esté en un formato que se pueda mapear (por ejemplo, 0 o 1)
# Si ya está mapeada a 'No Evasión'/'Evasión', este paso no es necesario,
# pero lo mantenemos por si la celda se ejecuta de forma independiente.
if df['Churn'].dtype in ['int64', 'float64']:
    df['Churn'] = df['Churn'].apply(lambda x: 'No Evasión' if x == 0 else ('Evasión' if x == 1 else x))


# Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())

# Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x='customer_Partner',  # Corrected the column name here
    color='Churn',
    color_discrete_map={
        'No Evasión': 'mediumseagreen',
        'Evasión': 'orchid'
    },
    barmode='group',
    title='Distribución de Evasión por Relación de Pareja', # Corrected the title to reflect the variable
    text_auto=True
)

fig.update_traces(
    insidetextfont=dict(color='white', size=14)
)

# Update X-axis labels based on the values (0 and 1)
fig.update_xaxes(
    tickvals=[0, 1],
    ticktext=['No tiene pareja', 'Tiene pareja']
)


fig.update_layout(
    title=dict(
        text='Distribución de Evasión por Relación de Pareja', # Title corrected to reflect the variable
        x=0.5,
        font=dict(size=20, color='white')
    ),
    font=dict(
        size=14,
        color='white'
    ),
    legend=dict(
        title='Estado de Churn',
        font=dict(size=14, color='white')
    ),
    xaxis=dict(
        title=dict(
            text='Relación de Pareja', # Corrected X-axis label
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    yaxis=dict(
        title=dict(
            text='Cantidad',
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    plot_bgcolor='rgba(0, 0, 0, 0)',
    paper_bgcolor='rgba(0, 0, 0, 0)'
)

fig.show()

Valores únicos en Churn antes del mapeo: ['No Evasión' 'Evasión']
Valores únicos en Churn después del mapeo: ['No Evasión' 'Evasión']


In [41]:
import plotly.express as px

# Verifica los valores únicos en 'Churn'
print("Valores únicos en Churn antes del mapeo:", df['Churn'].unique())

# Mapea los valores de Churn, solo si son 0 o 1
# Asegurarse de que la columna Churn esté en un formato que se pueda mapear (por ejemplo, 0 o 1)
# Si ya está mapeada a 'No Evasión'/'Evasión', este paso no es necesario,
# pero lo mantenemos por si la celda se ejecuta de forma independiente.
if df['Churn'].dtype in ['int64', 'float64']:
    df['Churn'] = df['Churn'].apply(lambda x: 'No Evasión' if x == 0 else ('Evasión' if x == 1 else x))


# Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())

# Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x='customer_Dependents',  # Corrected the column name here
    color='Churn',
    color_discrete_map={
        'No Evasión': 'mediumseagreen',
        'Evasión': 'orchid'
    },
    barmode='group',
    title='Distribución de Evasión de Clientes según Presencia de Dependientes', # Corrected the title to reflect the variable
    text_auto=True
)

fig.update_traces(
    insidetextfont=dict(color='white', size=14)
)

#Update X-axis labels based on the values (0 and 1)
fig.update_xaxes(
    tickvals=[0, 1],
    ticktext=['No', 'Sí']
)


fig.update_layout(
    title=dict(
        text='Distribución de Evasión de Clientes Según Presencia de Dependientes', # Title corrected to reflect the variable
        x=0.5,
        font=dict(size=20, color='white')
    ),
    font=dict(
        size=14,
        color='white'
    ),
    legend=dict(
        title='Estado de Churn',
        font=dict(size=14, color='white')
    ),
    xaxis=dict(
        title=dict(
            text='Personas Dependientes', # Corrected X-axis label
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    yaxis=dict(
        title=dict(
            text='Cantidad',
            font=dict(size=14, color='white')
        ),
        tickfont=dict(size=14, color='white')
    ),
    plot_bgcolor='rgba(0, 0, 0, 0)',
    paper_bgcolor='rgba(0, 0, 0, 0)'
)

fig.show()

Valores únicos en Churn antes del mapeo: ['No Evasión' 'Evasión']
Valores únicos en Churn después del mapeo: ['No Evasión' 'Evasión']


#### 9. Correlaciones
- Identificar relaciones entre variables al final del proceso.

In [None]:
 # 9. Relaciones entre variables numéricas
df.select_dtypes(include='number').corr()  # Matriz de correlación
#Grafico de correlación
sns.heatmap(df.select_dtypes(include='number').corr(), annot=True, cmap='coolwarm')
plt.show()

In [None]:
#analiza la distribución para variables clave (tenure, charges)
#Hace un análisis de distribución para variables claves (tenure, charges)


In [None]:
#Graficar correlaciones con la variable objetivo (Churn)


#📄Informe final