<a href="https://colab.research.google.com/github/marelycarcamo/challenge2-TelecomX/blob/main/TelecomX_LATAM.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---
# **DESAFIO TELECOMX LATAM**
---

## Descripción del Proyecto

Has sido contratado como asistente de análisis de datos en Telecom X y formarás parte del proyecto "Churn de Clientes". La empresa enfrenta una alta tasa de cancelaciones y necesita comprender los factores que llevan a la pérdida de clientes.

Tu desafío será recopilar, procesar y analizar los datos, utilizando Python y sus principales bibliotecas para extraer información valiosa. A partir de tu análisis, el equipo de Data Science podrá avanzar en modelos predictivos y desarrollar estrategias para reducir la evasión.

### Objetivo: Análisis de Evasión de Clientes

---
#📌 Extracción
---

### Obtener Datos
Importar los datos de la API de Telecom X. Estos datos están disponibles en formato JSON y contienen información esencial sobre los clientes, incluyendo datos demográficos, tipo de servicio contratado y estado de evasión.

In [386]:
from sys import version
#Importar librerías
import requests
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import plotly
from plotly import express as px
import warnings
warnings.filterwarnings('ignore')

print('Versión Python:', version)
print('Versión Pandas:', pd.__version__)
print('Versión Numpy:', np.__version__)
print('Versión Matplotlib:', plt.matplotlib.__version__)
print('Versión Plotly:', plotly.__version__)


Versión Python: 3.11.13 (main, Jun  4 2025, 08:57:29) [GCC 11.4.0]
Versión Pandas: 2.2.2
Versión Numpy: 2.0.2
Versión Matplotlib: 3.10.0
Versión Plotly: 5.24.1


In [387]:
url = 'https://raw.githubusercontent.com/marelycarcamo/challenge2-TelecomX/refs/heads/main/TelecomX_Data.json'
response = requests.get(url)
datos_json = response.json()
datos_json[0]

{'customerID': '0002-ORFBO',
 'Churn': 'No',
 'customer': {'gender': 'Female',
  'SeniorCitizen': 0,
  'Partner': 'Yes',
  'Dependents': 'Yes',
  'tenure': 9},
 'phone': {'PhoneService': 'Yes', 'MultipleLines': 'No'},
 'internet': {'InternetService': 'DSL',
  'OnlineSecurity': 'No',
  'OnlineBackup': 'Yes',
  'DeviceProtection': 'No',
  'TechSupport': 'Yes',
  'StreamingTV': 'Yes',
  'StreamingMovies': 'No'},
 'account': {'Contract': 'One year',
  'PaperlessBilling': 'Yes',
  'PaymentMethod': 'Mailed check',
  'Charges': {'Monthly': 65.6, 'Total': '593.3'}}}

#### **Objetivo**
Analizar las relaciones, distribuciones y calidad de los datos tabulares.

#### Crear un Dataframe
Aplanar el dataset creando el dataframe.

In [388]:
# 1. Crear DataFrame
df = pd.json_normalize(datos_json, sep='_')

---
#🔧 Transformación
---

#### 1. Primer Vistazo a los Datos.
Comprender la estructura básica de los datos con los 5 primeros registros.

In [389]:
# Visualizar 10 registros para comprender su estructura.
df.sample(10)

Unnamed: 0,customerID,Churn,customer_gender,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_InternetService,...,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_Contract,account_PaperlessBilling,account_PaymentMethod,account_Charges_Monthly,account_Charges_Total
3584,4937-QPZPO,No,Male,0,Yes,Yes,61,Yes,Yes,Fiber optic,...,No,Yes,No,Yes,Yes,One year,Yes,Electronic check,99.9,6241.35
3481,4816-OKWNX,No,Male,0,Yes,Yes,50,Yes,No,Fiber optic,...,Yes,Yes,Yes,Yes,Yes,One year,Yes,Bank transfer (automatic),103.4,5236.4
2995,4154-AQUGT,Yes,Male,1,Yes,No,13,Yes,No,Fiber optic,...,Yes,No,Yes,No,Yes,Month-to-month,Yes,Bank transfer (automatic),89.05,1169.35
4152,5693-PIPCS,No,Male,0,No,No,41,Yes,No,Fiber optic,...,Yes,No,Yes,Yes,Yes,Two year,Yes,Credit card (automatic),99.65,4220.35
2650,3692-JHONH,No,Female,1,Yes,No,52,Yes,Yes,Fiber optic,...,Yes,Yes,No,Yes,Yes,One year,Yes,Electronic check,106.5,5621.85
2239,3129-AAQOU,No,Female,0,Yes,Yes,19,Yes,Yes,No,...,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Mailed check,25.6,485.9
5026,6872-HXFNF,No,Female,0,Yes,No,64,Yes,Yes,DSL,...,No,Yes,Yes,No,No,One year,No,Bank transfer (automatic),58.35,3756.45
3291,4587-NUKOX,Yes,Female,0,No,No,3,Yes,No,Fiber optic,...,Yes,No,No,No,No,Month-to-month,Yes,Electronic check,79.1,246.5
5674,7753-USQYQ,No,Male,0,No,No,55,Yes,No,DSL,...,Yes,No,Yes,No,Yes,One year,Yes,Electronic check,64.2,3627.3
6828,9415-DPEWS,Yes,Female,0,No,No,18,Yes,Yes,Fiber optic,...,No,No,Yes,Yes,No,Month-to-month,Yes,Electronic check,88.35,1639.3


#### 3. **Conocer Tipo de Datos**
- Identificar formato de variables y primeros indicios de nulos.
- **Resultado:** float64(1), int64(2), object(18).

In [390]:
# 3. Verificar tipos de datos y nulos por columna
print(f"\nDimensiones: {df.shape[0]} filas, {df.shape[1]} columnas\n")
df.info()


Dimensiones: 7267 filas, 21 columnas

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7267 entries, 0 to 7266
Data columns (total 21 columns):
 #   Column                     Non-Null Count  Dtype  
---  ------                     --------------  -----  
 0   customerID                 7267 non-null   object 
 1   Churn                      7267 non-null   object 
 2   customer_gender            7267 non-null   object 
 3   customer_SeniorCitizen     7267 non-null   int64  
 4   customer_Partner           7267 non-null   object 
 5   customer_Dependents        7267 non-null   object 
 6   customer_tenure            7267 non-null   int64  
 7   phone_PhoneService         7267 non-null   object 
 8   phone_MultipleLines        7267 non-null   object 
 9   internet_InternetService   7267 non-null   object 
 10  internet_OnlineSecurity    7267 non-null   object 
 11  internet_OnlineBackup      7267 non-null   object 
 12  internet_DeviceProtection  7267 non-null   object 
 13  internet_

In [391]:
#### Corrección de nombres de columnas
df = df.rename(columns={
    'internet_StreamingWovies': 'internet_StreamingMovies',
    'customer_Dependency': 'customer_Dependents',
    'phone_PhonesService': 'phone_PhoneService'
})

df.columns.tolist()

['customerID',
 'Churn',
 'customer_gender',
 'customer_SeniorCitizen',
 'customer_Partner',
 'customer_Dependents',
 'customer_tenure',
 'phone_PhoneService',
 'phone_MultipleLines',
 'internet_InternetService',
 'internet_OnlineSecurity',
 'internet_OnlineBackup',
 'internet_DeviceProtection',
 'internet_TechSupport',
 'internet_StreamingTV',
 'internet_StreamingMovies',
 'account_Contract',
 'account_PaperlessBilling',
 'account_PaymentMethod',
 'account_Charges_Monthly',
 'account_Charges_Total']

In [392]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7267 entries, 0 to 7266
Data columns (total 21 columns):
 #   Column                     Non-Null Count  Dtype  
---  ------                     --------------  -----  
 0   customerID                 7267 non-null   object 
 1   Churn                      7267 non-null   object 
 2   customer_gender            7267 non-null   object 
 3   customer_SeniorCitizen     7267 non-null   int64  
 4   customer_Partner           7267 non-null   object 
 5   customer_Dependents        7267 non-null   object 
 6   customer_tenure            7267 non-null   int64  
 7   phone_PhoneService         7267 non-null   object 
 8   phone_MultipleLines        7267 non-null   object 
 9   internet_InternetService   7267 non-null   object 
 10  internet_OnlineSecurity    7267 non-null   object 
 11  internet_OnlineBackup      7267 non-null   object 
 12  internet_DeviceProtection  7267 non-null   object 
 13  internet_TechSupport       7267 non-null   objec

In [393]:
df.head()

Unnamed: 0,customerID,Churn,customer_gender,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_InternetService,...,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_Contract,account_PaperlessBilling,account_PaymentMethod,account_Charges_Monthly,account_Charges_Total
0,0002-ORFBO,No,Female,0,Yes,Yes,9,Yes,No,DSL,...,Yes,No,Yes,Yes,No,One year,Yes,Mailed check,65.6,593.3
1,0003-MKNFE,No,Male,0,No,No,9,Yes,Yes,DSL,...,No,No,No,No,Yes,Month-to-month,No,Mailed check,59.9,542.4
2,0004-TLHLJ,Yes,Male,0,No,No,4,Yes,No,Fiber optic,...,No,Yes,No,No,No,Month-to-month,Yes,Electronic check,73.9,280.85
3,0011-IGKFF,Yes,Male,1,Yes,No,13,Yes,No,Fiber optic,...,Yes,Yes,No,Yes,Yes,Month-to-month,Yes,Electronic check,98.0,1237.85
4,0013-EXCHZ,Yes,Female,1,Yes,No,3,Yes,No,Fiber optic,...,No,No,Yes,Yes,No,Month-to-month,Yes,Mailed check,83.9,267.4


In [394]:
# Función de limpieza

def generar_reporte_limpieza(df):
    reporte = {}

    filas, columnas = df.shape
    reporte['filas'], reporte['columnas'] = filas, columnas

    # Valores nulos
    nulos = df.isnull().sum()
    reporte['nulos'] = nulos.to_dict()

    # Celdas vacías (evitando FutureWarning)
    vacíos = df.apply(lambda col: col.astype(str).map(lambda x: x.strip() == '')).sum()
    reporte['vacíos'] = vacíos.to_dict()

    # Duplicados
    duplicados = df.duplicated().sum()
    reporte['duplicados'] = duplicados

    # Tipos de datos
    tipos = df.dtypes.apply(str)
    reporte['tipos_de_dato'] = tipos.to_dict()

    # Valores únicos
    únicos = df.nunique()
    reporte['valores_únicos'] = únicos.to_dict()

    # Filas completamente vacías
    filas_vacías = df.isnull().all(axis=1).sum()
    reporte['filas_completamente_vacías'] = filas_vacías

    # Informe
    print("===== REPORTE DE LIMPIEZA =====")
    print(f"Dimensiones del DataFrame: {filas} filas x {columnas} columnas\n")

    print("Valores nulos por columna:")
    for col, count in nulos.items():
        print(f"  {col}: {count}")

    print("\nCeldas vacías por columna:")
    for col, count in vacíos.items():
        print(f"  {col}: {count}")

    print(f"\nFilas duplicadas: {duplicados}")

    print("\nTipos de datos:")
    for col, tipo in tipos.items():
        print(f"  {col}: {tipo}")

    print("\nValores únicos por columna:")
    for col, count in únicos.items():
        print(f"  {col}: {count}")



    filas, columnas = df.shape
    reporte['filas'], reporte['columnas'] = filas, columnas

    # Valores nulos
    nulos = df.isnull().sum()
    columnas_con_nulos = nulos[nulos > 0]
    reporte['nulos'] = nulos.to_dict()

    # Celdas vacías
    vacíos = df.apply(lambda col: col.astype(str).map(lambda x: x.strip() == '')).sum()
    columnas_con_vacíos = vacíos[vacíos > 0]
    reporte['vacíos'] = vacíos.to_dict()

    # Duplicados fila completa
    duplicados = df.duplicated().sum()
    reporte['duplicados'] = duplicados

    # Tipos de datos y valores únicos
    reporte['tipos_de_dato'] = df.dtypes.apply(str).to_dict()
    reporte['valores_únicos'] = df.nunique().to_dict()

    # Filas completamente vacías
    filas_vacías = df.isnull().all(axis=1).sum()
    reporte['filas_completamente_vacías'] = filas_vacías

    # ==== Impresión de resumen amigable ====
    print("\n\n===== RESUMEN DEL ANÁLISIS 🕵🏻=====")
    if duplicados > 0:
        print(f"- Se encontraron {duplicados} filas duplicadas ➤ df.drop_duplicates(inplace=True)")

    if not columnas_con_nulos.empty:
        print(f"- {len(columnas_con_nulos)} columnas contienen valores nulos:")
        for col in columnas_con_nulos.index:
            print(f"   • {col}: {columnas_con_nulos[col]} nulos")


    if not columnas_con_vacíos.empty:
        print(f"- {len(columnas_con_vacíos)} columnas contienen celdas vacías (espacios o texto vacío):")
        for col in columnas_con_vacíos.index:
            print(f"   • {col}: {columnas_con_vacíos[col]} vacíos")


    if filas_vacías > 0:
        print(f"- Hay {filas_vacías} filas completamente vacías ➤ df.dropna(how='all', inplace=True)")

    if duplicados == 0 and filas_vacías == 0 and columnas_con_nulos.empty and columnas_con_vacíos.empty:
        print("- No se encontraron problemas. ¡El dataset está limpio y listo para usar! 🎉")
    return reporte

In [395]:
#Generar reporte con la función 'generar_reporte_limpieza'
reporte = generar_reporte_limpieza(df)

===== REPORTE DE LIMPIEZA =====
Dimensiones del DataFrame: 7267 filas x 21 columnas

Valores nulos por columna:
  customerID: 0
  Churn: 0
  customer_gender: 0
  customer_SeniorCitizen: 0
  customer_Partner: 0
  customer_Dependents: 0
  customer_tenure: 0
  phone_PhoneService: 0
  phone_MultipleLines: 0
  internet_InternetService: 0
  internet_OnlineSecurity: 0
  internet_OnlineBackup: 0
  internet_DeviceProtection: 0
  internet_TechSupport: 0
  internet_StreamingTV: 0
  internet_StreamingMovies: 0
  account_Contract: 0
  account_PaperlessBilling: 0
  account_PaymentMethod: 0
  account_Charges_Monthly: 0
  account_Charges_Total: 0

Celdas vacías por columna:
  customerID: 0
  Churn: 224
  customer_gender: 0
  customer_SeniorCitizen: 0
  customer_Partner: 0
  customer_Dependents: 0
  customer_tenure: 0
  phone_PhoneService: 0
  phone_MultipleLines: 0
  internet_InternetService: 0
  internet_OnlineSecurity: 0
  internet_OnlineBackup: 0
  internet_DeviceProtection: 0
  internet_TechSuppor

In [396]:
# Vacíos o en blanco
df.apply(lambda x: x.astype(str).str.strip() == '').sum()

Unnamed: 0,0
customerID,0
Churn,224
customer_gender,0
customer_SeniorCitizen,0
customer_Partner,0
customer_Dependents,0
customer_tenure,0
phone_PhoneService,0
phone_MultipleLines,0
internet_InternetService,0


In [397]:
#Cambiando la columna "account.Charges.Total" a Float

df['account_Charges_Total'] = pd.to_numeric(df['account_Charges_Total'], errors='coerce')
print(df['account_Charges_Total'].dtype)

float64


In [398]:
# Eliminando los registros de Churn

df = df[df['Churn'].str.strip() != '']
print("Número de filas después de eliminar las vacías en 'Churn':", len(df))

Número de filas después de eliminar las vacías en 'Churn': 7043


In [399]:
# Verificar vacios en columna Churn y columna account_Changes_Total
# Vacíos o en blanco
df.apply(lambda x: x.astype(str).str.strip() == '').sum()

Unnamed: 0,0
customerID,0
Churn,0
customer_gender,0
customer_SeniorCitizen,0
customer_Partner,0
customer_Dependents,0
customer_tenure,0
phone_PhoneService,0
phone_MultipleLines,0
internet_InternetService,0


In [400]:
# Contar los valores únicos en cada columna
print(df.nunique())

customerID                   7043
Churn                           2
customer_gender                 2
customer_SeniorCitizen          2
customer_Partner                2
customer_Dependents             2
customer_tenure                73
phone_PhoneService              2
phone_MultipleLines             3
internet_InternetService        3
internet_OnlineSecurity         3
internet_OnlineBackup           3
internet_DeviceProtection       3
internet_TechSupport            3
internet_StreamingTV            3
internet_StreamingMovies        3
account_Contract                3
account_PaperlessBilling        2
account_PaymentMethod           4
account_Charges_Monthly      1585
account_Charges_Total        6530
dtype: int64


In [401]:
# =============================================================================
# 1. CONVERSIÓN DE COLUMNAS DE "SÍ/NO" A BINARIAS (1/0)
# =============================================================================

# Lista de columnas que contienen respuestas de Sí/No que queremos convertir
columnas_binarias = [
    'Churn',                   # ¿Abandonó el cliente?
    'customer_Partner',        # ¿Tiene pareja?
    'customer_Dependents',     # ¿Tiene dependientes?
    'phone_PhoneService',      # ¿Tiene servicio telefónico?
    'account_PaperlessBilling' # ¿Usa facturación digital?
]

# Recorremos cada columna en la lista
for columna in columnas_binarias:

    # Verificamos si la columna existe en el dataframe
    if columna in df.columns:

        # Antes de cambiar, mostramos cómo lucen los valores originales
        print(f"\nValores únicos en '{columna}' ANTES de conversión:")
        print(df[columna].value_counts(dropna=False))

        # Aplicamos la conversión a binario
        # - Donde diga "Yes" ponemos 1
        # - Donde diga "No" ponemos 0
        df[columna] = df[columna].map({'Yes': 1, 'No': 0})

        # Mostramos los resultados después del cambio
        print(f"\nValores únicos en '{columna}' DESPUÉS de conversión:")
        print(df[columna].value_counts(dropna=False))
        print(f"✓ Columna '{columna}' convertida a binario")

    else:
        print(f"\n⚠ Advertencia: La columna '{columna}' no existe en el dataframe")


Valores únicos en 'Churn' ANTES de conversión:
Churn
No     5174
Yes    1869
Name: count, dtype: int64

Valores únicos en 'Churn' DESPUÉS de conversión:
Churn
0    5174
1    1869
Name: count, dtype: int64
✓ Columna 'Churn' convertida a binario

Valores únicos en 'customer_Partner' ANTES de conversión:
customer_Partner
No     3641
Yes    3402
Name: count, dtype: int64

Valores únicos en 'customer_Partner' DESPUÉS de conversión:
customer_Partner
0    3641
1    3402
Name: count, dtype: int64
✓ Columna 'customer_Partner' convertida a binario

Valores únicos en 'customer_Dependents' ANTES de conversión:
customer_Dependents
No     4933
Yes    2110
Name: count, dtype: int64

Valores únicos en 'customer_Dependents' DESPUÉS de conversión:
customer_Dependents
0    4933
1    2110
Name: count, dtype: int64
✓ Columna 'customer_Dependents' convertida a binario

Valores únicos en 'phone_PhoneService' ANTES de conversión:
phone_PhoneService
Yes    6361
No      682
Name: count, dtype: int64

Valores ú

In [402]:
df.sample(3)

Unnamed: 0,customerID,Churn,customer_gender,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_InternetService,...,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_Contract,account_PaperlessBilling,account_PaymentMethod,account_Charges_Monthly,account_Charges_Total
5588,7636-OWBPG,0,Male,1,0,0,12,0,No phone service,DSL,...,Yes,No,No,No,No,Month-to-month,1,Credit card (automatic),29.35,381.2
845,1200-TUZHR,0,Female,1,0,0,8,1,Yes,Fiber optic,...,No,No,No,No,Yes,Month-to-month,0,Electronic check,85.2,695.75
4260,5857-TYBCJ,0,Male,1,1,0,44,1,Yes,Fiber optic,...,No,Yes,No,Yes,No,Month-to-month,1,Electronic check,89.2,4040.2


In [403]:
# =============================================================================
# MANEJO DE COLUMNAS CON MÚLTIPLES VALORES (YES/NO/NO SERVICE)
# =============================================================================

"""
Problema:
- Algunas columnas como servicios adicionales tienen 3 valores posibles:
  • "Yes" (tiene el servicio adicional)
  • "No" (no tiene el servicio adicional)
  • "No internet service" (no tiene servicio base de internet)

Solución:
1. Identificar las columnas problemáticas
2. Convertir "No internet service" a "No" (0) porque:
   - Si no tiene el servicio base, es equivalente a no tener el servicio adicional
   - Mantiene la lógica binaria
3. Luego aplicar la conversión estándar a binario
"""

# Lista de columnas con valores múltiples (basado en tu análisis previo)
columnas_multivalor = [
    'internet_OnlineSecurity',
    'internet_OnlineBackup',
    'internet_DeviceProtection',
    'internet_TechSupport',
    'internet_StreamingTV',
    'internet_StreamingMovies',
    'phone_MultipleLines'  # Esta puede tener "No phone service"
]

# Recorremos cada columna problemática
for columna in columnas_multivalor:

    # Verificamos si la columna existe
    if columna in df.columns:

        print(f"\nProcesando columna compleja: {columna}")
        print("Valores únicos ANTES de limpieza:")
        print(df[columna].value_counts(dropna=False))

        # Paso 1: Convertir valores de "no service" a "No"
        # - Esto normaliza las respuestas
        df[columna] = df[columna].replace({
            'No internet service': 'No',
            'No phone service': 'No',
        })

        print("\nValores después de convertir 'No service' a 'No':")
        print(df[columna].value_counts(dropna=False))

        # Paso 2: Ahora aplicamos la conversión binaria estándar
        df[columna] = df[columna].map({'Yes': 1, 'No': 0})

        print("\nValores DESPUÉS de conversión binaria:")
        print(df[columna].value_counts(dropna=False))
        print(f"✓ Columna {columna} normalizada y convertida a binario")

    else:
        print(f"\n⚠ La columna {columna} no existe en el DataFrame")



Procesando columna compleja: internet_OnlineSecurity
Valores únicos ANTES de limpieza:
internet_OnlineSecurity
No                     3498
Yes                    2019
No internet service    1526
Name: count, dtype: int64

Valores después de convertir 'No service' a 'No':
internet_OnlineSecurity
No     5024
Yes    2019
Name: count, dtype: int64

Valores DESPUÉS de conversión binaria:
internet_OnlineSecurity
0    5024
1    2019
Name: count, dtype: int64
✓ Columna internet_OnlineSecurity normalizada y convertida a binario

Procesando columna compleja: internet_OnlineBackup
Valores únicos ANTES de limpieza:
internet_OnlineBackup
No                     3088
Yes                    2429
No internet service    1526
Name: count, dtype: int64

Valores después de convertir 'No service' a 'No':
internet_OnlineBackup
No     4614
Yes    2429
Name: count, dtype: int64

Valores DESPUÉS de conversión binaria:
internet_OnlineBackup
0    4614
1    2429
Name: count, dtype: int64
✓ Columna internet_Online

In [404]:
# Crear la nueva columna binaria para 'tiene_Fibra_Optica'
df['tiene_Fibra_Optica'] = df['internet_InternetService'].apply(lambda x: 1 if x == 'Fiber optic' else 0)

# Mostrar los primeros registros con la nueva columna para verificar
display(df[['internet_InternetService', 'tiene_Fibra_Optica']].sample(5))


Unnamed: 0,internet_InternetService,tiene_Fibra_Optica
4958,Fiber optic,1
5181,No,0
269,Fiber optic,1
2426,DSL,0
6650,Fiber optic,1


In [405]:
df.sample(3)

Unnamed: 0,customerID,Churn,customer_gender,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_InternetService,...,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_Contract,account_PaperlessBilling,account_PaymentMethod,account_Charges_Monthly,account_Charges_Total,tiene_Fibra_Optica
387,0559-CKHUS,0,Female,0,1,0,29,1,0,No,...,0,0,0,0,Two year,1,Mailed check,19.55,521.8,0
6682,9190-MFJLN,1,Male,1,0,0,19,1,0,Fiber optic,...,1,0,1,1,Month-to-month,1,Credit card (automatic),95.9,1777.9,1
4593,6295-OSINB,0,Male,0,1,0,72,1,1,Fiber optic,...,1,0,1,1,Two year,1,Electronic check,109.65,7880.25,1


In [406]:
# Calculate daily charges
df['Cuentas_Diarias'] = df['account_Charges_Monthly'] / 30

# Display the monthly and daily charges for the first few rows
display(df[['account_Charges_Monthly', 'Cuentas_Diarias']].head())

# Remove the temporary 'Cuentas_Diarias' column if it's not needed later
# df_plano = df.drop('Cuentas_Diarias', axis=1, errors='ignore') # Uncomment if you want to drop the column

Unnamed: 0,account_Charges_Monthly,Cuentas_Diarias
0,65.6,2.186667
1,59.9,1.996667
2,73.9,2.463333
3,98.0,3.266667
4,83.9,2.796667


In [407]:
print('Se encuentra creada la columna', df.columns.tolist()[21])
df.Cuentas_Diarias.head()

Se encuentra creada la columna tiene_Fibra_Optica


Unnamed: 0,Cuentas_Diarias
0,2.186667
1,1.996667
2,2.463333
3,3.266667
4,2.796667


In [408]:
# Mapeo churn
df.columns = df.columns.str.strip()
  # Verifica los valores únicos en 'Churn'
print("Valores únicos en Churn antes del mapeo:", df['Churn'].unique())

# Mapea los valores de Churn, solo si son 0 o 1
df['Churn'] = df['Churn'].apply(lambda x: 'Sin Evasión' if x == 0 else ('Evasión' if x == 1 else x))

# Verifica los valores únicos después del mapeo
print("Valores únicos en Churn después del mapeo:", df['Churn'].unique())

Valores únicos en Churn antes del mapeo: [0 1]
Valores únicos en Churn después del mapeo: ['Sin Evasión' 'Evasión']


#📊 Carga y análisis

### Análisis Descriptivo

In [409]:
df.describe()

Unnamed: 0,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure,phone_PhoneService,phone_MultipleLines,internet_OnlineSecurity,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_PaperlessBilling,account_Charges_Monthly,account_Charges_Total,tiene_Fibra_Optica,Cuentas_Diarias
count,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7043.0,7032.0,7043.0,7043.0
mean,0.162147,0.483033,0.299588,32.371149,0.903166,0.421837,0.286668,0.344881,0.343888,0.290217,0.384353,0.387903,0.592219,64.761692,2283.300441,0.439585,2.158723
std,0.368612,0.499748,0.45811,24.559481,0.295752,0.493888,0.452237,0.475363,0.475038,0.453895,0.486477,0.487307,0.491457,30.090047,2266.771362,0.496372,1.003002
min,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,18.25,18.8,0.0,0.608333
25%,0.0,0.0,0.0,9.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,35.5,401.45,0.0,1.183333
50%,0.0,0.0,0.0,29.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,70.35,1397.475,0.0,2.345
75%,0.0,1.0,1.0,55.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,89.85,3794.7375,1.0,2.995
max,1.0,1.0,1.0,72.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,118.75,8684.8,1.0,3.958333


### Visualizaciones

In [410]:
# Paleta de Colores
paleta_colores = {'Sin Evasión': 'mediumseagreen' , 'Evasión': 'orchid'}

In [411]:
# Diccionario Global de Mapeos
mapeos_ticks = {
    'account_Contract': {
        'tickvals': ['Month-to-month', 'One year', 'Two year'],
        'ticktext': ['Mensual', 'Un año', 'Dos años']
    },
    'account_PaymentMethod': {
        'tickvals': [
            'Electronic check', 'Mailed check',
            'Bank transfer (automatic)', 'Credit card (automatic)'
        ],
        'ticktext': [
            'Cheque Electrónico', 'Cheque por Correo',
            'Transferencia Bancaria', 'Tarjeta de Crédito'
        ]
    },
    'account_PaperlessBilling': {
        'tickvals': [0, 1],
        'ticktext': ['Facturación Tradicional', 'Facturación Electrónica']
    },
    'customer_gender': {
        'tickvals': ['Male', 'Female'],
        'ticktext': ['Hombre', 'Mujer']
    },
    'customer_SeniorCitizen': {
        'tickvals': [0, 1],
        'ticktext': ['Menor de 65', 'Mayor o igual a 65']
    },
    'customer_Partner': {
        'tickvals': [0, 1],
        'ticktext': ['Sin Pareja', 'Con Pareja']
    },
    'customer_Dependents': {
        'tickvals': [0, 1],
        'ticktext': ['Sin Dependientes', 'Con Dependientes']
    },
    'internet_InternetService': {
        'tickvals': ['DSL', 'Fiber optic', 'No'],
        'ticktext': ['DSL', 'Fibra Óptica', 'Sin Internet']
    },
    'internet_OnlineSecurity': {
        'tickvals': [0, 1],
        'ticktext': ['Servicio Inactivo', 'Servicio Contratado']
    },
    'internet_OnlineBackup': {
        'tickvals': [0, 1],
        'ticktext': ['Servicio Inactivo', 'Servicio Contratado']
    },
    'internet_DeviceProtection': {
        'tickvals': [0, 1],
        'ticktext': ['Servicio Inactivo', 'Servicio Contratado']
    },
    'internet_TechSupport': {
        'tickvals': [0, 1],
        'ticktext': ['Servicio Inactivo', 'Servicio Contratado']
    },
    'internet_StreamingTV': {
        'tickvals': [0, 1],
        'ticktext': ['Servicio Inactivo', 'Servicio Contratado']
    },
    'internet_StreamingMovies': {
        'tickvals': [0, 1],
        'ticktext': ['Servicio Inactivo', 'Servicio Contratado']
    },
    'phone_PhoneService': {
        'tickvals': [0, 1],
        'ticktext': ['Servicio Inactivo', 'Servicio Contratado']
    },
    'phone_MultipleLines': {
        'tickvals': [0, 1],
        'ticktext': ['Servicio Inactivo', 'Servicio Contratado']
    }

}

In [412]:
# Función Auxiliar de traducción
def traducir_ticks(fig, columna):
    if columna in mapeos_ticks:
        fig.update_xaxes(
            tickvals=mapeos_ticks[columna]['tickvals'],
            ticktext=mapeos_ticks[columna]['ticktext']
        )
    return fig

In [413]:
# Función Estilo de Gráficos


def aplicar_estilo_figura(fig, titulo, titulo_eje_x='', titulo_eje_y=''):


    fig.update_layout(
        title=dict(
            text=titulo,
            x=0.5,
            font=dict(size=20, color='#222222')
        ),
        font=dict(size=14, color='#222222'),
        legend=dict(
            title='Estado de Evasión',
            font=dict(size=14, color='#222222')
        ),
        xaxis=dict(
            title=dict(text=titulo_eje_x, font=dict(size=14, color='#222222')),
            tickfont=dict(size=14, color='#222222'),
            linecolor='#999999',
            gridcolor='#DDDDDD'
        ),
        yaxis=dict(
            title=dict(text=titulo_eje_y, font=dict(size=14, color='#222222')),
            tickfont=dict(size=14, color='#222222'),
            linecolor='#999999',
            gridcolor='#DDDDDD'
        ),
        plot_bgcolor='white',
        paper_bgcolor='white',
        margin=dict(t=60, l=40, r=40, b=40)
    )
    fig.update_traces(insidetextfont=dict(color='white', size=14))
    return fig

#### 7. Distribución de Evasión
**OBJETIVO:** Comprender la distribución de la variable "churn" (evasión) entre los clientes.

###### Recuento de Evasión por Variables Categóricas

In [414]:
# Calculate the counts of each Churn category
churn_counts = df['Churn'].value_counts().reset_index()
churn_counts.columns = ['Churn', 'Cantidad']

#Crear el gráfico de pastel interactivo
fig = px.pie(
    churn_counts,
    names='Churn',             # Nombre que aparecerá en cada sector
    values='Cantidad',         # Tamaño de cada sector
    title='Distribución del Total de Clientes con Evasión',
    color='Churn',
    color_discrete_map= paleta_colores,
    hole=0.4                   # donut chart
)


# Personalizar etiquetas y diseño
fig.update_traces(
    textinfo='label+percent',   # Muestra el nombre y porcentaje
    insidetextfont=dict(color = 'white', size=14)

)

fig.update_layout(
     title=dict(
        text='Evasión del Total de Clientes de LatamX',
        x=0.5,                        # Centrado
        font=dict(size=20, color= '#444444')
    ),
    font=dict(
        size=14,
        color= '#444444'
    ),
    title_font_size=20,
    legend_title='Categoría',
    legend=dict(orientation="h", y=-0.1),
    margin=dict(t=50, l=50, r=50, b=50),
     #Fondo
    plot_bgcolor= 'white',
    paper_bgcolor= 'white'

)


fig.show()

In [415]:
titulo = 'Evasión por Duración de Contrato'
columna = 'account_Contract'

# Crear el histograma con Plotly Express:
fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map = paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)


fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [416]:
titulo = 'Evasión por Método de Pago'
columna = 'account_PaymentMethod'

# # Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)


fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()


In [417]:
titulo = 'Evasión por Método de Facturación'
columna = 'account_PaperlessBilling'

# Genera gráfico
fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [418]:
titulo = 'Evasión por Meses de Permanencia del Cliente'
columna = 'customer_tenure'

# Crear el histograma con Plotly Express:
fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',                                      # Las barras se agrupan lado a lado
    title=titulo,
    text_auto=True                                        # Muestra automáticamente el conteo sobre cada barra
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [419]:
titulo= 'Evasión por Cuentas Diarias'
columna = 'Cuentas_Diarias'

# Crear el histograma con Plotly Express:
fig = px.histogram(
    df,
    x=columna,
    color='Churn',          # Separamos las barras por estado de Churn
    color_discrete_map= paleta_colores,
    barmode='group',        # Las barras se agrupan lado a lado
    title=titulo,
    text_auto=True          # Muestra automáticamente el conteo sobre cada barra
)


# Subtitulo (annotation)
fig.add_annotation(
    text='Cuenta Mensual / 30 días',
    xref='paper', yref='paper',
    x=1.1/2,
    y=1,  # Position the annotation slightly above the title
    showarrow=False,
    font=dict(size=12, color='#222222'),
    xanchor='center',
    yanchor='bottom'
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [420]:
titulo = 'Evasión por Gasto Total de Cuentas'
columna = 'account_Charges_Total'

# Crear el histograma con Plotly Express:
fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [421]:
titulo = 'Evasión por Género del Cliente'
columna = 'customer_gender'

# Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [422]:
titulo = 'Evasión por Grupo Etareo'
columna = 'customer_SeniorCitizen'

# Crear el histograma con Plotly Express:
fig = px.histogram(
    df,
    x=columna,
    color='Churn',                                         # Separamos las barras por estado de Churn
    color_discrete_map=paleta_colores,
    barmode='group',                                      # Las barras se agrupan lado a lado
    title=titulo,
    text_auto=True                                        # Muestra automáticamente el conteo sobre cada barra
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [423]:
titulo = 'Evasión por Relación de Pareja'
columna = 'customer_Partner'

# Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [424]:
titulo = 'Evasión por Presencia de Dependientes'
columna = 'customer_Dependents'

# Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [425]:
titulo = 'Evasión por Tipo de Servicio de Internet'
columna = 'internet_InternetService'

# Genera el gráfico con la configuración deseada
fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [426]:

titulo = 'Evasión por Servicio de Seguridad Online'
columna = 'internet_OnlineSecurity'

fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [427]:
titulo = 'Servicio de Copia de Seguridad Online'
columna = 'internet_OnlineBackup'

fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [428]:
titulo = 'Evasión por Servicio de Protección de Dispositivos'
columna = 'internet_DeviceProtection'

fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [429]:
titulo='Evasión por Servicio de Soporte Técnico'
columna = 'internet_TechSupport'

fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [430]:
titulo = 'Evasión por Servicio de Streaming TV'
columna = 'internet_StreamingTV'

fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [431]:
titulo='Evasión por Servicio de Streaming de Películas'
columna = 'internet_StreamingMovies'

fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

In [432]:
titulo = 'Evasión por Servicio de Múltiples Líneas Telefónicas'
columna = 'phone_MultipleLines'

fig = px.histogram(
    df,
    x=columna,
    color='Churn',
    color_discrete_map=paleta_colores,
    barmode='group',
    title=titulo,
    text_auto=True
)

fig = aplicar_estilo_figura(fig, titulo, '', 'Cantidad')
fig = traducir_ticks(fig, columna)
fig.show()

#### 9. Correlaciones
- Identificar relaciones entre variables al final del proceso.

In [433]:
df.columns

Index(['customerID', 'Churn', 'customer_gender', 'customer_SeniorCitizen',
       'customer_Partner', 'customer_Dependents', 'customer_tenure',
       'phone_PhoneService', 'phone_MultipleLines', 'internet_InternetService',
       'internet_OnlineSecurity', 'internet_OnlineBackup',
       'internet_DeviceProtection', 'internet_TechSupport',
       'internet_StreamingTV', 'internet_StreamingMovies', 'account_Contract',
       'account_PaperlessBilling', 'account_PaymentMethod',
       'account_Charges_Monthly', 'account_Charges_Total',
       'tiene_Fibra_Optica', 'Cuentas_Diarias'],
      dtype='object')

In [434]:
import plotly.express as px

# Seleccionar solo las columnas numéricas del DataFrame, incluyendo la nueva columna binaria
# Excluimos las columnas de Charges_Monthly y Cuentas_Diarias si solo queremos Charges_Total para evitar multicolinealidad
df_numeric_for_corr = df.select_dtypes(include=['float64', 'int64']).drop(columns=['account_Charges_Monthly', 'Cuentas_Diarias'], errors='ignore')

# Calcular la matriz de correlación con las variables numéricas seleccionadas
correlation_matrix = df_numeric_for_corr.corr()

# Definir una escala de color personalizada que incluya los colores deseados
# Esto es una aproximación, ya que un heatmap de correlación usa una escala continua.
# Vamos a crear una escala que vaya de un tono similar a 'orchid' (para correlaciones negativas)
# pasando por un color neutro (para correlaciones cercanas a cero)
# hasta un tono similar a 'mediumseagreen' (para correlaciones positivas).
custom_color_scale = [
    [0.0, '#CA2C92'],
    [0.5, 'white'],
    [1.0, 'seagreen']
]


# Crear el heatmap interactivo con Plotly Express
fig = px.imshow(
    correlation_matrix,
    text_auto=".2f",  # Mostrar los valores de correlación con 2 decimales
    aspect="auto",   # Ajustar el aspecto del heatmap
    color_continuous_scale=custom_color_scale, # Usar la escala de color personalizada
    title='Matriz de Correlación de Variables Numéricas (incluyendo Fibra Óptica)' # Título actualizado
)

# Personalizar el layout del gráfico
fig.update_layout(
    title=dict(
        text='Matriz de Correlación de Variables Numéricas (incluyendo Fibra Óptica)',
        x=0.5,
        font=dict(size=20, color='#444444')
    ),
    xaxis=dict(
        tickangle=-45, # Rotar etiquetas del eje x para mejor legibilidad
        tickfont=dict(size=12, color='#444444')
    ),
    yaxis=dict(
        tickfont=dict(size=12, color='#444444')
    ),
    font=dict(
        size=14,
        color='#444444'
    ),
    coloraxis_colorbar=dict(
        title="Correlación", # Título de la barra de color
        tickfont=dict(color='#444444')
    ),
    plot_bgcolor='white',
    paper_bgcolor='white',
    height=700 # Ajustar altura si es necesario para mostrar todas las etiquetas
)

# Mostrar el gráfico interactivo
fig.show()

---
#📄Informe final
---

## Hallazgos

Basándonos en todos los análisis realizados hasta ahora, tenemos los hallazgos clave sobre los factores que parecen estar más relacionados con la evasión de clientes:

- Tipo de Contrato: Los clientes con contratos mes a mes (Month-to-month) siguen mostrando la tasa de evasión más alta. Los contratos de uno o dos años están asociados con una mayor retención.

- Método de Pago: El pago electrónico (Electronic check) se mantiene como un método de pago con una tasa de evasión significativamente más alta.

- Facturación Electrónica: Los clientes que usan facturación electrónica (Paperless Billing) tienen una mayor propensión a la evasión.

- Antigüedad del Cliente (Tenure): La antigüedad es un factor crucial. Los clientes con pocos meses de servicio tienen una tasa de evasión muy elevada, la cual disminuye drásticamente a medida que la antigüedad aumenta.

- Servicios Adicionales de Internet: La ausencia de servicios de seguridad y soporte en internet (Seguridad Online, Copia de Seguridad Online, Protección de Dispositivos, Soporte Técnico) está fuertemente relacionada con una mayor tasa de evasión.

- Tipo de Servicio de Internet: Como observaste correctamente, los clientes con Fibra Óptica tienen una tasa de evasión particularmente alta en comparación con los que tienen DSL o no tienen servicio de internet.

- Servicios de Streaming (TV y Películas): Los clientes que tienen servicios de streaming tienden a tener una tasa de evasión ligeramente mayor que aquellos que no los tienen o no tienen servicio de internet.

- Líneas Múltiples de Teléfono: Los clientes con múltiples líneas telefónicas muestran una tasa de evasión ligeramente superior.

- Género, Ciudadano Senior y Pareja/Dependientes: El género no parece ser un factor determinante. Los ciudadanos senior presentan una tasa de evasión un poco más alta, mientras que tener pareja o dependientes se asocia con una menor evasión.

- Cargos Mensuales y Totales (account_Charges_Monthly y account_Charges_Total / Cuentas_Diarias):
Los gráficos de distribución de evasión por Cuentas Diarias y Gastos Totales sugieren una relación interesante. Parece que los clientes con cargos mensuales y totales más altos (especialmente aquellos en el rango de Fibra Óptica) tienden a tener una mayor tasa de evasión. Esto podría estar relacionado con el tipo de servicio (Fibra Óptica es generalmente más cara) y quizás con la percepción del valor por el precio pagado, especialmente para los clientes de corta duración.

- En conclusión, los principales impulsores de la evasión en este dataset parecen ser: contratos a corto plazo (mes a mes), pago electrónico, facturación electrónica, baja antigüedad, la ausencia de servicios adicionales de seguridad y soporte en internet, el tipo de servicio de internet (Fibra Óptica) y, potencialmente, cargos mensuales/totales más altos.