# Desafío: Telecom X: **"Análisis de Evasión de Clientes"**
---
Has sido contratado como asistente de análisis de datos en Telecom X y formarás</br> parte del proyecto "Churn de Clientes". La empresa enfrenta una alta tasa de </br>cancelaciones y necesita comprender los factores que llevan a la pérdida de clientes.

_**Tu desafío será recopilar, procesar y analizar los datos, utilizando Python**_</br> y sus principales bibliotecas para extraer información valiosa. </br>

A partir de tu análisis, el equipo de Data Science podrá avanzar en modelos predictivos </br>y desarrollar estrategias para reducir la evasión.

## **1. Importar y manipular datos desde una API**
---
Para iniciar tu análisis, necesitarás importar los datos de la API de Telecom X. </br>Estos datos están disponibles en formato JSON y contienen información</br> esencial sobre los clientes, incluyendo datos demográficos, tipo de servicio </br>contratado y estado de evasión.

**Enlaces:**
* **JSON:** https://github.com/ingridcristh/challenge2-data-science-LATAM/blob/main/TelecomX_Data.json
* **Diccionario**: https://github.com/ingridcristh/challenge2-data-science-LATAM/blob/main/TelecomX_diccionario.md

**Pandas es una de las bibliotecas más populares y poderosas en Python para el análisis y manipulación de datos.**

_Se utiliza principalmente para:_

* **Manipulación de datos:** Permite cargar, limpiar, transformar y reorganizar datos de manera eficiente. </br>Puedes manejar datos faltantes, cambiar formatos, combinar conjuntos de datos, etc.

* **Estructuras de datos:** Introduce dos estructuras de datos principales: Series (similar a una columna </br>en una hoja de cálculo) y **DataFrame** (similar a una tabla o una hoja de cálculo, con filas y columnas).

* **Análisis exploratorio de datos (EDA):** Facilita la exploración inicial de los datos para entender su </br>distribución, identificar patrones, anomalías y relaciones entre variables.
* **Carga y guardado de datos:** Puede leer y escribir datos en diversos formatos como </br> **CSV, Excel, SQL, JSON y muchos otros.**

* **Preparación para modelado:** Es una herramienta fundamental para preparar los datos antes de </br>aplicar algoritmos de machine learning o modelos estadísticos.

In [1]:
# Importar Pandas #
import pandas as pd

## **2. ETL (Extracción, Transformación y Carga)**

### **2.1 Extracción**

In [2]:
# Importar Json y MD #

# Cargar los datos desde la url en formato Json #
# Y los convierte en un DATAFRAME
TelecomX_Data = pd.read_json("https://raw.githubusercontent.com/ingridcristh/challenge2-data-science-LATAM/main/TelecomX_Data.json")


# URL del archivo Markdown
url_diccionario = "https://raw.githubusercontent.com/ingridcristh/challenge2-data-science-LATAM/main/TelecomX_diccionario.md"



**Mostrando el Diccionario**
* **IPython.display** es un módulo de IPython que contiene utilidades para mostrar objetos en </br> notebooks (Jupyter, Colab) con formato HTML, imágenes, audio, vídeo, Markdown, etc.
  * **Display**: Es una función general para mostrar objetos de Python con la mejor </br> representación disponible (HTML, tablas, Markdown, etc.), más flexible que print.
  * **MarkDown**: Es una clase que recibe texto en formato Markdown.
    * **por ejemplo**: con **títulos, listas, tablas** y lo envuelve como un objeto </br>**“mostrable”** en el notebook.

In [3]:
# Ver el contenido de md #

#Importar request#
import requests
from IPython.display import display, Markdown
# Descarga el contenido del archivo desde la web #
# Se manda una solicitud tipo get a la url y devuelve un oobjeto#
# que contiene el archivo, .text extrae esa respuesta como cadena #
# De texto
texto = requests.get(url_diccionario).text
# Muestra en Colab como Markdown ya con formato #
# Markdown (texto) crea un objeto especial "texto en formato markdown"
# Display muestra esa salida.
display(Markdown(texto))

#### Diccionario de datos

- `customerID`: número de identificación único de cada cliente
- `Churn`: si el cliente dejó o no la empresa
- `gender`: género (masculino y femenino)
- `SeniorCitizen`: información sobre si un cliente tiene o no una edad igual o mayor a 65 años
- `Partner`: si el cliente tiene o no una pareja
- `Dependents`: si el cliente tiene o no dependientes
- `tenure`: meses de contrato del cliente
- `PhoneService`: suscripción al servicio telefónico
- `MultipleLines`: suscripción a más de una línea telefónica
- `InternetService`: suscripción a un proveedor de internet
- `OnlineSecurity`: suscripción adicional de seguridad en línea
- `OnlineBackup`: suscripción adicional de respaldo en línea
- `DeviceProtection`: suscripción adicional de protección del dispositivo
- `TechSupport`: suscripción adicional de soporte técnico, menor tiempo de espera
- `StreamingTV`: suscripción de televisión por cable
- `StreamingMovies`: suscripción de streaming de películas
- `Contract`: tipo de contrato
- `PaperlessBilling`: si el cliente prefiere recibir la factura en línea
- `PaymentMethod`: forma de pago
- `Charges.Monthly`: total de todos los servicios del cliente por mes
- `Charges.Total`: total gastado por el cliente

In [4]:
# ver contenido del json #
TelecomX_Data

Unnamed: 0,customerID,Churn,customer,phone,internet,account
0,0002-ORFBO,No,"{'gender': 'Female', 'SeniorCitizen': 0, 'Part...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'DSL', 'OnlineSecurity': '...","{'Contract': 'One year', 'PaperlessBilling': '..."
1,0003-MKNFE,No,"{'gender': 'Male', 'SeniorCitizen': 0, 'Partne...","{'PhoneService': 'Yes', 'MultipleLines': 'Yes'}","{'InternetService': 'DSL', 'OnlineSecurity': '...","{'Contract': 'Month-to-month', 'PaperlessBilli..."
2,0004-TLHLJ,Yes,"{'gender': 'Male', 'SeniorCitizen': 0, 'Partne...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli..."
3,0011-IGKFF,Yes,"{'gender': 'Male', 'SeniorCitizen': 1, 'Partne...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli..."
4,0013-EXCHZ,Yes,"{'gender': 'Female', 'SeniorCitizen': 1, 'Part...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli..."
...,...,...,...,...,...,...
7262,9987-LUTYD,No,"{'gender': 'Female', 'SeniorCitizen': 0, 'Part...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'DSL', 'OnlineSecurity': '...","{'Contract': 'One year', 'PaperlessBilling': '..."
7263,9992-RRAMN,Yes,"{'gender': 'Male', 'SeniorCitizen': 0, 'Partne...","{'PhoneService': 'Yes', 'MultipleLines': 'Yes'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli..."
7264,9992-UJOEL,No,"{'gender': 'Male', 'SeniorCitizen': 0, 'Partne...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'DSL', 'OnlineSecurity': '...","{'Contract': 'Month-to-month', 'PaperlessBilli..."
7265,9993-LHIEB,No,"{'gender': 'Male', 'SeniorCitizen': 0, 'Partne...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'DSL', 'OnlineSecurity': '...","{'Contract': 'Two year', 'PaperlessBilling': '..."


### **2.2 Transformación**
---
Flattening o Aplanado  

**Obteniendo Columnas**

Al visualizar el dataFrame anterior nos damos cuenta de que existen Json anidados.
</br> Podemos usar normalize para obtener mas columnas.

**pd.json_normalize(columna) toma cada diccionario de esa serie y lo convierte</br> en columnas, una por clave del JSON.**

In [5]:
from pandas.tseries.offsets import CustomBusinessDay
# Quitando los JSON aniados #
# Las Columnas Objetivo SON:

# customer #
custommer_df=pd.json_normalize(TelecomX_Data['customer'])
# phone #
phone_df=pd.json_normalize(TelecomX_Data['phone'])
# internet #
internet_df=pd.json_normalize(TelecomX_Data['internet'])
# account#
account_df=pd.json_normalize(TelecomX_Data['account'])

**Uniendo las Columnas en Un solo DataFrame**

Vamos a unir las columnas simples originales y las nuevas obtenidas </br> en el paso anterior.

In [6]:
#Nuevo dataFrame Completo #
TelecomX_Data_Final=pd.concat([TelecomX_Data,custommer_df,phone_df,internet_df,account_df],axis=1)
TelecomX_Data_Final.head()

Unnamed: 0,customerID,Churn,customer,phone,internet,account,gender,SeniorCitizen,Partner,Dependents,...,OnlineBackup,DeviceProtection,TechSupport,StreamingTV,StreamingMovies,Contract,PaperlessBilling,PaymentMethod,Charges.Monthly,Charges.Total
0,0002-ORFBO,No,"{'gender': 'Female', 'SeniorCitizen': 0, 'Part...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'DSL', 'OnlineSecurity': '...","{'Contract': 'One year', 'PaperlessBilling': '...",Female,0,Yes,Yes,...,Yes,No,Yes,Yes,No,One year,Yes,Mailed check,65.6,593.3
1,0003-MKNFE,No,"{'gender': 'Male', 'SeniorCitizen': 0, 'Partne...","{'PhoneService': 'Yes', 'MultipleLines': 'Yes'}","{'InternetService': 'DSL', 'OnlineSecurity': '...","{'Contract': 'Month-to-month', 'PaperlessBilli...",Male,0,No,No,...,No,No,No,No,Yes,Month-to-month,No,Mailed check,59.9,542.4
2,0004-TLHLJ,Yes,"{'gender': 'Male', 'SeniorCitizen': 0, 'Partne...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli...",Male,0,No,No,...,No,Yes,No,No,No,Month-to-month,Yes,Electronic check,73.9,280.85
3,0011-IGKFF,Yes,"{'gender': 'Male', 'SeniorCitizen': 1, 'Partne...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli...",Male,1,Yes,No,...,Yes,Yes,No,Yes,Yes,Month-to-month,Yes,Electronic check,98.0,1237.85
4,0013-EXCHZ,Yes,"{'gender': 'Female', 'SeniorCitizen': 1, 'Part...","{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli...",Female,1,Yes,No,...,No,No,Yes,Yes,No,Month-to-month,Yes,Mailed check,83.9,267.4


**Analizando:**
Las columnas vemos que aun hay columnas con **JSON** anidados.  

Debemos de quitar los json anidados de las columnas:
 * **customer**
 * **phone**
 * **internet**  
 * **account**

In [7]:
# Analizando columnas con json anidados #
df=TelecomX_Data_Final

# Ver lo Json anidados, ver si aun hay diccionarios #
for col in df.columns:
  if df[col].apply(lambda x: isinstance(x,dict)).any():
    print("Columna con JSON anidado",col)

Columna con JSON anidado customer
Columna con JSON anidado phone
Columna con JSON anidado internet
Columna con JSON anidado account


Explicación:

**if df[col].apply(lambda x: isinstance(x, dict)).any():**

* **df[col]:** selecciona la columna col (por ejemplo, customer_2).

* **.apply(lambda x:** isinstance(x, dict)): aplica una función lambda a cada celda de la columna. </br>Para cada valor x (que puede ser str, int, dict, etc.), isinstance(x, dict) devuelve True </br>si es un diccionario, False si no. El resultado es una serie de booleanos (uno por fila).

* **.any():** devuelve True si al menos una de esas filas es True (hay al menos un dict en esa columna).

Expandiendo las columnas: **"flattening" ó "Aplanado"**
---
  * **customer**
  * **phone**
  * **internet**
  * **account**

In [8]:
# Expandiendo customer #
# Expandir customer

# Normalizamos el df = data frame #
nuevas_cols = pd.json_normalize(df["customer"])
# Agregamos el prefijo para saber que es una sub col de customer#
nuevas_cols = nuevas_cols.add_prefix("customer_")
# eliminas columa customer y concatenas con columna "nuevas_cols"#
df = pd.concat([df.drop(columns=["customer"]), nuevas_cols], axis=1)

print("✅ customer expandido")
df.head()

✅ customer expandido


Unnamed: 0,customerID,Churn,phone,internet,account,gender,SeniorCitizen,Partner,Dependents,tenure,...,Contract,PaperlessBilling,PaymentMethod,Charges.Monthly,Charges.Total,customer_gender,customer_SeniorCitizen,customer_Partner,customer_Dependents,customer_tenure
0,0002-ORFBO,No,"{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'DSL', 'OnlineSecurity': '...","{'Contract': 'One year', 'PaperlessBilling': '...",Female,0,Yes,Yes,9,...,One year,Yes,Mailed check,65.6,593.3,Female,0,Yes,Yes,9
1,0003-MKNFE,No,"{'PhoneService': 'Yes', 'MultipleLines': 'Yes'}","{'InternetService': 'DSL', 'OnlineSecurity': '...","{'Contract': 'Month-to-month', 'PaperlessBilli...",Male,0,No,No,9,...,Month-to-month,No,Mailed check,59.9,542.4,Male,0,No,No,9
2,0004-TLHLJ,Yes,"{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli...",Male,0,No,No,4,...,Month-to-month,Yes,Electronic check,73.9,280.85,Male,0,No,No,4
3,0011-IGKFF,Yes,"{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli...",Male,1,Yes,No,13,...,Month-to-month,Yes,Electronic check,98.0,1237.85,Male,1,Yes,No,13
4,0013-EXCHZ,Yes,"{'PhoneService': 'Yes', 'MultipleLines': 'No'}","{'InternetService': 'Fiber optic', 'OnlineSecu...","{'Contract': 'Month-to-month', 'PaperlessBilli...",Female,1,Yes,No,3,...,Month-to-month,Yes,Mailed check,83.9,267.4,Female,1,Yes,No,3


In [9]:
# Expandiendo phone#
# Normalizar #
nuevas_cols = pd.json_normalize(df["phone"])
# agregas el prefijo#
nuevas_cols = nuevas_cols.add_prefix("phone_")
# Eliminas columna phone y concatenas con nuevas_cols#
df = pd.concat([df.drop(columns=["phone"]), nuevas_cols], axis=1)

print("✅ phone expandido")

✅ phone expandido


In [10]:
# Expandiendo internet #
# Normalizar #
nuevas_cols = pd.json_normalize(df["internet"])
# Agregas prefijo #
nuevas_cols = nuevas_cols.add_prefix("internet_")
# Eliminas columna internet y concatenas con nuevas_cols #
df = pd.concat([df.drop(columns=["internet"]), nuevas_cols], axis=1)

print("✅ internet expandido")

✅ internet expandido


In [11]:
# Expandiendo account #
# Normalizar #
nuevas_cols = pd.json_normalize(df["account"])
# Agregas prefijo #
nuevas_cols = nuevas_cols.add_prefix("account_")
# # Eliminas columna account y concatenas con nuevas_cols #
df = pd.concat([df.drop(columns=["account"]), nuevas_cols], axis=1)

print("✅ account expandido")

✅ account expandido


Verificando si aun existen JSON anidados:

In [12]:
# Analizando columnas con json anidados #

# Ver lo Json anidados, ver si aun hay diccionarios #
for col in df.columns:
  if df[col].apply(lambda x: isinstance(x,dict)).any():
    print("Columna con JSON anidado",col)
print("No hay JSON anidados")

No hay JSON anidados


In [13]:
# Mostrando El dataFrame final #
df.head()

Unnamed: 0,customerID,Churn,gender,SeniorCitizen,Partner,Dependents,tenure,PhoneService,MultipleLines,InternetService,...,internet_OnlineBackup,internet_DeviceProtection,internet_TechSupport,internet_StreamingTV,internet_StreamingMovies,account_Contract,account_PaperlessBilling,account_PaymentMethod,account_Charges.Monthly,account_Charges.Total
0,0002-ORFBO,No,Female,0,Yes,Yes,9,Yes,No,DSL,...,Yes,No,Yes,Yes,No,One year,Yes,Mailed check,65.6,593.3
1,0003-MKNFE,No,Male,0,No,No,9,Yes,Yes,DSL,...,No,No,No,No,Yes,Month-to-month,No,Mailed check,59.9,542.4
2,0004-TLHLJ,Yes,Male,0,No,No,4,Yes,No,Fiber optic,...,No,Yes,No,No,No,Month-to-month,Yes,Electronic check,73.9,280.85
3,0011-IGKFF,Yes,Male,1,Yes,No,13,Yes,No,Fiber optic,...,Yes,Yes,No,Yes,Yes,Month-to-month,Yes,Electronic check,98.0,1237.85
4,0013-EXCHZ,Yes,Female,1,Yes,No,3,Yes,No,Fiber optic,...,No,No,Yes,Yes,No,Month-to-month,Yes,Mailed check,83.9,267.4


Analizamos el DataFrame que tenemos ya aplanado.
---
Necesitamos conocer el propio dataFrame.

In [14]:
# Analizando los datos #

#1 Tipos de Datos#
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7267 entries, 0 to 7266
Data columns (total 40 columns):
 #   Column                     Non-Null Count  Dtype  
---  ------                     --------------  -----  
 0   customerID                 7267 non-null   object 
 1   Churn                      7267 non-null   object 
 2   gender                     7267 non-null   object 
 3   SeniorCitizen              7267 non-null   int64  
 4   Partner                    7267 non-null   object 
 5   Dependents                 7267 non-null   object 
 6   tenure                     7267 non-null   int64  
 7   PhoneService               7267 non-null   object 
 8   MultipleLines              7267 non-null   object 
 9   InternetService            7267 non-null   object 
 10  OnlineSecurity             7267 non-null   object 
 11  OnlineBackup               7267 non-null   object 
 12  DeviceProtection           7267 non-null   object 
 13  TechSupport                7267 non-null   objec

In [15]:
# 2 Contar valores nulos por columna #
print(df.isnull().sum())

customerID                   0
Churn                        0
gender                       0
SeniorCitizen                0
Partner                      0
Dependents                   0
tenure                       0
PhoneService                 0
MultipleLines                0
InternetService              0
OnlineSecurity               0
OnlineBackup                 0
DeviceProtection             0
TechSupport                  0
StreamingTV                  0
StreamingMovies              0
Contract                     0
PaperlessBilling             0
PaymentMethod                0
Charges.Monthly              0
Charges.Total                0
customer_gender              0
customer_SeniorCitizen       0
customer_Partner             0
customer_Dependents          0
customer_tenure              0
phone_PhoneService           0
phone_MultipleLines          0
internet_InternetService     0
internet_OnlineSecurity      0
internet_OnlineBackup        0
internet_DeviceProtection    0
internet

In [16]:
# 3. Limpiar nombres de Columanas #
# cambiar . por _ #
df.columns = df.columns.str.lower().str.replace('.', '_')
df.head()

Unnamed: 0,customerid,churn,gender,seniorcitizen,partner,dependents,tenure,phoneservice,multiplelines,internetservice,...,internet_onlinebackup,internet_deviceprotection,internet_techsupport,internet_streamingtv,internet_streamingmovies,account_contract,account_paperlessbilling,account_paymentmethod,account_charges_monthly,account_charges_total
0,0002-ORFBO,No,Female,0,Yes,Yes,9,Yes,No,DSL,...,Yes,No,Yes,Yes,No,One year,Yes,Mailed check,65.6,593.3
1,0003-MKNFE,No,Male,0,No,No,9,Yes,Yes,DSL,...,No,No,No,No,Yes,Month-to-month,No,Mailed check,59.9,542.4
2,0004-TLHLJ,Yes,Male,0,No,No,4,Yes,No,Fiber optic,...,No,Yes,No,No,No,Month-to-month,Yes,Electronic check,73.9,280.85
3,0011-IGKFF,Yes,Male,1,Yes,No,13,Yes,No,Fiber optic,...,Yes,Yes,No,Yes,Yes,Month-to-month,Yes,Electronic check,98.0,1237.85
4,0013-EXCHZ,Yes,Female,1,Yes,No,3,Yes,No,Fiber optic,...,No,No,Yes,Yes,No,Month-to-month,Yes,Mailed check,83.9,267.4


Mostramos Todas las columnas: **pd.set_option()**


In [17]:
# Muestra aleatoria #
pd.set_option('display.max_columns', None)
df.sample(5)

Unnamed: 0,customerid,churn,gender,seniorcitizen,partner,dependents,tenure,phoneservice,multiplelines,internetservice,onlinesecurity,onlinebackup,deviceprotection,techsupport,streamingtv,streamingmovies,contract,paperlessbilling,paymentmethod,charges_monthly,charges_total,customer_gender,customer_seniorcitizen,customer_partner,customer_dependents,customer_tenure,phone_phoneservice,phone_multiplelines,internet_internetservice,internet_onlinesecurity,internet_onlinebackup,internet_deviceprotection,internet_techsupport,internet_streamingtv,internet_streamingmovies,account_contract,account_paperlessbilling,account_paymentmethod,account_charges_monthly,account_charges_total
5689,7776-QGYJC,No,Female,0,Yes,Yes,39,Yes,No,Fiber optic,No,No,Yes,Yes,No,No,Month-to-month,Yes,Bank transfer (automatic),81.5,3107.3,Female,0,Yes,Yes,39,Yes,No,Fiber optic,No,No,Yes,Yes,No,No,Month-to-month,Yes,Bank transfer (automatic),81.5,3107.3
4489,6158-DWPZT,Yes,Male,0,Yes,No,9,No,No phone service,DSL,No,No,No,No,No,No,One year,No,Bank transfer (automatic),24.1,259.8,Male,0,Yes,No,9,No,No phone service,DSL,No,No,No,No,No,No,One year,No,Bank transfer (automatic),24.1,259.8
3041,4231-LZUYM,No,Female,0,Yes,No,72,Yes,Yes,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Bank transfer (automatic),25.65,1887.0,Female,0,Yes,No,72,Yes,Yes,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Bank transfer (automatic),25.65,1887.0
1984,2810-FTLEM,Yes,Female,0,No,No,16,Yes,No,DSL,Yes,No,No,No,No,No,Month-to-month,Yes,Electronic check,50.15,762.25,Female,0,No,No,16,Yes,No,DSL,Yes,No,No,No,No,No,Month-to-month,Yes,Electronic check,50.15,762.25
2048,2884-GBPFB,Yes,Female,0,Yes,No,35,Yes,No,Fiber optic,No,No,No,No,No,No,Month-to-month,Yes,Electronic check,70.3,2416.55,Female,0,Yes,No,35,Yes,No,Fiber optic,No,No,No,No,No,No,Month-to-month,Yes,Electronic check,70.3,2416.55


In [18]:
# Mostrar Datos Alineados Muestra de 5.
df.sample(5).style.set_properties(**{'text-align': 'left'})

Unnamed: 0,customerid,churn,gender,seniorcitizen,partner,dependents,tenure,phoneservice,multiplelines,internetservice,onlinesecurity,onlinebackup,deviceprotection,techsupport,streamingtv,streamingmovies,contract,paperlessbilling,paymentmethod,charges_monthly,charges_total,customer_gender,customer_seniorcitizen,customer_partner,customer_dependents,customer_tenure,phone_phoneservice,phone_multiplelines,internet_internetservice,internet_onlinesecurity,internet_onlinebackup,internet_deviceprotection,internet_techsupport,internet_streamingtv,internet_streamingmovies,account_contract,account_paperlessbilling,account_paymentmethod,account_charges_monthly,account_charges_total
5696,7781-HVGMK,No,Female,0,Yes,Yes,72,No,No phone service,DSL,Yes,Yes,Yes,Yes,Yes,Yes,Two year,Yes,Credit card (automatic),65.2,4784.45,Female,0,Yes,Yes,72,No,No phone service,DSL,Yes,Yes,Yes,Yes,Yes,Yes,Two year,Yes,Credit card (automatic),65.2,4784.45
4734,6483-OATDN,No,Male,0,Yes,Yes,8,Yes,No,DSL,Yes,No,No,No,No,No,Month-to-month,Yes,Credit card (automatic),51.3,411.6,Male,0,Yes,Yes,8,Yes,No,DSL,Yes,No,No,No,No,No,Month-to-month,Yes,Credit card (automatic),51.3,411.6
657,0932-YIXYU,No,Female,0,No,No,47,Yes,No,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Credit card (automatic),20.25,1029.8,Female,0,No,No,47,Yes,No,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,Two year,No,Credit card (automatic),20.25,1029.8
2042,2878-DHMIN,No,Male,0,Yes,Yes,35,Yes,No,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,One year,No,Electronic check,19.9,666.0,Male,0,Yes,Yes,35,Yes,No,No,No internet service,No internet service,No internet service,No internet service,No internet service,No internet service,One year,No,Electronic check,19.9,666.0
4266,5868-CZJDR,Yes,Male,0,No,Yes,1,No,No phone service,DSL,No,Yes,No,No,No,No,Month-to-month,Yes,Mailed check,31.35,31.35,Male,0,No,Yes,1,No,No phone service,DSL,No,Yes,No,No,No,No,Month-to-month,Yes,Mailed check,31.35,31.35


## **3. Creación de Visualizaciones**  

## **4. Realizar un Análisis Exploratorio de Datos (EDA)**

## **5. Creación de un Informe con insights**