# Exploración Inicial del Dataset de Telecom X
Este notebook tiene como objetivo comprender en profundidad la estructura del conjunto de datos proporcionado por **Telecom X**, a partir de su diccionario de datos oficial.

Analizaremos cada columna para entender su propósito, tipo de variable, posibles valores y relevancia para el análisis de churn (fuga de clientes).

In [None]:
import pandas as pd

# Cargar el dataset
df = pd.read_csv('TelecomX_dataset.csv')  # Cambiar el nombre si es diferente
df.head()

In [None]:
# Información general del dataset
df.info()

In [None]:
# Verificamos valores nulos y estadística básica
df.isnull().sum(), df.describe(include='all')

## Análisis por Columna
A continuación, se detalla cada una de las columnas presentes en el dataset según el diccionario oficial y lo observado en los datos:


### customerID
- **Tipo**: Categórica (ID único)
- **Descripción**: Identificador único de cliente.
- **Notas**: No es útil como variable predictiva directa.

### Churn
- **Tipo**: Categórica binaria (Yes/No)
- **Descripción**: Indica si el cliente abandonó la empresa.
- **Notas**: Es la variable objetivo a predecir.

### gender
- **Tipo**: Categórica (Male/Female)
- **Descripción**: Género del cliente.
- **Notas**: No parece correlacionada con churn según estudios previos.

### SeniorCitizen
- **Tipo**: Numérica binaria (0/1)
- **Descripción**: Indica si el cliente tiene 65 años o más.
- **Notas**: Convertir a categórica puede ser útil para visualizaciones.

### Partner, Dependents
- **Tipo**: Categóricas binarias (Yes/No)
- **Descripción**: Si tiene pareja o dependientes.
- **Notas**: Pueden influir en el comportamiento de cancelación.

### tenure
- **Tipo**: Numérica
- **Descripción**: Meses como cliente.
- **Notas**: Una de las variables más importantes para predecir churn.

### PhoneService, MultipleLines
- **Tipo**: Categóricas (Yes/No/No phone service)
- **Descripción**: Servicios telefónicos contratados.
- **Notas**: Revisar distribución por tipo de servicio.

### InternetService, OnlineSecurity, OnlineBackup, DeviceProtection, TechSupport, StreamingTV, StreamingMovies
- **Tipo**: Categóricas
- **Descripción**: Servicios contratados relacionados con internet y entretenimiento.
- **Notas**: Variables clave para detectar patrones de abandono.

### Contract, PaperlessBilling, PaymentMethod
- **Tipo**: Categóricas
- **Descripción**: Información contractual y de pago.
- **Notas**: Claves para políticas de retención.

### Charges.Monthly, Charges.Total
- **Tipo**: Numéricas
- **Descripción**: Costos mensuales y acumulados.
- **Notas**: Importantes para entender la rentabilidad y hábitos.
