```markdown
# Informe Final: Análisis de Evasión de Clientes - Telecom X

## Introducción

### Contexto
La evasión de clientes (churn) es un problema crítico para las empresas de telecomunicaciones, ya que la pérdida de clientes impacta directamente en los ingresos y la reputación. Telecom X enfrenta este desafío y busca entender los factores que impulsan la evasión para desarrollar estrategias de retención efectivas.

### Objetivo
El objetivo de este análisis es identificar patrones y factores asociados con la evasión de clientes en Telecom X mediante un Análisis Exploratorio de Datos (EDA). A través de la limpieza, procesamiento y visualización de datos, se exploran variables categóricas y numéricas para generar insights que apoyen la toma de decisiones estratégicas.

---

## Limpieza y Tratamiento de Datos

### Pasos Realizados
1. **Carga de Datos**:
   - Se importó el dataset `TelecomX_Data.json` desde una URL en GitHub.
   - Contenía 6 columnas principales, incluyendo estructuras JSON anidadas (`customer`, `phone`, `internet`, `account`).
2. **Desanidado**:
   - Las columnas JSON se desanidaron usando `pd.json_normalize`, generando 21 variables.
   - Se creó `TelecomX_Data_clean.csv` con la estructura plana.
3. **Corrección de Datos**:
   - Se identificaron 224 valores vacíos en `Churn`, que se imputaron como `No`.
   - Se generó `TelecomX_Data_corrected.csv`.
4. **Manejo de Nulos**:
   - 11 valores nulos en `Cargos_Totales` se imputaron:
     - Para clientes con `Antigüedad ≤ 1`, se usó `Cargos_Mensuales`.
     - Para otros, se usó la mediana de `Cargos_Totales`.
   - Se creó `TelecomX_Data_final.csv`.
5. **Creación de Variables**:
   - Se generó `Cargos_Diarios` dividiendo `Cargos_Mensuales` entre 30.
   - Se creó `TelecomX_Data_with_daily.csv`.
6. **Estandarización**:
   - Variables binarias (`Evasión`, `Facturación_Sin_Papel`, etc.) se convirtieron a 1/0.
   - Columnas se renombraron a español (por ejemplo, `Churn` → `Evasión`, `tenure` → `Antigüedad`).
   - Valores categóricos se tradujeron (por ejemplo, `Male` → `Masculino`, `Month-to-month` → `Mes a mes`).
   - Se creó `TelecomX_Data_standardized.csv`.
7. **Variable Adicional**:
   - Se creó `Total_Servicios`, sumando servicios contratados (`Servicio_Telefónico`, `Seguridad_Online`, etc.).

### Resultado
El dataset final contiene 7043 registros y 22 variables, listo para análisis, con nombres en español y sin valores nulos.

---

## Análisis Exploratorio de Datos

### Distribución General de Evasión
Se analizó la distribución de `Evasión` para entender la proporción de clientes que cancelaron.

![Proporción de Evasión](./img/churn_pie.png)

**Observación**: Aproximadamente el 26.5% de los clientes cancelaron (1869 de 7043), indicando una tasa de evasión significativa.

---

### Evasión por Variables Categóricas
Se exploraron variables categóricas como `Contrato`, `Género`, `Método_Pago`, `Servicio_Internet` y `Facturación_Sin_Papel`.

![Evasión por Contrato](./img/evasion_por_contrato.png)

- **Contrato**: Los clientes con contratos "Mes a mes" tienen una tasa de evasión mucho mayor (~40%) que los de "Un año" o "Dos años" (<10%).

![Evasión por Método de Pago](./img/evasion_por_metodo_pago.png)

- **Método de Pago**: Los clientes que usan "Cheque electrónico" muestran mayor evasión (~45%) comparado con métodos automáticos (~15-20%).

![Evasión por Servicio de Internet](./img/evasion_por_servicio_internet.png)

- **Servicio de Internet**: Los clientes con "Fibra óptica" tienen una tasa de evasión más alta (~40%) que los de "DSL" (~20%) o sin internet (~7%).

- **Género**: No se observaron diferencias significativas entre "Masculino" y "Femenino".
- **Facturación Sin Papel**: Los clientes con facturación sin papel tienen una evasión ligeramente mayor (~33%) que los que usan papel (~16%).

---

### Evasión por Variables Numéricas
Se analizaron `Antigüedad`, `Cargos_Mensuales`, `Cargos_Totales` y `Cargos_Diarios`.

![Boxplot de Antigüedad](./img/evasion_antiguedad_box.png)

- **Antigüedad**: Los clientes que cancelan tienen menor antigüedad (mediana ~10 meses) que los que permanecen (mediana ~38 meses).
- **Cargos_Mensuales**: Los clientes que cancelan tienden a tener cargos mensuales más altos (mediana ~$80) que los que permanecen (mediana ~$65).
- **Cargos_Totales**: Los clientes que cancelan tienen menores cargos totales (mediana ~$700) debido a su menor antigüedad, comparado con los que permanecen (mediana ~$2000).
- **Cargos_Diarios**: Similar a `Cargos_Mensuales`, los clientes que cancelan tienen cargos diarios más altos.

---

### Correlaciones
Se analizaron correlaciones entre variables numéricas y binarias.

![Matriz de Correlación](./img/correlacion_heatmap.png)

- **Evasión**:
  - Correlación negativa con `Antigüedad` (-0.35): Clientes más antiguos son menos propensos a cancelar.
  - Correlación positiva con `Cargos_Mensuales` y `Cargos_Diarios` (~0.19): Facturas más altas aumentan la evasión.
  - Correlación positiva con `Facturación_Sin_Papel` (0.19) y `Total_Servicios` (0.04): Más servicios o facturación digital están ligeramente asociados con evasión.
- **Total_Servicios**:
  - Correlación positiva con `Cargos_Mensuales` (0.66): Más servicios implican facturas más altas.

---

## Conclusiones e Insights

1. **Factores Clave de Evasión**:
   - **Contratos Cortos**: Los clientes con contratos "Mes a mes" son significativamente más propensos a cancelar (~40% de evasión).
   - **Método de Pago**: El uso de "Cheque electrónico" está asociado con mayor evasión (~45%).
   - **Servicio de Internet**: Los clientes con "Fibra óptica" tienen tasas de evasión más altas (~40%), posiblemente debido a costos o calidad del servicio.
   - **Antigüedad**: Los clientes nuevos (antigüedad < 20 meses) son más propensos a cancelar.
   - **Cargos Altos**: Facturas mensuales y diarias elevadas están correlacionadas con mayor evasión.

2. **Factores con Menor Impacto**:
   - **Género**: No influye significativamente en la evasión.
   - **Total_Servicios**: Aunque más servicios aumentan los cargos, su correlación con evasión es débil.

3. **Patrones Generales**:
   - La evasión está más relacionada con la flexibilidad del contrato y los costos percibidos que con características demográficas.
   - Los clientes con mayor compromiso (contratos largos, métodos de pago automáticos) tienden a permanecer.

---

## Recomendaciones

1. **Fomentar Contratos a Largo Plazo**:
   - Ofrecer incentivos (descuentos, beneficios exclusivos) para que los clientes elijan contratos de "Un año" o "Dos años".
   - Ejemplo: Un descuento del 10% en la factura para contratos de 12 meses o más.

2. **Promover Métodos de Pago Automáticos**:
   - Incentivar el uso de "Transferencia bancaria" o "Tarjeta de crédito" mediante campañas que resalten su conveniencia.
   - Ejemplo: Ofrecer un mes gratis al configurar pagos automáticos.

3. **Optimizar el Servicio de Fibra Óptica**:
   - Investigar las causas de la alta evasión en clientes con "Fibra óptica" (costos, calidad).
   - Ejemplo: Reducir tarifas o incluir soporte técnico prioritario.

4. **Retención de Clientes Nuevos**:
   - Implementar programas de bienvenida para clientes con antigüedad < 20 meses.
   - Ejemplo: Un paquete de bienvenida con un descuento del 20% en los primeros 6 meses.

5. **Revisar Estrategias de Precios**:
   - Ajustar tarifas para clientes con cargos mensuales altos (> $80).
   - Ejemplo: Crear planes combinados con servicios adicionales a precios reducidos.

6. **Mejorar la Experiencia Digital**:
   - Optimizar la experiencia de facturación digital para clientes con `Facturación_Sin_Papel`.
   - Ejemplo: Enviar recordatorios amigables y ofrecer tutoriales para el portal de facturación.

### Impacto Esperado
Estas estrategias pueden reducir la tasa de evasión al abordar los factores clave identificados, mejorar la experiencia del cliente y fomentar la lealtad a largo plazo.

---

## Conclusión Final
El análisis exploratorio de datos ha proporcionado una comprensión clara de los factores que impulsan la evasión en Telecom X. Al enfocarse en contratos a largo plazo, métodos de pago automáticos y la retención de clientes nuevos, la empresa puede desarrollar estrategias efectivas para reducir el churn. Los insights obtenidos sientan las bases para modelos predictivos futuros que optimicen aún más la retención de clientes.
```