# üì° TelecomX ‚Äî An√°lisis de Evasi√≥n de Clientes (Churn)

**Programa:** Oracle Next Education (ONE) ¬∑ Alura Latam  
**Challenge:** 2 ¬∑ Data Science  
**Autor:** Bernardo Adolfo G√≥mez Montoya  

---

Este notebook documenta el proceso completo de **ETL + An√°lisis Exploratorio** para identificar los factores que provocan la evasi√≥n de clientes en Telecom X, siguiendo la metodolog√≠a √°gil del tablero Trello del challenge.

---
# ‚öôÔ∏è FASE 1 ‚Äî Extracci√≥n (E ¬∑ Extract)
---

## üìå Tarjeta 1: Extracci√≥n de Datos

Para iniciar el an√°lisis, necesitamos importar los datos de la API de **Telecom X**. Estos datos est√°n disponibles en formato **JSON** y contienen informaci√≥n esencial sobre los clientes, incluyendo datos demogr√°ficos, tipo de servicio contratado y estado de evasi√≥n.

**Fuente de datos (API):**  
üîó `https://raw.githubusercontent.com/ingridcristh/challenge2-data-science-LATAM/main/TelecomX_Data.json`

**¬øQu√© haremos?**
- ‚úÖ Cargar los datos directamente desde la API utilizando Python.
- ‚úÖ Convertir los datos a un **DataFrame de Pandas** para facilitar su manipulaci√≥n.

In [None]:
import pandas as pd
import requests
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

# URL de la API proporcionada por el challenge
url = "https://raw.githubusercontent.com/ingridcristh/challenge2-data-science-LATAM/main/TelecomX_Data.json"

print("üîÑ Iniciando extracci√≥n de datos desde la API...")

try:
    # 1. Obtener los datos de la API
    respuesta = requests.get(url, timeout=20)
    respuesta.raise_for_status()
    datos_json = respuesta.json()

    # 2. Convertir a DataFrame
    # Usamos json_normalize() porque la estructura JSON es anidada
    # Esto separa 'customer', 'phone', 'account', etc. en columnas individuales
    df = pd.json_normalize(datos_json)

    print("‚úÖ Extracci√≥n exitosa.")
    print(f"üìä El dataset tiene {df.shape[0]} filas y {df.shape[1]} columnas.")
    print("\nüìã Primeras 5 filas del dataset:")
    display(df.head())

except Exception as e:
    print(f"‚ùå Error al extraer los datos: {e}")

---
# üîß FASE 2 ‚Äî Transformaci√≥n (T ¬∑ Transform)
---

## üìå Tarjeta 2: Conoce el Conjunto de Datos

Ahora que hemos extra√≠do los datos, es fundamental **comprender la estructura del dataset** y el significado de sus columnas. Esta etapa nos ayudar√° a identificar qu√© variables son m√°s relevantes para el an√°lisis de evasi√≥n de clientes.

**¬øQu√© haremos?**
- ‚úÖ Explorar las columnas del dataset y verificar sus **tipos de datos**.
- ‚úÖ Consultar el diccionario para comprender mejor el significado de las variables.
- ‚úÖ Identificar las columnas m√°s relevantes para el an√°lisis de evasi√≥n.

**Referencias:** `DataFrame.info()` ¬∑ `DataFrame.dtypes`