<a href="https://colab.research.google.com/github/solecoded/TelecomX_P1/blob/main/Challenge_TelecomX(P1).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 📤 1.- Extracción

In [5]:
import pandas as pd
import requests
import json

# URL del archivo JSON en GitHub
url_api = "https://raw.githubusercontent.com/solecoded/TelecomX_P1/main/TelecomX_Data.json"

# Realizar una solicitud GET a la URL para obtener los datos
response = requests.get(url_api)

# Verificar que la solicitud fue exitosa
if response.status_code == 200:
    # Cargar el contenido JSON
    datos_json = response.json()

    # Convertir el JSON a un DataFrame de Pandas
    df = pd.DataFrame(datos_json)

    print("Datos cargados exitosamente en un DataFrame.")
    print("Primeras 5 filas del DataFrame:")
    print(df.head())
    # print(df.info())
else:
    print(f"Error al cargar los datos. Código de estado: {response.status_code}")

Datos cargados exitosamente en un DataFrame.
Primeras 5 filas del DataFrame:
   customerID Churn                                           customer  \
0  0002-ORFBO    No  {'gender': 'Female', 'SeniorCitizen': 0, 'Part...   
1  0003-MKNFE    No  {'gender': 'Male', 'SeniorCitizen': 0, 'Partne...   
2  0004-TLHLJ   Yes  {'gender': 'Male', 'SeniorCitizen': 0, 'Partne...   
3  0011-IGKFF   Yes  {'gender': 'Male', 'SeniorCitizen': 1, 'Partne...   
4  0013-EXCHZ   Yes  {'gender': 'Female', 'SeniorCitizen': 1, 'Part...   

                                             phone  \
0   {'PhoneService': 'Yes', 'MultipleLines': 'No'}   
1  {'PhoneService': 'Yes', 'MultipleLines': 'Yes'}   
2   {'PhoneService': 'Yes', 'MultipleLines': 'No'}   
3   {'PhoneService': 'Yes', 'MultipleLines': 'No'}   
4   {'PhoneService': 'Yes', 'MultipleLines': 'No'}   

                                            internet  \
0  {'InternetService': 'DSL', 'OnlineSecurity': '...   
1  {'InternetService': 'DSL', 'OnlineSecu

In [6]:
# Muestra un resumen conciso del DataFrame
df.info()

# Muestra el tipo de dato de cada columna
print("\nTipos de datos de cada columna:")
print(df.dtypes)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7267 entries, 0 to 7266
Data columns (total 6 columns):
 #   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 
 0   customerID  7267 non-null   object
 1   Churn       7267 non-null   object
 2   customer    7267 non-null   object
 3   phone       7267 non-null   object
 4   internet    7267 non-null   object
 5   account     7267 non-null   object
dtypes: object(6)
memory usage: 340.8+ KB

Tipos de datos de cada columna:
customerID    object
Churn         object
customer      object
phone         object
internet      object
account       object
dtype: object


# 🔄 2.- Transformación

**Aplanado de columnas**

In [7]:
# Aplanando la columna 'customer' y uniendo los resultados
df = pd.concat([df, pd.json_normalize(df['customer'])], axis=1)

# Aplanando la columna 'phone' y uniendo los resultados
df = pd.concat([df, pd.json_normalize(df['phone'])], axis=1)

# Aplanando la columna 'internet' y uniendo los resultados
df = pd.concat([df, pd.json_normalize(df['internet'])], axis=1)

# Aplanando la columna 'account' y uniendo los resultados
df = pd.concat([df, pd.json_normalize(df['account'])], axis=1)

# Mostramos el resultado para que veas todas las columnas.
print("DataFrame con columnas aplanadas y originales:")
# df.drop(columns=['customer', 'phone', 'internet', 'account'], inplace=True)
print(df.info())

DataFrame con columnas aplanadas y originales:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7267 entries, 0 to 7266
Data columns (total 25 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   customerID        7267 non-null   object 
 1   Churn             7267 non-null   object 
 2   customer          7267 non-null   object 
 3   phone             7267 non-null   object 
 4   internet          7267 non-null   object 
 5   account           7267 non-null   object 
 6   gender            7267 non-null   object 
 7   SeniorCitizen     7267 non-null   int64  
 8   Partner           7267 non-null   object 
 9   Dependents        7267 non-null   object 
 10  tenure            7267 non-null   int64  
 11  PhoneService      7267 non-null   object 
 12  MultipleLines     7267 non-null   object 
 13  InternetService   7267 non-null   object 
 14  OnlineSecurity    7267 non-null   object 
 15  OnlineBackup      7267 non-null   object 


**Mapeo nombre de columnas a sus traducciones**

In [8]:
# Mapear los nombres de las columnas a sus traducciones
columnas_traducidas = {
    'customerID': 'ID_cliente',
    'Churn': 'churn',
    'customer': 'cliente',
    'phone': 'telefono',
    'internet': 'internet',
    'account': 'cuenta',
    'gender': 'genero',
    'SeniorCitizen': 'adultoMayor',
    'Partner': 'pareja',
    'Dependents': 'dependientes',
    'tenure': 'permanenciaMeses',
    'PhoneService': 'servicioTelefonico',
    'MultipleLines': 'multiplesLineas',
    'InternetService': 'servicioInternet',
    'OnlineSecurity': 'seguridadOnline',
    'OnlineBackup': 'respaldoOnline',
    'DeviceProtection': 'proteccionDispositivo',
    'TechSupport': 'soporteTecnico',
    'StreamingTV': 'streamingTV',
    'StreamingMovies': 'streamingPeliculas',
    'Contract': 'tipoContrato',
    'PaperlessBilling': 'facturacionOnline',
    'PaymentMethod': 'metodoPago',
    'Charges.Monthly': 'cargosMensuales',
    'Charges.Total': 'cargosTotales'
}

# Renombrar las columnas del DataFrame
df = df.rename(columns=columnas_traducidas)

# Opcional: imprimir las nuevas columnas para verificar
print(df.columns)

Index(['ID_cliente', 'churn', 'cliente', 'telefono', 'internet', 'cuenta',
       'genero', 'adultoMayor', 'pareja', 'dependientes', 'permanenciaMeses',
       'servicioTelefonico', 'multipleslineas', 'servicioInternet',
       'seguridadOnline', 'respaldoOnline', 'proteccionDispositivo',
       'soporteTecnico', 'streamingTV', 'streamingPeliculas', 'tipoContrato',
       'facturacionOnline', 'metodoPago', 'cargosMensuales', 'cargosTotales'],
      dtype='object')


# 📥 3.- Carga

# 📊 4.- Análisis

# 📑 5.- Informe