# üìä An√°lisis de Evasi√≥n de Clientes ‚Äì Telecom X

Este notebook analiza los datos de clientes de una empresa de telecomunicaciones para identificar patrones de cancelaci√≥n (churn).

## üîß Librer√≠as necesarias

In [None]:
import pandas as pd
import requests
import plotly.express as px

## üì• Extracci√≥n de datos

In [None]:
url = "https://raw.githubusercontent.com/sthemonica/alura-voz/refs/heads/main/Dados/Telco-Customer-Churn.json"
response = requests.get(url)
data = response.json()

df_plano = pd.json_normalize(data)
print("‚úÖ Datos cargados exitosamente")

## üîç Exploraci√≥n inicial

In [None]:
# Informaci√≥n general
df_plano.info()

# Duplicados
print(f"üîç N√∫mero de duplicados: {df_plano.duplicated().sum()}")

# Nulos por columna
print("üîç Nulos por columna:\n", df_plano.isnull().sum())

# Vac√≠os o blancos
print("üîç Valores en blanco por columna:\n", df_plano.apply(lambda x: x.astype(str).str.strip() == '').sum())

In [None]:
# Valores √∫nicos por columna
for col in df_plano.columns:
    print(f"\nüß† Columna: {col}")
    print(f"Valores √∫nicos: {df_plano[col].nunique()}")
    if df_plano[col].nunique() < 50:
        print(df_plano[col].unique())
        print('-' * 50)

## üßπ Transformaci√≥n de columnas

In [None]:
# Convertir 'account.Charges.Total' a num√©rico
df_plano['account.Charges.Total'] = pd.to_numeric(df_plano['account.Charges.Total'], errors='coerce')
print(f"Tipo de dato de 'account.Charges.Total': {df_plano['account.Charges.Total'].dtype}")

# Eliminar filas sin valor en 'Churn'
df_plano = df_plano[df_plano['Churn'].str.strip() != '']
print(f"‚úÖ Filas despu√©s de limpiar 'Churn': {len(df_plano)}")

## üìà Estad√≠sticas y limpieza extra

In [None]:
# Estad√≠sticas b√°sicas
print(df_plano.describe(include='all'))

# Eliminar columna temporal si existe
df_plano = df_plano.drop('Cuentas_Diarias', errors='ignore')

## üìä Visualizaci√≥n con Plotly

In [None]:
fig = px.histogram(
    df_plano,
    x='customer.gender',
    color='Churn',
    barmode='group',
    text_auto=True,
    title='üìä Cancelaciones por G√©nero'
)
fig.update_layout(xaxis_title='G√©nero', yaxis_title='Cantidad de Clientes')
fig.show()