<a href="https://colab.research.google.com/github/veterydaisy/TelecomX_LATAM_daisy/blob/main/TelecomX_LATAM.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Telecom X - Análisis de Evasión de Clientes**

<div align="justify">Has sido contratado como asistente de análisis de datos en Telecom X y formarás parte del proyecto "Churn de Clientes". La empresa enfrenta una alta tasa de cancelaciones y necesita comprender los factores que llevan a la pérdida de clientes.

Tu desafío será recopilar, procesar y analizar los datos, utilizando Python y sus principales bibliotecas para extraer información valiosa. A partir de tu análisis, el equipo de Data Science podrá avanzar en modelos predictivos y desarrollar estrategias para reducir la evasión.</div>

#📌 Extracción

In [263]:
#usamos requests porque lo estamos extrayendo directamente de una API

import requests
import pandas as pd
url = ('https://raw.githubusercontent.com/ingridcristh/challenge2-data-science-LATAM/refs/heads/main/TelecomX_Data.json')
response = requests.get(url)
data = response.json()

df  = pd.DataFrame(data)
print(df.head())

   customerID Churn                                           customer  \
0  0002-ORFBO    No  {'gender': 'Female', 'SeniorCitizen': 0, 'Part...   
1  0003-MKNFE    No  {'gender': 'Male', 'SeniorCitizen': 0, 'Partne...   
2  0004-TLHLJ   Yes  {'gender': 'Male', 'SeniorCitizen': 0, 'Partne...   
3  0011-IGKFF   Yes  {'gender': 'Male', 'SeniorCitizen': 1, 'Partne...   
4  0013-EXCHZ   Yes  {'gender': 'Female', 'SeniorCitizen': 1, 'Part...   

                                             phone  \
0   {'PhoneService': 'Yes', 'MultipleLines': 'No'}   
1  {'PhoneService': 'Yes', 'MultipleLines': 'Yes'}   
2   {'PhoneService': 'Yes', 'MultipleLines': 'No'}   
3   {'PhoneService': 'Yes', 'MultipleLines': 'No'}   
4   {'PhoneService': 'Yes', 'MultipleLines': 'No'}   

                                            internet  \
0  {'InternetService': 'DSL', 'OnlineSecurity': '...   
1  {'InternetService': 'DSL', 'OnlineSecurity': '...   
2  {'InternetService': 'Fiber optic', 'OnlineSecu...   
3  {'I

##**Conociendo el conjunto de datos**

###**Explorar las columnas del dataset y verificar sus tipos de datos.**

In [264]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7267 entries, 0 to 7266
Data columns (total 6 columns):
 #   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 
 0   customerID  7267 non-null   object
 1   Churn       7267 non-null   object
 2   customer    7267 non-null   object
 3   phone       7267 non-null   object
 4   internet    7267 non-null   object
 5   account     7267 non-null   object
dtypes: object(6)
memory usage: 340.8+ KB


###**Consultar el diccionario para comprender mejor el significado de las variables.**

**Diccionario de datos**

- `customerID`: número de identificación único de cada cliente
- `Churn`: si el cliente dejó o no la empresa
- `gender`: género (masculino y femenino)
- `SeniorCitizen`: información sobre si un cliente tiene o no una edad igual o mayor a 65 años
- `Partner`: si el cliente tiene o no una pareja
- `Dependents`: si el cliente tiene o no dependientes
- `tenure`: meses de contrato del cliente
- `PhoneService`: suscripción al servicio telefónico
- `MultipleLines`: suscripción a más de una línea telefónica
- `InternetService`: suscripción a un proveedor de internet
- `OnlineSecurity`: suscripción adicional de seguridad en línea
- `OnlineBackup`: suscripción adicional de respaldo en línea
- `DeviceProtection`: suscripción adicional de protección del dispositivo
- `TechSupport`: suscripción adicional de soporte técnico, menor tiempo de espera
- `StreamingTV`: suscripción de televisión por cable
- `StreamingMovies`: suscripción de streaming de películas
- `Contract`: tipo de contrato
- `PaperlessBilling`: si el cliente prefiere recibir la factura en línea
- `PaymentMethod`: forma de pago
- `Charges.Monthly`: total de todos los servicios del cliente por mes
- `Charges.Total`: total gastado por el cliente

###**Identificar las columnas más relevantes para el análisis de evasión.**

#🔧 Transformación

**Acciones más comunes**

+ Duplicados
+ Valores Vacíos
+ Valores nulos
+ Tipos de datos
+ Valores atípicos
+ Consistencia y validez de datos categóricos
+ Normalización de textos

In [265]:
df_normalizado = pd.json_normalize(data)
df_normalizado.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7267 entries, 0 to 7266
Data columns (total 21 columns):
 #   Column                     Non-Null Count  Dtype  
---  ------                     --------------  -----  
 0   customerID                 7267 non-null   object 
 1   Churn                      7267 non-null   object 
 2   customer.gender            7267 non-null   object 
 3   customer.SeniorCitizen     7267 non-null   int64  
 4   customer.Partner           7267 non-null   object 
 5   customer.Dependents        7267 non-null   object 
 6   customer.tenure            7267 non-null   int64  
 7   phone.PhoneService         7267 non-null   object 
 8   phone.MultipleLines        7267 non-null   object 
 9   internet.InternetService   7267 non-null   object 
 10  internet.OnlineSecurity    7267 non-null   object 
 11  internet.OnlineBackup      7267 non-null   object 
 12  internet.DeviceProtection  7267 non-null   object 
 13  internet.TechSupport       7267 non-null   objec

In [266]:
df_normalizado.head(50)

Unnamed: 0,customerID,Churn,customer.gender,customer.SeniorCitizen,customer.Partner,customer.Dependents,customer.tenure,phone.PhoneService,phone.MultipleLines,internet.InternetService,...,internet.OnlineBackup,internet.DeviceProtection,internet.TechSupport,internet.StreamingTV,internet.StreamingMovies,account.Contract,account.PaperlessBilling,account.PaymentMethod,account.Charges.Monthly,account.Charges.Total
0,0002-ORFBO,No,Female,0,Yes,Yes,9,Yes,No,DSL,...,Yes,No,Yes,Yes,No,One year,Yes,Mailed check,65.6,593.3
1,0003-MKNFE,No,Male,0,No,No,9,Yes,Yes,DSL,...,No,No,No,No,Yes,Month-to-month,No,Mailed check,59.9,542.4
2,0004-TLHLJ,Yes,Male,0,No,No,4,Yes,No,Fiber optic,...,No,Yes,No,No,No,Month-to-month,Yes,Electronic check,73.9,280.85
3,0011-IGKFF,Yes,Male,1,Yes,No,13,Yes,No,Fiber optic,...,Yes,Yes,No,Yes,Yes,Month-to-month,Yes,Electronic check,98.0,1237.85
4,0013-EXCHZ,Yes,Female,1,Yes,No,3,Yes,No,Fiber optic,...,No,No,Yes,Yes,No,Month-to-month,Yes,Mailed check,83.9,267.4
5,0013-MHZWF,No,Female,0,No,Yes,9,Yes,No,DSL,...,No,No,Yes,Yes,Yes,Month-to-month,Yes,Credit card (automatic),69.4,571.45
6,0013-SMEOE,No,Female,1,Yes,No,71,Yes,No,Fiber optic,...,Yes,Yes,Yes,Yes,Yes,Two year,Yes,Bank transfer (automatic),109.7,7904.25
7,0014-BMAQU,No,Male,0,Yes,No,63,Yes,Yes,Fiber optic,...,No,No,Yes,No,No,Two year,Yes,Credit card (automatic),84.65,5377.8
8,0015-UOCOJ,No,Female,1,No,No,7,Yes,No,DSL,...,No,No,No,No,No,Month-to-month,Yes,Electronic check,48.2,340.35
9,0016-QLJIS,No,Female,0,Yes,Yes,65,Yes,Yes,DSL,...,Yes,Yes,Yes,Yes,Yes,Two year,Yes,Mailed check,90.45,5957.9


In [267]:
#verifique si hay valores únicos en cada columna
for col in df_normalizado.columns:
  print(f"valores únicos en la columna'{col}': {df_normalizado[col].nunique()}")
  if df_normalizado[col].nunique() < 50: #imprima los valores solamente si no hay muchos
    print(df_normalizado[col].unique())
    print('-' * 50) #linea divisoria para mejorar visualización

valores únicos en la columna'customerID': 7267
valores únicos en la columna'Churn': 3
['No' 'Yes' '']
--------------------------------------------------
valores únicos en la columna'customer.gender': 2
['Female' 'Male']
--------------------------------------------------
valores únicos en la columna'customer.SeniorCitizen': 2
[0 1]
--------------------------------------------------
valores únicos en la columna'customer.Partner': 2
['Yes' 'No']
--------------------------------------------------
valores únicos en la columna'customer.Dependents': 2
['Yes' 'No']
--------------------------------------------------
valores únicos en la columna'customer.tenure': 73
valores únicos en la columna'phone.PhoneService': 2
['Yes' 'No']
--------------------------------------------------
valores únicos en la columna'phone.MultipleLines': 3
['No' 'Yes' 'No phone service']
--------------------------------------------------
valores únicos en la columna'internet.InternetService': 3
['DSL' 'Fiber optic' 'No'

In [268]:
# Verificando si hay duplicados
duplicados = df_normalizado.duplicated().sum()
print(f"Número de duplicados: {duplicados}")

#verificamos si hay valores Nulos
#es .values para que nos entregue un numero y no nos entregue un objeto
valores_nulos = df_normalizado.isnull().values.sum()
print(f"\nValores nuos por comlumna: ")
print(valores_nulos[valores_nulos > 0])

Número de duplicados: 0

Valores nuos por comlumna: 
[]


In [269]:
#verificando valores vacios o en blanco
valores_en_blanco_o_vacio = df_normalizado.apply(lambda x: x.astype(str).str.strip() == '').sum()
print("\nValores en blanco o vecíos por columna:")
print(valores_en_blanco_o_vacio[valores_en_blanco_o_vacio > 0])


Valores en blanco o vecíos por columna:
Churn                    224
account.Charges.Total     11
dtype: int64


In [270]:
df_normalizado.apply(lambda x: x.astype(str).str.strip() == '').sum()

Unnamed: 0,0
customerID,0
Churn,224
customer.gender,0
customer.SeniorCitizen,0
customer.Partner,0
customer.Dependents,0
customer.tenure,0
phone.PhoneService,0
phone.MultipleLines,0
internet.InternetService,0


In [271]:
#cambiando la columna account.Charges.Total  a Float
df_normalizado['account.Charges.Total'] = pd.to_numeric(df_normalizado['account.Charges.Total'], errors='coerce')
print(df_normalizado['account.Charges.Total'].dtype)

float64


In [272]:
#eliminamos las columnas vacias de Churn ya que no es un dato que perjudique  el resultado final
df_normalizado = df_normalizado[df_normalizado['Churn'].str.strip() != '']
print('Número de filas desppués de eliminar las vacias en "Churn":',len(df_normalizado))

Número de filas desppués de eliminar las vacias en "Churn": 7043


In [273]:
#Vacios o en blanco
df_normalizado.apply(lambda x: x.astype(str).str.strip() == '').sum()

Unnamed: 0,0
customerID,0
Churn,0
customer.gender,0
customer.SeniorCitizen,0
customer.Partner,0
customer.Dependents,0
customer.tenure,0
phone.PhoneService,0
phone.MultipleLines,0
internet.InternetService,0


In [274]:
df_normalizado.describe()

Unnamed: 0,customer.SeniorCitizen,customer.tenure,account.Charges.Monthly,account.Charges.Total
count,7043.0,7043.0,7043.0,7032.0
mean,0.162147,32.371149,64.761692,2283.300441
std,0.368612,24.559481,30.090047,2266.771362
min,0.0,0.0,18.25,18.8
25%,0.0,9.0,35.5,401.45
50%,0.0,29.0,70.35,1397.475
75%,0.0,55.0,89.85,3794.7375
max,1.0,72.0,118.75,8684.8


In [275]:
#Creando la columna cuentas diarias
df_normalizado['Cuentas_Diarias'] = df_normalizado['account.Charges.Monthly'] / 30
print(df_normalizado[['account.Charges.Monthly','Cuentas_Diarias']])

      account.Charges.Monthly  Cuentas_Diarias
0                       65.60         2.186667
1                       59.90         1.996667
2                       73.90         2.463333
3                       98.00         3.266667
4                       83.90         2.796667
...                       ...              ...
7262                    55.15         1.838333
7263                    85.10         2.836667
7264                    50.30         1.676667
7265                    67.85         2.261667
7266                    59.00         1.966667

[7043 rows x 2 columns]


In [276]:
#eliminando los dos NaN del final
df_normalizado = df_normalizado.drop('Cuentas_Diarias', errors='ignore')

In [277]:
df_normalizado

Unnamed: 0,customerID,Churn,customer.gender,customer.SeniorCitizen,customer.Partner,customer.Dependents,customer.tenure,phone.PhoneService,phone.MultipleLines,internet.InternetService,...,internet.DeviceProtection,internet.TechSupport,internet.StreamingTV,internet.StreamingMovies,account.Contract,account.PaperlessBilling,account.PaymentMethod,account.Charges.Monthly,account.Charges.Total,Cuentas_Diarias
0,0002-ORFBO,No,Female,0,Yes,Yes,9,Yes,No,DSL,...,No,Yes,Yes,No,One year,Yes,Mailed check,65.60,593.30,2.186667
1,0003-MKNFE,No,Male,0,No,No,9,Yes,Yes,DSL,...,No,No,No,Yes,Month-to-month,No,Mailed check,59.90,542.40,1.996667
2,0004-TLHLJ,Yes,Male,0,No,No,4,Yes,No,Fiber optic,...,Yes,No,No,No,Month-to-month,Yes,Electronic check,73.90,280.85,2.463333
3,0011-IGKFF,Yes,Male,1,Yes,No,13,Yes,No,Fiber optic,...,Yes,No,Yes,Yes,Month-to-month,Yes,Electronic check,98.00,1237.85,3.266667
4,0013-EXCHZ,Yes,Female,1,Yes,No,3,Yes,No,Fiber optic,...,No,Yes,Yes,No,Month-to-month,Yes,Mailed check,83.90,267.40,2.796667
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
7262,9987-LUTYD,No,Female,0,No,No,13,Yes,No,DSL,...,No,Yes,No,No,One year,No,Mailed check,55.15,742.90,1.838333
7263,9992-RRAMN,Yes,Male,0,Yes,No,22,Yes,Yes,Fiber optic,...,No,No,No,Yes,Month-to-month,Yes,Electronic check,85.10,1873.70,2.836667
7264,9992-UJOEL,No,Male,0,No,No,2,Yes,No,DSL,...,No,No,No,No,Month-to-month,Yes,Mailed check,50.30,92.75,1.676667
7265,9993-LHIEB,No,Male,0,Yes,Yes,67,Yes,No,DSL,...,Yes,Yes,No,Yes,Two year,No,Mailed check,67.85,4627.65,2.261667


In [278]:
# Renombrar las columnas
nuevos_nombres = {'customerID': 'ClienteID','Churn': 'Dejo la empresa','customer.gender': 'Genero', 'customer.SeniorCitizen': 'Adulto mayor', 'customer.Partner':'Tiene Pareja', 'customer.Dependents':'Tiene dependientes',
                  'customer.tenure':'Meses de contrato', 'phone.PhoneService':'Servicio telefonico', 'phone.MultipleLines':'Multilineas', 'internet.InternetService':'Servicio Internet',
                  'internet.OnlineSecurity':'Seguridad en linea', 'internet.OnlineBackup':'Respaldo en linea', 'internet.DeviceProtection':'Proteccion de dispositivos',
                  'internet.TechSupport':'Soporte tecnico', 'internet.StreamingTV':'Television por streaming','internet.StreamingMovies':'Suscripcion peliculas','account.Contract':'Tipo de Contrato',
                  'account.PaperlessBilling':'Factura online', 'account.PaymentMethod':'Metodo de pago', 'account.Charges.Monthly':'Total del mes',
                  'account.Charges.Total':'Total cliente'}
df_normalizado = df_normalizado.rename(columns=nuevos_nombres)

# Imprimir el DataFrame con los nuevos nombres de las columnas
df_normalizado.columns


Index(['ClienteID', 'Dejo la empresa', 'Genero', 'Adulto mayor',
       'Tiene Pareja', 'Tiene dependientes', 'Meses de contrato',
       'Servicio telefonico', 'Multilineas', 'Servicio Internet',
       'Seguridad en linea', 'Respaldo en linea', 'Proteccion de dispositivos',
       'Soporte tecnico', 'Television por streaming', 'Suscripcion peliculas',
       'Tipo de Contrato', 'Factura online', 'Metodo de pago', 'Total del mes',
       'Total cliente', 'Cuentas_Diarias'],
      dtype='object')

In [279]:
df_normalizado.shape

(7043, 22)

In [280]:
#columnas en minusculas
df_normalizado.columns = df_normalizado.columns.str.lower()
df_normalizado.columns

Index(['clienteid', 'dejo la empresa', 'genero', 'adulto mayor',
       'tiene pareja', 'tiene dependientes', 'meses de contrato',
       'servicio telefonico', 'multilineas', 'servicio internet',
       'seguridad en linea', 'respaldo en linea', 'proteccion de dispositivos',
       'soporte tecnico', 'television por streaming', 'suscripcion peliculas',
       'tipo de contrato', 'factura online', 'metodo de pago', 'total del mes',
       'total cliente', 'cuentas_diarias'],
      dtype='object')

In [281]:
#traduciendo al español la columna genero (gender)
# Reemplazar los valores
df_normalizado['genero'] = df_normalizado['genero'].replace({'Male': 'hombre', 'Female': 'mujer'})

# Imprimir el DataFrame para verificar
print(df_normalizado['genero'].unique())

['mujer' 'hombre']


In [282]:
#traduciendo al español las celdas de la columna dejo la empresa (churn)
df_normalizado['dejo la empresa'] = df_normalizado['dejo la empresa'].replace({'Yes': 'Si'})
#traducendo las celdas de la columna tiene pareja
df_normalizado['tiene pareja'] = df_normalizado['tiene pareja'].replace({'Yes': 'Si'})
#traduciendo las celdas de la columna tiene dependientes
df_normalizado['tiene dependientes'] = df_normalizado['tiene dependientes'].replace({'Yes': 'Si'})
#traduciendo las celdas de la columna servicio telefonico
df_normalizado['servicio telefonico'] = df_normalizado['servicio telefonico'].replace({'Yes': 'Si'})
#traduciendo las celdas de la columna multilineas
df_normalizado['multilineas'] = df_normalizado['multilineas'].replace({'Yes': 'Si','No phone service':'Sin servicio telefonico'})
#traduciendo las celdas de la columna servicio internet
df_normalizado['servicio internet'] = df_normalizado['servicio internet'].replace({'Fiber optic': 'Fibra optica'})
#traduciendo las celdas de la columna seguridad en linea
df_normalizado['seguridad en linea'] = df_normalizado['seguridad en linea'].replace({'Yes': 'Si','No internet service':'Sin servicio de internet'})
#traduciendo las celdas de la columna respaldo en linea
df_normalizado['respaldo en linea'] = df_normalizado['respaldo en linea'].replace({'Yes': 'Si','No internet service':'Sin servicio de internet'})
#traduciendo las celdas de la columna proteccion de dispositivo
df_normalizado['proteccion de dispositivos'] = df_normalizado['proteccion de dispositivos'].replace({'Yes': 'Si','No internet service':'Sin servicio de internet'})
#traduciendo las celdas de la columna soporte tecnico
df_normalizado['soporte tecnico'] = df_normalizado['soporte tecnico'].replace({'Yes': 'Si','No internet service':'Sin servicio de internet'})
#traduciendo las celdas de la columna television por Streaming
df_normalizado['television por streaming'] = df_normalizado['television por streaming'].replace({'Yes': 'Si','No internet service':'Sin servicio de internet'})
#traduciendo las celdas de la columna suscripcion de peliculas
df_normalizado['suscripcion peliculas'] = df_normalizado['suscripcion peliculas'].replace({'Yes': 'Si','No internet service':'Sin servicio de internet'})
#traduciendo las celdas de la columna tipo de contrato
df_normalizado['tipo de contrato'] = df_normalizado['tipo de contrato'].replace({'Month-to-month': 'Mensual','One year': 'Anual','Two year': 'Dos años'})
#traduciendo la sceldas de la columna factura online
df_normalizado['factura online'] = df_normalizado['factura online'].replace({'Yes': 'Si'})
#traduciendo las celdas de la columna metodo  de pago
df_normalizado['metodo de pago'] = df_normalizado['metodo de pago'].replace({'Electronic check': 'Cheque electronico','Mailed check': 'Cheque por correo','Bank transfer (automatic)': 'Transferencia bancaria (automatico)','Credit card (automatic)': 'Tarjeta de credito (automatico)'})

In [283]:
#receteando en index
df_normalizado.reset_index(inplace=True, drop=True)
df_normalizado

Unnamed: 0,clienteid,dejo la empresa,genero,adulto mayor,tiene pareja,tiene dependientes,meses de contrato,servicio telefonico,multilineas,servicio internet,...,proteccion de dispositivos,soporte tecnico,television por streaming,suscripcion peliculas,tipo de contrato,factura online,metodo de pago,total del mes,total cliente,cuentas_diarias
0,0002-ORFBO,No,mujer,0,Si,Si,9,Si,No,DSL,...,No,Si,Si,No,Anual,Si,Cheque por correo,65.60,593.30,2.186667
1,0003-MKNFE,No,hombre,0,No,No,9,Si,Si,DSL,...,No,No,No,Si,Mensual,No,Cheque por correo,59.90,542.40,1.996667
2,0004-TLHLJ,Si,hombre,0,No,No,4,Si,No,Fibra optica,...,Si,No,No,No,Mensual,Si,Cheque electronico,73.90,280.85,2.463333
3,0011-IGKFF,Si,hombre,1,Si,No,13,Si,No,Fibra optica,...,Si,No,Si,Si,Mensual,Si,Cheque electronico,98.00,1237.85,3.266667
4,0013-EXCHZ,Si,mujer,1,Si,No,3,Si,No,Fibra optica,...,No,Si,Si,No,Mensual,Si,Cheque por correo,83.90,267.40,2.796667
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
7038,9987-LUTYD,No,mujer,0,No,No,13,Si,No,DSL,...,No,Si,No,No,Anual,No,Cheque por correo,55.15,742.90,1.838333
7039,9992-RRAMN,Si,hombre,0,Si,No,22,Si,Si,Fibra optica,...,No,No,No,Si,Mensual,Si,Cheque electronico,85.10,1873.70,2.836667
7040,9992-UJOEL,No,hombre,0,No,No,2,Si,No,DSL,...,No,No,No,No,Mensual,Si,Cheque por correo,50.30,92.75,1.676667
7041,9993-LHIEB,No,hombre,0,Si,Si,67,Si,No,DSL,...,Si,Si,No,Si,Dos años,No,Cheque por correo,67.85,4627.65,2.261667


In [284]:
df_normalizado.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7043 entries, 0 to 7042
Data columns (total 22 columns):
 #   Column                      Non-Null Count  Dtype  
---  ------                      --------------  -----  
 0   clienteid                   7043 non-null   object 
 1   dejo la empresa             7043 non-null   object 
 2   genero                      7043 non-null   object 
 3   adulto mayor                7043 non-null   int64  
 4   tiene pareja                7043 non-null   object 
 5   tiene dependientes          7043 non-null   object 
 6   meses de contrato           7043 non-null   int64  
 7   servicio telefonico         7043 non-null   object 
 8   multilineas                 7043 non-null   object 
 9   servicio internet           7043 non-null   object 
 10  seguridad en linea          7043 non-null   object 
 11  respaldo en linea           7043 non-null   object 
 12  proteccion de dispositivos  7043 non-null   object 
 13  soporte tecnico             7043 

#📊 Carga y análisis

###**Análisis Descriptivo**

In [285]:
df_normalizado.describe()

Unnamed: 0,adulto mayor,meses de contrato,total del mes,total cliente,cuentas_diarias
count,7043.0,7043.0,7043.0,7032.0,7043.0
mean,0.162147,32.371149,64.761692,2283.300441,2.158723
std,0.368612,24.559481,30.090047,2266.771362,1.003002
min,0.0,0.0,18.25,18.8,0.608333
25%,0.0,9.0,35.5,401.45,1.183333
50%,0.0,29.0,70.35,1397.475,2.345
75%,0.0,55.0,89.85,3794.7375,2.995
max,1.0,72.0,118.75,8684.8,3.958333


In [286]:
import plotly.express as px

In [287]:
px.histogram(df_normalizado, x='genero', text_auto=True, color='dejo la empresa', barmode= 'group')

#📄Informe final