 # **<font color="DarkBlue">Gráficos Estadísticos</font>**

<p align="center">
<img src="https://plotly.com/all_static/images/graphing_library_dark.svg" width="350" height="">
</p>


https://plotly.com/python/statistical-charts/

<p align="justify">
Para entender el análisis de datos en profundidad, es esencial conocer distintos tipos de gráficos estadísticos que facilitan la interpretación y el descubrimiento de patrones en los datos. A continuación, se explican varios gráficos avanzados que permiten visualizar tanto la variabilidad como las distribuciones y relaciones entre variables en un conjunto de datos.
<br><br>
<b>Barras de Errores</b><br><br>
Un gráfico de <i>barras de errores</i> muestra valores de datos con su rango de error o variabilidad en torno al valor central. Se utilizan para representar la incertidumbre o variabilidad en una medida, permitiendo la evaluación de la confiabilidad de los resultados. La barra de error puede representar el error estándar, desviación estándar o intervalo de confianza alrededor de la media (μ). Para una muestra de datos con desviación estándar $s$ y tamaño de muestra $n$, el error estándar de la media se calcula como:
<br><br>
$$
\text{Error\ estándar\ de\ la\ media} = \frac{s}{\sqrt{n}}
$$
<br>
Este gráfico es útil en análisis comparativos, donde queremos saber si la variación observada en los datos de diferentes grupos es significativa.
<br><br>
 <p align="center">
<img src="https://images.plot.ly/plotly-documentation/thumbnail/error-bar.jpg" width="150" height="">
<br><br>
<p align="justify">
<b>Box Plots</b><br><br>
El <i>box plot</i> o <i>gráfico de caja y bigotes</i> es una representación gráfica de la distribución de datos numéricos basada en un resumen de cinco números: mínimo, primer cuartil (Q1), mediana (Q2), tercer cuartil (Q3) y máximo. Los <i>bigotes</i> representan los límites de los datos excluyendo valores atípicos, y la caja indica el rango intercuartílico (IQR), que es la diferencia entre el tercer y primer cuartil:
<br><br>
$$
IQR = Q3 - Q1
$$
<br>
Este gráfico es ideal para identificar la dispersión, la simetría de la distribución y los posibles valores atípicos en los datos.
<br><br>
<p align="center">
<img src="https://images.plot.ly/plotly-documentation/thumbnail/box.jpg" width="150" height="">
</p>
<br><br>
<p align="justify">
<b>Histogramas</b><br><br>
El <i>histograma</i> es una representación gráfica de la distribución de un conjunto de datos continuos. Los datos se agrupan en intervalos, y el tamaño de cada barra indica la frecuencia de observaciones dentro de cada intervalo. Es ideal para visualizar la forma de la distribución (simétrica, sesgada, etc.), la variabilidad y la densidad de los datos. El área total de las barras en el histograma representa el conjunto completo de datos.
<br><br>
<p align="center">
<img src="https://images.plot.ly/plotly-documentation/thumbnail/histogram.jpg" width="150" height="">
</p>
<br><br>
<p align="justify">
<b>Parallel Categories Diagram</b><br><br>
El <i>Parallel Categories Diagram</i> es un gráfico utilizado para visualizar relaciones y comparaciones entre variables categóricas. Las categorías se muestran en columnas, y las conexiones entre las categorías representan las relaciones entre ellas. Este gráfico es útil en análisis exploratorio para observar combinaciones de valores en múltiples categorías y descubrir patrones complejos en datos categóricos.
<br><br>
<p align="center">
<img src="https://images.plot.ly/plotly-documentation/thumbnail/parcats.jpg" width="150" height="">
</p>
<br><br>
<p align="justify">
<b>Violin Plots</b><br><br>
El <i>violin plot</i> es un gráfico que combina características de un box plot y un KDE. La parte central muestra el rango intercuartílico y la mediana, mientras que los lados del gráfico representan la densidad de probabilidad de los datos, lo que facilita la comparación de distribuciones entre grupos. Es útil para comparar distribuciones en diferentes categorías y visualizar tanto la variabilidad como la densidad de los datos en un solo gráfico.
<br><br>
<p align="center">
<img src="https://images.plot.ly/plotly-documentation/thumbnail/violin.jpg" width="150" height="">
</p>
<br><br>
<p align="justify">
📊 Estos gráficos avanzados amplían la capacidad de análisis, permitiendo una mejor comprensión de la distribución, variabilidad y relaciones en el conjunto de datos, y contribuyen significativamente en el análisis estadístico y la toma de decisiones.</p>


 # **<font color="DarkBlue">Generando un gráfico Barra de Errores</font>**

<p align="justify">
Un <b>gráfico de barras de errores</b> es una herramienta de visualización que muestra el valor promedio de una variable junto con una barra que indica su rango de variabilidad o incertidumbre. Cada barra de error representa un intervalo alrededor del valor promedio, el cual puede estar basado en el error estándar, la desviación estándar o el intervalo de confianza de los datos. Este gráfico permite visualizar si las diferencias observadas entre categorías son significativas y si la variabilidad en los datos es considerable.
<br><br>
La barra de error puede calcularse de varias formas según el contexto:
<ul>
    <li>El <i>error estándar de la media</i> se usa para representar la variabilidad de una muestra en relación con la media, calculado como $\frac{s}{\sqrt{n}}$, donde $s$ es la desviación estándar y $n$ el tamaño de la muestra.</li>
    <li>La <i>desviación estándar</i> se utiliza para representar la dispersión de los datos alrededor de la media.</li>
    <li>El <i>intervalo de confianza</i> se utiliza para representar un rango en el cual se espera que el valor verdadero se encuentre con una determinada probabilidad, generalmente 95%.</li>
</ul>
<p align="justify">
<br>
En el análisis de negocios, los gráficos de barras de errores son útiles para comparar variables en diferentes grupos, como ventas promedio en distintas regiones, y evaluar la confianza en los resultados, ayudando a identificar variaciones significativas y tomar decisiones basadas en la confiabilidad de los datos.</p>


<p align="justify"> 👀 Ejemplo:  
<br><br>
Gráfico de barras de errores para visualizar el promedio de ventas en diferentes regiones y su variabilidad.

In [None]:
# Importar las librerías necesarias
import pandas as pd
import plotly.express as px
import numpy as np

In [None]:
# Crear un DataFrame de ejemplo con datos de ventas y desviación estándar en diferentes regiones
data = {'Region': ['Norte', 'Sur', 'Este', 'Oeste'],
        'Ventas_Promedio': [20000, 25000, 22000, 27000],  # Ventas promedio en dólares
        'Desviacion': [3000, 4000, 3500, 4500]            # Desviación estándar de ventas
}

df = pd.DataFrame(data)
df

Unnamed: 0,Region,Ventas_Promedio,Desviacion
0,Norte,20000,3000
1,Sur,25000,4000
2,Este,22000,3500
3,Oeste,27000,4500


In [None]:
# Crear el gráfico de barras de errores
fig = px.bar(df,
             x='Region',
             y='Ventas_Promedio',
             title='Promedio de Ventas por Región con Barras de Error',
             labels={'Ventas_Promedio': 'Ventas Promedio ($)', 'Region': 'Región'},
             error_y='Desviacion',  # Añadir la barra de error usando la desviación estándar
             color='Region')


# Mejorar el diseño del gráfico
fig.update_layout(
    template="plotly_white",  # Fondo blanco para mayor claridad
    showlegend=False
)


# Mostrar el gráfico
fig.show()

En este gráfico de barras de errores:

- Las barras representan el promedio de ventas para cada región.
- Las barras de error reflejan la desviación estándar de ventas en cada región, proporcionando una idea de la variabilidad de las ventas.

<p align="justify">
<br>
Este gráfico ayuda a identificar si la variabilidad en las ventas es alta o baja en cada región, permitiendo a los analistas de negocios evaluar si las diferencias en el promedio de ventas son estadísticamente significativas y si es necesario tomar acciones para mejorar la estabilidad de las ventas en ciertas regiones.

In [None]:
# Crear el gráfico de barra de errores
fig = px.line(df,
              x='Region',
              y='Ventas_Promedio',
              title='Promedio de Ventas por Región con Barras de Error',
              labels={'Ventas_Promedio': 'Ventas Promedio ($)', 'Region': 'Región'},
              error_y='Desviacion',  # Añadir la barra de error usando la desviación estándar
              markers=True
              )


# Mejorar el diseño del gráfico
fig.update_layout(
    template="plotly_white",  # Fondo blanco para mayor claridad
    showlegend=False
)


# Mostrar el gráfico
fig.show()

 # **<font color="DarkBlue">Generando un gráfico Box Plots</font>**

<p align="justify">
Un <b>box plot</b>, o <i>gráfico de caja y bigotes</i>, es un gráfico estadístico que representa la distribución de un conjunto de datos numéricos mediante un resumen de cinco números clave: el mínimo, el primer cuartil (Q1), la mediana (Q2), el tercer cuartil (Q3) y el máximo. Estos elementos se visualizan en una caja (que representa el rango intercuartílico o IQR) y dos líneas llamadas <i>bigotes</i> que indican la variación de los datos fuera de los cuartiles. El IQR se calcula como:
<br><br>
$$
IQR = Q3 - Q1
$$
<br>
La caja abarca desde Q1 hasta Q3, donde se encuentra el 50% de los datos. La mediana, ubicada dentro de la caja, divide los datos en dos partes iguales. Los bigotes indican la extensión de los datos, aunque excluyen los valores atípicos, que suelen mostrarse como puntos individuales fuera de los bigotes.
<br><br>
Los box plots son útiles para observar la distribución y variabilidad de los datos, identificar valores atípicos, y comparar la dispersión de datos en diferentes grupos. En un contexto de negocios, los box plots pueden ser utilizados para analizar el rango de variabilidad en ventas, tiempos de entrega, ingresos, entre otros, y observar si hay diferencias significativas entre grupos o categorías.</p>


<p align="justify"> 👀 Ejemplo:  
<br><br>
Gráfico de box plot para analizar la distribución de ventas mensuales en diferentes regiones de una empresa.

In [None]:
# Crear un DataFrame de ejemplo con datos de ventas mensuales en diferentes regiones
np.random.seed(42)  # Para reproducibilidad de datos
data = {'Region': np.repeat(['Norte', 'Sur', 'Este', 'Oeste'], 50),
        'Ventas': np.concatenate([np.random.normal(20000, 3000, 50),  # Ventas en Norte
                                  np.random.normal(25000, 5000, 50),  # Ventas en Sur
                                  np.random.normal(22000, 4000, 50),  # Ventas en Este
                                  np.random.normal(27000, 4500, 50)   # Ventas en Oeste
    ])
}

df = pd.DataFrame(data)
df


Unnamed: 0,Region,Ventas
0,Norte,21490.142459
1,Norte,19585.207096
2,Norte,21943.065614
3,Norte,24569.089569
4,Norte,19297.539876
...,...,...
195,Oeste,28733.928209
196,Oeste,23022.641537
197,Oeste,27691.762977
198,Oeste,27261.939233


In [None]:
# Crear el gráfico box plot
fig = px.box(df,
             x='Region',
             y='Ventas',
             title='Distribución de Ventas Mensuales por Región',
             labels={'Ventas': 'Ventas Mensuales ($)', 'Region': 'Región'},
             color='Region')


# Mejorar el diseño del gráfico
fig.update_layout(
    title_font_size=18,
    xaxis_title_font_size=16,
    yaxis_title_font_size=16,
    template="plotly_white",  # Fondo blanco para mayor claridad
    showlegend=False
)

# Mostrar el gráfico
fig.show()

En este box plot:
<br><br>

- Las cajas representan el rango intercuartílico (IQR), que abarca el 50% central de las ventas en cada región.
- La línea en el centro de cada caja es la mediana de las ventas mensuales en cada región.
- Los bigotes representan la extensión de los datos hasta aproximadamente 1.5 veces el IQR desde Q1 y Q3, y los puntos fuera de los bigotes son valores atípicos.

<p align="justify">
<br>
Este gráfico permite observar la variabilidad en las ventas mensuales de cada región y comparar la dispersión entre ellas. Por ejemplo, si una región tiene valores atípicos elevados, podría investigarse para entender si hay factores específicos que elevan sus ventas en ciertos meses.

 # **<font color="DarkBlue">Generando un Histograma</font>**

<p align="justify">
Un <b>histograma</b> es una representación gráfica de la distribución de un conjunto de datos continuos. Los datos se dividen en intervalos o <i>bins</i>, y cada bin muestra la frecuencia de los valores que caen dentro de ese rango. La altura de cada barra en el histograma indica el número de observaciones dentro de cada intervalo, permitiendo visualizar la densidad de los datos a lo largo de su rango.
<br><br>
El histograma es particularmente útil para observar la forma de la distribución de los datos (simétrica, sesgada, multimodal, etc.), la concentración de valores y la variabilidad. Esto permite a los analistas identificar patrones como sesgos, acumulación en ciertos rangos, y detectar valores extremos. Además, los histogramas facilitan el análisis de la dispersión, ayudando a visualizar la consistencia de los datos y posibles tendencias en su frecuencia.
<br><br>
En un contexto de negocios, los histogramas se utilizan para observar la distribución de variables como ingresos, tiempos de entrega, precios de productos, entre otros. Esto puede ayudar a las empresas a identificar rangos de valores con más ocurrencias y ajustar sus estrategias en función de la distribución observada.</p>


<p align="justify"> 👀 Ejemplo:  
<br><br>
Gráfico histograma para visualizar la distribución de tiempos de entrega de pedidos en una empresa.

In [None]:
# Crear un DataFrame de ejemplo con datos de tiempos de entrega (en días) de diferentes pedidos
np.random.seed(42)  # Para reproducibilidad de datos
data = {'Tiempo_Entrega': np.random.normal(5, 1.5, 1000)  # Tiempos de entrega en días
}

df = pd.DataFrame(data)
df


Unnamed: 0,Tiempo_Entrega
0,5.745071
1,4.792604
2,5.971533
3,7.284545
4,4.648770
...,...
995,4.578350
996,7.696530
997,5.961264
998,4.143232


In [None]:
# Crear el histograma
fig = px.histogram(df, x='Tiempo_Entrega', nbins=20,
                   title='Distribución de Tiempos de Entrega de Pedidos',
                   labels={'Tiempo_Entrega': 'Tiempo de Entrega (días)'},
                   opacity=0.75)

# Mejorar el diseño del gráfico
fig.update_layout(
    title_font_size=20,
    xaxis_title_font_size=16,
    yaxis_title_font_size=16,
    template="plotly_white",  # Fondo blanco para mayor claridad
    bargap=0.2                # Separación entre barras
)

# Mostrar el gráfico
fig.show()

En este histograma:
<br><br>

- Cada barra representa el número de pedidos que se entregaron en un rango de días específico.
- La altura de cada barra muestra la frecuencia de tiempos de entrega dentro de ese rango.

<p align="justify">
<br>
Este histograma permite a la empresa ver cuál es el tiempo de entrega más común y cómo se distribuyen los tiempos en general. Si hay una acumulación de tiempos altos, podría ser necesario investigar retrasos o problemas en el proceso de entrega. Por otro lado, si el tiempo de entrega promedio es bajo y consistente, la empresa podría usar esta métrica como un indicador positivo en sus informes de servicio.








In [None]:
# Crear el histograma con ajustes adicionales
fig = px.histogram(df,
                   x='Tiempo_Entrega',
                   nbins=20,
                   title='Distribución de Tiempos de Entrega de Pedidos',
                   labels={'Tiempo_Entrega': 'Tiempo de Entrega (días)'},
                   opacity=0.7,  # Ajuste de opacidad para claridad en la visualización
                   marginal='rug',  # Agrega un "rug plot" para visualizar datos individuales
                   histnorm='probability density'  # Normalizar el histograma para ver la densidad
                  )

# Añadir línea de densidad para una mejor visualización
fig.update_traces(marker_color='cornflowerblue', marker_line_color='darkblue', marker_line_width=1)
fig.add_scatter(x=np.linspace(df['Tiempo_Entrega'].min(), df['Tiempo_Entrega'].max(), 100),
                y=np.exp(-0.5*((np.linspace(df['Tiempo_Entrega'].min(), df['Tiempo_Entrega'].max(), 100) - df['Tiempo_Entrega'].mean()) / df['Tiempo_Entrega'].std())**2) / (df['Tiempo_Entrega'].std() * np.sqrt(2 * np.pi)),
                mode='lines', name='Densidad', line=dict(color='darkorange', width=2))

# Mejorar el diseño del gráfico
fig.update_layout(
    title_font_size=18,
    xaxis_title_font_size=16,
    yaxis_title_font_size=16,
    template="plotly_white",  # Fondo blanco para mayor claridad
    yaxis_title="Densidad de Frecuencia",
    xaxis=dict(tickangle=-45),
    bargap=0.2
)

# Mostrar el gráfico
fig.show()

- **Normalización de Frecuencia**: Al normalizar el histograma como "densidad de probabilidad" (histnorm='probability density'), podemos observar la forma de la distribución sin que dependa del tamaño de los datos, lo cual permite comparar fácilmente distribuciones similares.
- **Rug Plot**: Agregar una línea marginal o "rug plot" (marginal='rug') proporciona un desglose detallado de la posición de los datos individuales a lo largo del eje X.
- **Línea de Densidad**: Se añadió una línea de densidad normal teórica en color naranja sobre el histograma, lo cual facilita la interpretación de la distribución y permite ver si los datos siguen aproximadamente una distribución normal.
- **Ajustes de Color y Estilo**: Colores contrastantes en la barra y borde de cada intervalo del histograma (marker_color y marker_line_color), mejorando la claridad y atractivo visual.

<br>
<p align="justify">
Este gráfico permite observar rápidamente la concentración de tiempos de entrega, si hay sesgo en los datos y cualquier posible asimetría o variabilidad que pueda estar presente.

 # **<font color="DarkBlue">Generando un Parallel Categories Diagram</font>**

<p align="justify">
Un <b>Parallel Categories Diagram</b>, o diagrama de categorías paralelas, es una herramienta de visualización que permite analizar relaciones complejas entre varias variables categóricas al mostrarlas en una serie de ejes paralelos. Cada eje representa una variable, y las líneas que conectan los ejes muestran combinaciones de valores de las distintas categorías, permitiendo explorar cómo los valores de una categoría están relacionados con los valores de otras categorías.
<br><br>
Este tipo de diagrama es especialmente útil para identificar patrones y flujos en datos con varias dimensiones categóricas, como puede ser la relación entre características demográficas de clientes, tipos de productos y comportamientos de compra. Gracias a su estructura visual, es posible rastrear fácilmente la frecuencia y la proporción de combinaciones específicas, lo que resulta beneficioso para el análisis de segmentación y la toma de decisiones estratégicas en un contexto de negocios.
</p>


<p align="justify"> 👀 Ejemplo:  
<br><br>
Se analizarán los datos de preferencias de productos por región y segmento de cliente, para entender cómo los diferentes segmentos prefieren ciertos tipos de productos en distintas regiones.

In [None]:
# Crear un DataFrame de ejemplo con datos de preferencias de productos
data = {
    'Región': ['Norte', 'Sur', 'Este', 'Oeste', 'Norte', 'Sur', 'Este', 'Oeste'],
    'Segmento_Cliente': ['Empresas', 'Empresas', 'Empresas', 'Empresas', 'Individuos', 'Individuos', 'Individuos', 'Individuos'],
    'Tipo_Producto': ['Electrónicos', 'Electrónicos', 'Muebles', 'Muebles', 'Electrónicos', 'Muebles', 'Electrónicos', 'Muebles'],
    'Preferencia_Compra': ['Alta', 'Baja', 'Media', 'Alta', 'Media', 'Alta', 'Baja', 'Media']
}

df = pd.DataFrame(data)
df

Unnamed: 0,Región,Segmento_Cliente,Tipo_Producto,Preferencia_Compra
0,Norte,Empresas,Electrónicos,Alta
1,Sur,Empresas,Electrónicos,Baja
2,Este,Empresas,Muebles,Media
3,Oeste,Empresas,Muebles,Alta
4,Norte,Individuos,Electrónicos,Media
5,Sur,Individuos,Muebles,Alta
6,Este,Individuos,Electrónicos,Baja
7,Oeste,Individuos,Muebles,Media


In [None]:
# Crear el diagrama de categorías paralelas con Plotly
fig = px.parallel_categories(df,
                             dimensions=['Región', 'Segmento_Cliente', 'Tipo_Producto', 'Preferencia_Compra'],
                             color_continuous_scale=px.colors.sequential.Inferno,
                             title='Relación entre Región, Segmento de Cliente, Tipo de Producto y Preferencia de Compra')

# Mejorar el diseño del gráfico
fig.update_layout(
    title_font_size=18,
    template="plotly_white"  # Fondo blanco para mayor claridad
)

# Mostrar el gráfico
fig.show()

En este diagrama de categorías paralelas:
<br><br>

- Cada eje representa una variable categórica: Región, Segmento de Cliente, Tipo de Producto y Preferencia de Compra.
- Las líneas conectan las categorías entre los ejes, mostrando la proporción y relación entre los valores de cada eje. Esto permite ver, por ejemplo, cómo el segmento de "Empresas" en la región "Norte" tiene una preferencia alta por productos electrónicos.
- Coloración: El color ayuda a resaltar las combinaciones con mayor frecuencia, facilitando la detección de patrones.

<p align="justify"><br>
Este gráfico permite a una empresa analizar la relación entre ubicación geográfica, tipo de cliente, preferencia de producto y nivel de preferencia de compra. Esto es útil para tomar decisiones informadas sobre el inventario o campañas de marketing dirigidas a ciertos segmentos y ubicaciones con mayor potencial de compra.








 # **<font color="DarkBlue">Generando un Violin Plots</font>**

<p align="justify">
Un <b>gráfico de violín</b> es una visualización que combina características de un box plot y un gráfico de densidad. Este tipo de gráfico representa la distribución de un conjunto de datos a través de su forma, mostrando la densidad de los datos a diferentes valores. En lugar de mostrar solo las estadísticas resumidas (como la mediana y los cuartiles) como en un box plot, el gráfico de violín proporciona una visión más detallada de la distribución de los datos, lo que permite observar patrones, picos y variaciones en la densidad.
<br><br>
Los gráficos de violín son útiles para comparar la distribución de una variable entre diferentes grupos o categorías. Por ejemplo, en un contexto de negocios, se pueden utilizar para analizar la distribución de los ingresos por diferentes segmentos de mercado, permitiendo a las empresas identificar no solo el promedio de ingresos, sino también cómo varían los ingresos dentro de cada segmento, ayudando en la segmentación de clientes y en la identificación de oportunidades de mercado.
</p>


<p align="justify"> 👀 Ejemplo:  
<br><br>
Se analizarán los datos de preferencias de productos por región y segmento de cliente, para entender cómo los diferentes segmentos prefieren ciertos tipos de productos en distintas regiones.

In [None]:
# Crear un DataFrame de ejemplo con datos de ingresos mensuales de clientes
np.random.seed(42)  # Para reproducibilidad de datos
data = {
    'Segmento_Cliente': ['Empresas'] * 500 + ['Individuos'] * 500,
    'Ingreso_Mensual': np.concatenate([
        np.random.normal(5000, 1000, 500),  # Ingresos para Empresas
        np.random.normal(3000, 800, 500)    # Ingresos para Individuos
    ])
}

df = pd.DataFrame(data)
df

Unnamed: 0,Segmento_Cliente,Ingreso_Mensual
0,Empresas,5496.714153
1,Empresas,4861.735699
2,Empresas,5647.688538
3,Empresas,6523.029856
4,Empresas,4765.846625
...,...,...
995,Individuos,2775.119766
996,Individuos,4438.149221
997,Individuos,3512.674289
998,Individuos,2543.056808


In [None]:
# Crear el gráfico de violín con Plotly
fig = px.violin(df,
                y='Ingreso_Mensual',
                x='Segmento_Cliente',
                box=True,  # Mostrar un box plot dentro del gráfico de violín
                points='all',  # Mostrar todos los puntos de datos
                title='Distribución de Ingresos Mensuales por Segmento de Cliente',
                labels={'Ingreso_Mensual': 'Ingreso Mensual', 'Segmento_Cliente': 'Segmento de Cliente'},
                color='Segmento_Cliente',  # Colorear por segmento
                template="plotly_white"  # Fondo blanco para mayor claridad
                )

# Mejorar el diseño del gráfico
fig.update_layout(
    title_font_size=18,
    yaxis_title="Ingreso Mensual",
    xaxis_title="Segmento de Cliente",
    yaxis_title_font_size=16,
    xaxis_title_font_size=16,
    violingap=0.5  # Espacio entre los gráficos de violín
)

# Mostrar el gráfico
fig.show()

En este gráfico de violín:
<br><br>

- **Ejes**: El eje X representa los segmentos de clientes (Empresas e Individuos), mientras que el eje Y muestra los ingresos mensuales.
- **Gráficos de violín**: Cada gráfico muestra la distribución de ingresos para cada segmento de clientes, permitiendo observar cómo se distribuyen los ingresos dentro de cada grupo.
- **Box plot**: Se incluye un box plot dentro del gráfico de violín, proporcionando información adicional como la mediana y los cuartiles de los ingresos.
- **Puntos individuales**: Se muestran todos los puntos de ingresos individuales, lo que permite una comprensión más profunda de la variabilidad de los datos.

<p align="justify">
<br>
Este gráfico permite a una empresa identificar las diferencias en la distribución de ingresos entre diferentes segmentos de clientes. Por ejemplo, se puede observar si los ingresos de las empresas tienden a ser más altos y con una mayor variabilidad en comparación con los ingresos de los individuos. Esta información es valiosa para la toma de decisiones estratégicas, como el enfoque de marketing y la segmentación de productos.

<br>
<br>
<p align="center"><b>
💗
<font color="DarkBlue">
Hemos llegado al final de nuestro colab, a seguir codeando...
</font>
</p>
