<a href="https://colab.research.google.com/github/bonillahermes/Data_Science_Projects/blob/main/EDA8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Hermes Yate Bonilla
**Data Scientist**
---

**Contact:**
- **Email:** [bonillahermes@gmail.com](mailto:bonillahermes@gmail.com)
- **LinkedIn:** [linkedin.com/in/bonillahermes](https://www.linkedin.com/in/bonillahermes/)
- **GitHub:** [github.com/bonillahermes](https://github.com/bonillahermes)
- **Webpage:** [bonillahermes.com](https://bonillahermes.com/)
---

# Informe de Análisis Estadístico sobre Billonarios Mundiales

## Introducción

El presente informe busca explorar diversas facetas de la riqueza global a través del análisis de datos de billonarios de todo el mundo. Utilizando la base de datos "Billionaires Statistics Dataset" creada por MIT y publicada en la plataforma Kaggle, este estudio se enfoca en comprender las diferencias en el valor neto según el origen de la riqueza, la representación de género en sectores industriales clave, y la edad en la que los individuos alcanzan el estatus de billonario.

## Objetivos

1. Investigar si existe una diferencia significativa en el valor neto entre billonarios autodidactas y herederos.
2. Analizar la representación de género en la industria tecnológica en comparación con otras industrias.
3. Determinar si la edad promedio de los billonarios difiere de una edad hipotética de 45 años.

## Estudios a Realizar y Elección de la Base de Datos

Utilizaremos la "Billionaires Statistics Dataset" para abordar los siguientes estudios:

### 1. Diferencia en el Valor Neto entre Autodidactas y Herederos

Exploraremos la influencia de la autogeneración de riqueza versus la herencia en el valor neto final de los billonarios.

### 2. Comparación de Género en la Industria Tecnológica

Investigaremos las dinámicas de género dentro de la industria tecnológica frente a otras industrias, con un enfoque en la representación femenina.

### 3. Edad Promedio de los Billonarios

Examinaremos cómo la edad promedio de los billonarios se compara con una edad hipotética de 45 años, buscando entender en qué etapa de la vida se suele alcanzar este nivel de éxito financiero.

La base de datos ha sido seleccionada por su cobertura comprensiva de información relevante a nuestros estudios, incluyendo datos personales, financieros, y demográficos de billonarios a nivel mundial.

# Estadísticos Descriptivos

### Librerías Necesarias

In [None]:
# Instalar paquetes necesarios
# if (!require("tidyverse")) install.packages("tidyverse")
# if (!require("ggplot2")) install.packages("ggplot2")
# if (!require(dplyr)) install.packages("dplyr")
if (!require(plotly)) install.packages("plotly")
if (!require(e1071)) install.packages("e1071")

In [None]:
library(ggplot2)
library(tidyverse)
library(plotly)
library(dplyr)
library(e1071)

### Descripción de la Base de Datos: Billionaires Statistics Dataset

La base de datos "Billionaires Statistics Dataset" ofrece una visión comprensiva de la riqueza y los datos demográficos a nivel mundial, incluyendo información detallada sobre individuos, sus fortunas, categorías de riqueza, orígenes, y varios indicadores económicos y demográficos por país. Esta base de datos fue publicada por el MIT el 8 de febrero del 2024 y es de uso público y se puede consultar en el siguiente link: https://www.kaggle.com/datasets/endofnight17j03/billionaires-statistics-dataset?select=Billionaires+Statistics+Dataset.csv

### Columnas Clave:
- `Rank`: Clasificación numérica de la persona.
- `finalWorth`: Valor neto final o riqueza neta en valor monetario.
- `category`: Categoría o clasificación del individuo, como "emprendedor", "inversor", "celebridad", etc.
- `age`: Edad de la persona.
- `country`, `city`: País y ciudad de residencia u origen.
- `source`: Fuente de la riqueza o fama.
- `industries`: Industrias o sectores asociados.
- `selfMade`: Indica si la riqueza es autogenerada o heredada.
- `gender`: Género del individuo.
- `cpi_country`, `gdp_country`, `life_expectancy_country`: Indicadores económicos y demográficos específicos del país.


In [None]:
# Cargar el dataset
df <- read.csv("data.csv")

# Ver las primeras filas del dataframe
head(df)

In [None]:
# Verificar la estructura del dataframe
str(df)

In [None]:
df<- df %>%
  drop_na(age, finalWorth)

In [None]:
# Convertir 'Industries' a factor
df$industries <- as.factor(df$industries)
# Convertir 'gender' a factor
df$gender <- as.factor(df$gender)
# Convertir selfMade a factor con etiquetas más descriptivas
df$selfMade <- as.factor(ifelse(df$selfMade == TRUE, "Autodidacta", "Heredero"))

## Estadísticos descriptivos generales para age y finalWorth

Los estadísticos descriptivos revelan que la edad media de los billonarios es de 65 años con una desviación estándar de aproximadamente 13 años, indicando una distribución relativamente equilibrada en torno a la mediana de 65 años, como lo sugiere la leve asimetría negativa y una curtosis ligeramente menor que la de una distribución normal. En contraste, el valor neto promedio es de aproximadamente 4,679 millones de dólares, con una mediana significativamente más baja de 2,400 millones de dólares, lo cual, junto con una desviación estándar considerable de aproximadamente 9,942 millones de dólares, un mínimo de 1,000 millones y un máximo de 211,000 millones de dólares, refleja una distribución muy sesgada con una asimetría positiva y una curtosis extremadamente alta, indicando la presencia de valores atípicos que distorsionan el promedio hacia cifras más altas y una concentración de la riqueza en un pequeño grupo de individuos con un valor neto excepcionalmente alto.

In [None]:
# Estadísticos descriptivos generales para age y finalWorth
df %>%
  summarise(
    Age_Mean = mean(age, na.rm = TRUE),
    Age_Median = median(age, na.rm = TRUE),
    Age_SD = sd(age, na.rm = TRUE),
    Age_Min = min(age, na.rm = TRUE),
    Age_Max = max(age, na.rm = TRUE),
    Age_Skewness = skewness(age, na.rm = TRUE),
    Age_Kurtosis = kurtosis(age, na.rm = TRUE),
    FinalWorth_Mean = mean(finalWorth, na.rm = TRUE),
    FinalWorth_Median = median(finalWorth, na.rm = TRUE),
    FinalWorth_SD = sd(finalWorth, na.rm = TRUE),
    FinalWorth_Min = min(finalWorth, na.rm = TRUE),
    FinalWorth_Max = max(finalWorth, na.rm = TRUE),
    FinalWorth_Skewness = skewness(finalWorth, na.rm = TRUE),
    FinalWorth_Kurtosis = kurtosis(finalWorth, na.rm = TRUE)
  )


In [None]:
# Crear el histograma del valor neto final
ggplot(df, aes(x = finalWorth)) +
  geom_histogram(aes(y = ..density..), binwidth = 1000, fill = "skyblue", color = "white") +
  geom_density(alpha = 0.2, fill = "skyblue") + # Añadir una curva de densidad para visualizar mejor la distribución
  labs(title = "Distribución del Valor Neto Final de los Billonarios",
       x = "Valor Neto Final",
       y = "Densidad") +
  theme_minimal()


In [None]:
# Crear el histograma de edad
ggplot(df, aes(x = age)) +
  geom_histogram(aes(y = ..density..), fill = "skyblue", color = "white") +
  geom_density(alpha = 0.2, fill = "skyblue") + # Añadir una curva de densidad para visualizar mejor la distribución
  labs(title = "Distribución de la Edad de los Billonarios",
       x = "Valor Neto Final",
       y = "Densidad") +
  theme_minimal()

## Estadísticos descriptivos de age y finalWorth por género

La tabla de estadísticos descriptivos segmentada por género muestra que las mujeres billonarias tienen una edad promedio ligeramente menor y una distribución de edades más concentrada en comparación con sus contrapartes masculinas, reflejado en una desviación estándar menor y una curtosis y asimetría cercanas a cero, sugiriendo una distribución más simétrica y menos puntiaguda. En términos de valor neto, aunque las medias son similares entre géneros, la distribución del valor neto para las mujeres es menos variable pero también menos sesgada, como indica una menor desviación estándar y una asimetría más baja. Sin embargo, los hombres billonarios presentan una curtosis mucho mayor, lo que implica una mayor presencia de valores atípicos extremos en el valor neto final, siendo el valor máximo de los hombres considerablemente más alto que el de las mujeres. Esto sugiere que, mientras que el valor neto promedio entre hombres y mujeres billonarios puede ser similar, hay una mayor proporción de hombres con fortunas excepcionalmente grandes.

In [None]:
# Estadísticos descriptivos de age y finalWorth por género
df %>%
  group_by(gender) %>%
  summarise(
    Age_Mean = mean(age, na.rm = TRUE),
    Age_Median = median(age, na.rm = TRUE),
    Age_SD = sd(age, na.rm = TRUE),
    Age_Min = min(age, na.rm = TRUE),
    Age_Max = max(age, na.rm = TRUE),
    Age_Skewness = skewness(age, na.rm = TRUE),
    Age_Kurtosis = kurtosis(age, na.rm = TRUE),
    FinalWorth_Mean = mean(finalWorth, na.rm = TRUE),
    FinalWorth_Median = median(finalWorth, na.rm = TRUE),
    FinalWorth_SD = sd(finalWorth, na.rm = TRUE),
    FinalWorth_Min = min(finalWorth, na.rm = TRUE),
    FinalWorth_Max = max(finalWorth, na.rm = TRUE),
    FinalWorth_Skewness = skewness(finalWorth, na.rm = TRUE),
    FinalWorth_Kurtosis = kurtosis(finalWorth, na.rm = TRUE)
  )


In [None]:
# Crear el diagrama de caja para comparar el valor neto final entre géneros
ggplot(df, aes(x = gender, y = finalWorth, fill = gender)) +
  geom_boxplot() +
  scale_y_log10() + # Usar escala logarítmica para manejar grandes variaciones en finalWorth
  scale_fill_manual(values = c("F" = "skyblue", "M" = "green")) +
  labs(title = "Comparación del Valor Neto Final entre Géneros",
       x = "Género",
       y = "Valor Neto Final (Escala Logarítmica)",
       fill = "Género") +
  theme_minimal() +
  theme(legend.position = "none") # Remover la leyenda si es necesario

In [None]:
# Crear el diagrama de caja para comparar la edad entre géneros
ggplot(df, aes(x = gender, y = age, fill = gender)) +
  geom_boxplot() +
  scale_fill_manual(values = c("F" = "skyblue", "M" = "green")) +
  labs(title = "Comparación de la Edad entre Géneros",
       x = "Género",
       y = "Edad",
       fill = "Género") +
  theme_minimal() +
  theme(legend.position = "none") # Remover la leyenda si es necesario

## Estadísticos descriptivos de age y finalWorth por Industria

In [None]:
# Estadísticos descriptivos de age y finalWorth por Industria
df %>%
  group_by(industries) %>%
  summarise(
    Age_Mean = mean(age, na.rm = TRUE),
    Age_Median = median(age, na.rm = TRUE),
    Age_SD = sd(age, na.rm = TRUE),
    Age_Min = min(age, na.rm = TRUE),
    Age_Max = max(age, na.rm = TRUE),
    Age_Skewness = skewness(age, na.rm = TRUE),
    Age_Kurtosis = kurtosis(age, na.rm = TRUE),
    FinalWorth_Mean = mean(finalWorth, na.rm = TRUE),
    FinalWorth_Median = median(finalWorth, na.rm = TRUE),
    FinalWorth_SD = sd(finalWorth, na.rm = TRUE),
    FinalWorth_Min = min(finalWorth, na.rm = TRUE),
    FinalWorth_Max = max(finalWorth, na.rm = TRUE),
    FinalWorth_Skewness = skewness(finalWorth, na.rm = TRUE),
    FinalWorth_Kurtosis = kurtosis(finalWorth, na.rm = TRUE)
  )

In [None]:
# Crear el diagrama de caja para ver la distribución de finalWorth por industria
ggplot(df, aes(x = industries, y = finalWorth, fill = industries)) +
  geom_boxplot() +
  scale_y_log10() + # Usar escala logarítmica para manejar grandes variaciones en finalWorth
  labs(title = "Distribución del Valor Neto Final por Industria",
       x = "Industria",
       y = "Valor Neto Final (Escala Logarítmica)") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1), # Rotar etiquetas del eje x para mejor legibilidad
        legend.position = "none") # Remover la leyenda si no es necesaria


In [None]:
# Crear el diagrama de caja para ver la distribución de finalWorth por industria
ggplot(df, aes(x = industries, y = age, fill = industries)) +
  geom_boxplot() +
  labs(title = "Distribución de la Edad por Industria",
       x = "Industria",
       y = "Edad") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1), # Rotar etiquetas del eje x para mejor legibilidad
        legend.position = "none") # Remover la leyenda si no es necesaria

## Estadísticos descriptivos de age y finalWorth por selfMade

La tabla muestra estadísticos descriptivos de la edad y el valor neto final, segmentados por si los billonarios son autodidactas o herederos. Los autodidactas tienen una edad promedio ligeramente menor (aproximadamente 65 años) y una menor mediana de edad que los herederos, lo que indica que alcanzan el estatus de billonarios un poco más temprano. Además, la distribución de la edad de los autodidactas es más simétrica y menos puntiaguda en comparación con los herederos, como se muestra en los valores de asimetría y curtosis cercanos a cero. En cuanto al valor neto final, los herederos tienen un valor medio y una mediana más altos, así como una mayor desviación estándar, lo que sugiere una variabilidad más amplia en sus fortunas. Además, ambos grupos muestran una fuerte asimetría positiva y altos valores de curtosis, aunque los herederos presentan valores ligeramente mayores, lo que implica una mayor concentración de valores netos extremadamente altos entre los herederos que entre los autodidactas.

In [None]:
# Estadísticos descriptivos de age y finalWorth por selfMade
df %>%
  group_by(selfMade) %>%
  summarise(
    Age_Mean = mean(age, na.rm = TRUE),
    Age_Median = median(age, na.rm = TRUE),
    Age_SD = sd(age, na.rm = TRUE),
    Age_Min = min(age, na.rm = TRUE),
    Age_Max = max(age, na.rm = TRUE),
    Age_Skewness = skewness(age, na.rm = TRUE),
    Age_Kurtosis = kurtosis(age, na.rm = TRUE),
    FinalWorth_Mean = mean(finalWorth, na.rm = TRUE),
    FinalWorth_Median = median(finalWorth, na.rm = TRUE),
    FinalWorth_SD = sd(finalWorth, na.rm = TRUE),
    FinalWorth_Min = min(finalWorth, na.rm = TRUE),
    FinalWorth_Max = max(finalWorth, na.rm = TRUE),
    FinalWorth_Skewness = skewness(finalWorth, na.rm = TRUE),
    FinalWorth_Kurtosis = kurtosis(finalWorth, na.rm = TRUE)
  )


In [None]:
# Crear el diagrama de caja con ggplot aplicando escala logarítmica en el eje y
ggplot(df, aes(x = selfMade, y = finalWorth)) +
  geom_boxplot(aes(fill = selfMade)) +
  scale_y_log10() + # Aplicar escala logarítmica para el eje y
  scale_fill_manual(values = c("Autodidacta" = "skyblue", "Heredero" = "green")) +
  labs(title = "Diferencia en Valor Neto entre Autodidactas y Herederos",
       x = "Tipo de Riqueza",
       y = "Valor Neto (Escala Logarítmica)") + # Ajustar etiqueta del eje y para reflejar la escala logarítmica
  theme_minimal() +
  theme(legend.title = element_blank()) # Remover el título de la leyenda si es necesario


In [None]:
# Crear el diagrama de caja con ggplot
ggplot(df, aes(x = selfMade, y = age)) +
  geom_boxplot(aes(fill = selfMade)) +
  scale_fill_manual(values = c("Autodidacta" = "skyblue", "Heredero" = "green")) +
  labs(title = "Diferencia en Edades entre Autodidactas y Herederos",
       x = "Tipo de Riqueza",
       y = "Edad") + # Ajustar etiqueta del eje y
  theme_minimal() +
  theme(legend.title = element_blank()) # Remover el título de la leyenda si es necesario

## Estadística Inferencial: Contraste de Hipótesis

Los contrastes de hipótesis, según Mood (1974), también conocidos como pruebas de hipótesis, son un método estadístico clave en la estadística inferencial, diseñado para evaluar afirmaciones sobre las características poblacionales utilizando datos muestrales. Este proceso implica comparar la hipótesis nula $H_0$ con la hipótesis alternativa $H_1$.

### Propósito de los Contrastes de Hipótesis

El objetivo principal de los contrastes de hipótesis, segun Walpole (1999), es determinar si la evidencia muestral es suficientemente fuerte como para rechazar $H_0$ en favor de $H_1$, dentro de un nivel de significancia $\alpha$ preestablecido.

### Ejemplo de Parámetros en los Contrastes de Hipótesis

Según Montgomery (1996), los siguientes parámetros son aquellos usados con más frecuencia:

- **Media $\mu$**
  - **Una población:** Se utiliza el test t de Student o el test z para analizar la media poblacional.
  - **Dos poblaciones:** Se emplea el test t de Student para muestras independientes o emparejadas para comparar las medias.

- **Proporción $\pi$**
  - **Una población:** El test z para proporciones evalúa la proporción poblacional.
  - **Dos poblaciones:** El test z para dos proporciones compara las proporciones entre dos grupos.

- **Varianza $\sigma^2$**
  - **Una población:** El test $\chi^2$ para varianza examina la varianza poblacional.
  - **Dos poblaciones:** El test F de Fisher contrasta las varianzas de dos poblaciones.


## Pasos para Realizar un Contraste de Hipótesis

1. **Formulación de Hipótesis:** Definir $H_0$ y $H_1$ basándose en la investigación o pregunta de interés.
2. **Establecimiento del Nivel de Significancia $\alpha$:** Seleccionar el nivel de significancia que determinará el umbral para rechazar $H_0$.
3. **Selección de la Prueba Estadística:** Escoger la prueba adecuada según el tipo de datos y las hipótesis formuladas.
4. **Cálculo del Valor P o del Estadístico de Prueba:** Determinar el valor P asociado al resultado de la prueba o calcular el estadístico de prueba según corresponda.
5. **Decisión:** Tomar una decisión sobre $H_0$ basándose en el valor P o el estadístico de prueba. Se rechaza $H_0$ si el valor P es menor que $\alpha$, o si el estadístico de prueba cae dentro de la región crítica.


## Pruebas de Hipótesis Propuestas

A continuación, se describen tres pruebas de hipótesis que podríamos realizar con esta base de datos:

## Propuesta 1: Diferencia en el Valor Neto entre Autodidactas y Herederos

En esta propuesta, nos enfocamos en analizar las diferencias en el valor neto entre los billonarios que han generado su riqueza por sí mismos (autodidactas) y aquellos que han heredado su fortuna. Este análisis busca entender cómo la forma de adquirir la riqueza puede influir en el monto total de la misma.

**Parámetro de Interés:** Valor promedio ($\mu$) neto final (`finalWorth`) de los billonarios.

**Sistema de Hipótesis:**
- $H_0$: No hay diferencia en el valor neto medio entre billonarios autodidactas y herederos.
- $H_1$: Existe una diferencia en el valor neto medio entre billonarios autodidactas y herederos.

Este análisis nos permitirá discernir si la autogeneración de riqueza tiene un impacto significativo en el valor neto de un billonario comparado con aquellos que han heredado su fortuna.




In [None]:
autodidactas <- df %>% filter(selfMade == "Autodidacta")
herederos <- df %>% filter(selfMade == "Heredero")
t.test(autodidactas$finalWorth, herederos$finalWorth)

El test t de Welch realizado para comparar el valor neto medio entre billonarios autodidactas y herederos arrojó un estadístico t de -1.1729 con 1448.5 grados de libertad y un valor p de 0.241, lo que indica que no existe una diferencia estadísticamente significativa en el valor neto medio entre ambos grupos. El intervalo de confianza del 95% (-1349.6493 a 339.6228) incluye el cero, reforzando la conclusión de que no hay evidencia suficiente para afirmar que la manera de adquirir la riqueza (autogenerada vs. heredada) afecta significativamente el monto del valor neto de los billonarios en esta muestra. Aunque las medias de valor neto para autodidactas (4465.397 millones de dólares) y herederos (4970.411 millones de dólares) difieren numéricamente, esta diferencia no es estadísticamente significativa.

## Propuesta 2: Comparación de Género en la Industria Tecnológica

La segunda propuesta tiene como objetivo investigar la representación de género en la industria tecnológica en comparación con otras industrias. Este análisis es crucial para entender las dinámicas de género dentro de sectores altamente influyentes y potencialmente identificar áreas de mejora en cuanto a inclusión y diversidad.

**Parámetro de Interés:** Proporción ($\pi$) de mujeres en la industria tecnológica versus otras industrias.

**Sistema de Hipótesis:**
- $H_0$: La proporción de mujeres en la industria tecnológica es igual a la proporción de mujeres en otras industrias.
- $H_1$: La proporción de mujeres en la industria tecnológica no es igual a la proporción de mujeres en otras industrias.

Con esta propuesta, buscamos evidencia estadística que nos permita comprender si la industria tecnológica se distingue de otras en términos de diversidad de género, proporcionando así insights valiosos sobre la equidad de género en el ámbito laboral.



In [None]:
tecnologia_mujeres <- df %>% filter(industries == "Technology" & gender == "F")
otras_industrias_mujeres <- df %>% filter(industries != "Technology" & gender == "F")
prop.test(c(nrow(tecnologia_mujeres), nrow(otras_industrias_mujeres)), c(nrow(df %>% filter(industries == "Technology")), nrow(df %>% filter(industries != "Technology"))))


El test de 2 muestras para la igualdad de proporciones con corrección de continuidad se utilizó para comparar la proporción de mujeres en la industria tecnológica frente a otras industrias. El resultado del test muestra un valor de $\chi^2$ de 2.9807 con 1 grado de libertad y un valor p de 0.08426. Esto indica que, aunque hay una diferencia en las proporciones de mujeres entre la industria tecnológica (prop 1 = 0.0955414) y otras industrias (prop 2 = 0.1319862), esta diferencia no es estadísticamente significativa al nivel común de $\alpha$=0.05. El intervalo de confianza del 95% para la diferencia de proporciones va de -0.0735563212 a 0.0006666388, incluyendo el cero, lo que respalda la conclusión de que no hay evidencia suficiente para rechazar la hipótesis nula de igualdad de proporciones. En resumen, los resultados sugieren que no hay una diferencia significativa en la representación de género entre la industria tecnológica y otras industrias basándonos en los datos analizados.

## Propuesta 3: Comparación de la Edad Promedio de los Billonarios con una Edad Hipotética

En esta revisada propuesta, analizaremos la edad promedio de los billonarios para determinar si difiere de una edad promedio hipotética de 45 años. Este análisis nos permitirá entender si los billonarios tienden a alcanzar su riqueza antes o después de este punto de referencia etario.

**Parámetro de Interés:** Edad promedio de los billonarios (`age`).

**Sistema de Hipótesis:**
- $H_0$: La edad promedio de los billonarios es igual a 45 años.
- $H_1$: La edad promedio de los billonarios no es igual a 45 años.

Este enfoque nos brinda la oportunidad de evaluar si la acumulación de riqueza significativa está asociada con una etapa particular de la vida, proporcionando así insights sobre el tiempo que generalmente toma alcanzar este nivel de éxito financiero.



In [None]:
# Asegurándonos de que 'age' es numérica
df$age <- as.numeric(df$age)

# Realizando el test t de una muestra
t_test_result <- t.test(df$age, mu = 45)

# Imprimiendo los resultados
print(t_test_result)


El test t de una muestra aplicado a la edad de los billonarios arrojó un estadístico t de 77.085 con 2574 grados de libertad y un valor p significativamente menor que 0.05, lo que indica una fuerte evidencia estadística para rechazar la hipótesis nula de que la edad promedio de los billonarios es de 45 años. Con un intervalo de confianza del 95% que va de aproximadamente 64.63 a 65.65 años, y una media muestral de 65.14 años, los resultados sugieren que, en promedio, los billonarios alcanzan su riqueza a una edad significativamente mayor que la hipotética de 45 años, lo que podría implicar que la acumulación de riqueza significativa está más comúnmente asociada con etapas más avanzadas de la vida, destacando la importancia de la experiencia y la madurez en el éxito financiero.

## Conclusiones

Basándonos en los resultados obtenidos:

- **Valor Neto:** No se encontró una diferencia estadísticamente significativa en el valor neto entre billonarios autodidactas y herederos, sugiriendo que la manera en que se adquiere la riqueza no afecta significativamente su magnitud.
- **Género en la Tecnología:** Aunque se observó una tendencia hacia una menor representación de mujeres en la industria tecnológica comparada con otras industrias, esta diferencia no fue estadísticamente significativa.
- **Edad de Billonarios:** La edad promedio de los billonarios fue significativamente mayor que la hipótesis de 45 años, con una media de aproximadamente 65 años, indicando que la mayoría de los billonarios alcanzan su riqueza en etapas más avanzadas de la vida.

Estos hallazgos ofrecen una visión valiosa sobre las características y dinámicas de los billonarios a nivel mundial, destacando la complejidad de los factores que contribuyen al éxito financiero extremo.

## Referencias

- Montgomery, D. C., Runger, G. C. y Medal, E. G. U. (1996). Probabilidad y estadística aplicadas a la ingeniería. EUA, McGraw Hil.

- Mood, A. M., Graybill, F. A. y Boes, D. C. (1974). Introduction to the theory of  statistics. Sigapore: McGraw-Hill

- Walpole, R. E., Myers, R. H. y Myers, S. L. (1999). Probabilidad y estadística para ingenieros. EUA, Pearson Educación.
