 # **<font color="DarkBlue">Generaci√≥n de muestras aleatorias</font>**

<p align="center">
<img src="https://numpy.org/images/logo.svg" width="80" height="">
</p>


https://numpy.org

<p align="justify">
‚úÖ La generaci√≥n de n√∫meros aleatorios es fundamental en estad√≠stica y simulaci√≥n de experimentos. <code>NumPy</code> proporciona una amplia gama de funciones en el m√≥dulo <code>numpy.random</code> para generar muestras aleatorias de diferentes distribuciones.
<br><br>
üëÄ A continuaci√≥n, se presentan algunas distribuciones comunes y ejemplos de su aplicaci√≥n:

<p align="justify"> üëÄ Por convenci√≥n, de esta manera se importa <code>Numpy</code> y se importa <code>plotly</code> que vamos a utilizar para visualizar:  </p>

In [None]:
import numpy as np

In [None]:
import plotly.express as px

 ## **<font color="DarkBlue">Distribuci√≥n uniforme</font>**

<p align="justify">
‚úÖ La distribuci√≥n uniforme genera n√∫meros aleatorios en un rango especificado con igual probabilidad. Esto puede ser √∫til para simular eventos donde todas las posibilidades son igualmente probables.
<br><br>
La distribuci√≥n uniforme es un tipo de distribuci√≥n de probabilidad en la que todos los valores dentro de un rango espec√≠fico son igualmente probables. Para una variable aleatoria \( X \) con una distribuci√≥n uniforme continua en el intervalo \([a, b]\), la funci√≥n de densidad de probabilidad (pdf) se define como:
<br><br>
$$ f(x) =
\begin{cases}
\frac{1}{b - a} & \text{si } a \leq x \leq b \\
0 & \text{en otro caso}
\end{cases}
$$
<br><br>
donde \( a \) y \( b \) son los l√≠mites inferior y superior del intervalo, respectivamente. La distribuci√≥n uniforme puede ser discreta o continua, dependiendo de si los valores posibles de la variable aleatoria son finitos o infinitos.
<br><br>
La distribuci√≥n uniforme puede ser utilizada para modelar situaciones en las que todos los resultados posibles son igualmente probables. Un ejemplo com√∫n es la simulaci√≥n de precios de mercado en ausencia de informaci√≥n sobre la demanda y la oferta, donde se asume que cualquier precio dentro de un rango espec√≠fico es igualmente probable. Esto puede ayudar en la evaluaci√≥n de riesgos y en la toma de decisiones bajo incertidumbre.


<p align="justify">
üëÄ Por ejemplo, supongamos que queremos modelar la distribuci√≥n de tiempos de espera de los clientes en una tienda, donde los clientes pueden llegar en cualquier momento dentro de un intervalo de tiempo espec√≠fico.

In [None]:
np.random.seed(0)

In [None]:
# Generar datos de tiempos de espera de los clientes (distribuci√≥n uniforme)
tiempos_espera = np.random.uniform(low=0, high=30, size=1000)  # Tiempos de espera en minutos, de 0 a 30 minutos

In [None]:
px.histogram(x=tiempos_espera,
             title="Distribuci√≥n Uniforme de tiempos de espera de clientes",
             labels={"x":"Tiempo de Espera (minutos)"},
             template="gridon").update_layout(bargap=0.2)

 ## **<font color="DarkBlue">Distribuci√≥n normal</font>**

‚úÖ La distribuci√≥n normal es una de las distribuciones m√°s importantes en estad√≠stica y modelado de datos. Puede representar muchos fen√≥menos en la naturaleza y los negocios, como la altura de las personas o los ingresos de una poblaci√≥n.
<br><br>
La distribuci√≥n normal, tambi√©n conocida como distribuci√≥n de Gauss, es una distribuci√≥n de probabilidad continua que se caracteriza por su forma de campana sim√©trica. Para una variable aleatoria $X $ con una distribuci√≥n normal, la funci√≥n de densidad de probabilidad se define como:
<br><br>
$$ f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2 \sigma^2}\right) $$
<br>
donde:
- $ \mu $ es la media de la distribuci√≥n,
- $ \sigma $ es la desviaci√≥n est√°ndar,
- $ \sigma^2 $ es la varianza,
- $ \exp $ es la funci√≥n exponencial.

<p align="justify">
<br>
La distribuci√≥n normal es fundamental en la estad√≠stica y la probabilidad debido a su relaci√≥n con el teorema central del l√≠mite, que establece que, bajo ciertas condiciones, la suma de muchas variables aleatorias independientes y identicamente distribuidas tiende a una distribuci√≥n normal, independientemente de la distribuci√≥n original de las variables.
<br><br>
La distribuci√≥n normal es ampliamente utilizada en diversas √°reas para modelar fen√≥menos naturales y procesos industriales. Un ejemplo com√∫n es la modelaci√≥n de los retornos de inversi√≥n en mercados financieros, donde se asume que los retornos siguen una distribuci√≥n normal. Esto permite realizar an√°lisis de riesgo y optimizaci√≥n de carteras, basados en la probabilidad de diferentes niveles de retorno y la volatilidad asociada.
<br><br>
üëÄ Por ejemplo, supongamos que queremos simular los ingresos anuales de una muestra de empleados de una empresa:


In [None]:
# Simular ingresos anuales de una muestra de empleados
ingresos_anuales = np.random.normal(loc=90000, scale=10000, size=400).round(2)

In [None]:
px.histogram(x=ingresos_anuales,
             title="Distribuci√≥n ingresos anuales de empleados",
             labels={"x":"Ingresos anuales"},
             template="gridon").update_layout(bargap=0.2)

<p align="justify">
üëÄ Otro ejemplo, supongamos que queremos modelar la distribuci√≥n de la altura de los clientes de una tienda de camisas para determinar el tama√±o promedio que deber√≠amos tener en stock....

In [None]:
# Generar datos de altura de los clientes (distribuci√≥n normal)
altura_clientes = np.random.normal(loc=170, scale=10, size=1000)

In [None]:
px.histogram(x=altura_clientes,
             nbins=30,
             title="Distribuci√≥n de altura de los clientes",
             labels={"x":"Altura (cm)"},
             template="gridon").update_layout(bargap=0.2)

 ## **<font color="DarkBlue">Distribuci√≥n binomial</font>**

<p align="justify">
‚úÖ La distribuci√≥n binomial modela el n√∫mero de √©xitos en una serie de ensayos independientes con una probabilidad de √©xito constante.
<br><br>
La distribuci√≥n binomial es una distribuci√≥n de probabilidad discreta que describe el n√∫mero de √©xitos en una secuencia de $ n $ experimentos de Bernoulli independientes, cada uno con una probabilidad de √©xito $ p $. La funci√≥n de masa de probabilidad  para una variable aleatoria $ X $ con una distribuci√≥n binomial se define como:
<br><br>
\[ P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k} \]
<br><br>
donde:

- $ \binom{n}{k} $ es el coeficiente binomial, que se calcula como $ \frac{n!}{k!(n - k)!} $,
- $ n $ es el n√∫mero de experimentos,
- $ k $ es el n√∫mero de √©xitos,
- $ p $ es la probabilidad de √©xito en cada experimento,
- $ 1 - p $ es la probabilidad de fracaso.

<p align="justify">
<br>
La distribuci√≥n binomial es √∫til para modelar situaciones en las que hay dos posibles resultados (√©xito o fracaso) en una serie de experimentos repetidos de manera independiente.
<br><br>
Un ejemplo com√∫n es la evaluaci√≥n del n√∫mero de ventas exitosas en una serie de llamadas de telemarketing, donde cada llamada puede resultar en una venta (√©xito) o no (fracaso), y la probabilidad de √©xito es constante para cada llamada. Esto puede ayudar en la planificaci√≥n de estrategias de ventas y en la estimaci√≥n de ingresos futuros basados en la probabilidad de √©xito y el n√∫mero de intentos.
<br><br>
üëÄ Por ejemplo, supongamos que queremos simular el n√∫mero de clientes que compran un producto en una tienda en l√≠nea durante una hora:


In [None]:
# Simular el n√∫mero de clientes que compran un producto en una tienda en l√≠nea durante una hora
num_clientes = np.random.binomial(n=100, p=0.1, size=1)
num_clientes

array([7])

<p align="justify">
üëÄ Otro ejemplo, supongamos que queremos modelar la probabilidad de que un cliente realice una compra en una tienda en l√≠nea, donde la probabilidad de compra es del 30% y realizamos 100 intentos de compra...

In [None]:
# Simular el n√∫mero de clientes que compran un producto en una tienda en l√≠nea
num_clientes_compran = np.random.binomial(n=100, p=0.3, size=800)

In [None]:
px.histogram(x=num_clientes_compran,
             nbins=20,
             title="N√∫mero de clientes que compran un producto",
             labels={"x":"N√∫mero de Clientes que Compran"},
             template="gridon").update_layout(bargap=0.2)

 ## **<font color="DarkBlue">Distribuci√≥n de Poisson</font>**

<p align="justify">
‚úÖ La distribuci√≥n de Poisson modela el n√∫mero de eventos que ocurren en un intervalo de tiempo o espacio fijo, dado que los eventos ocurren a una tasa constante e independientemente del tiempo o espacio.
<br><br>
La distribuci√≥n de Poisson es una distribuci√≥n de probabilidad discreta que describe el n√∫mero de eventos que ocurren en un intervalo de tiempo o espacio fijo, cuando estos eventos ocurren con una tasa promedio constante y de manera independiente unos de otros. La funci√≥n de masa de probabilidad para una variable aleatoria $ X $ con una distribuci√≥n de Poisson se define como:
<br><br>
\[ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} \]

donde:
- $ \lambda $ es la tasa promedio de ocurrencia de eventos,
- $ k $ es el n√∫mero de eventos,
- $ e $ es la base del logaritmo natural (aproximadamente 2.71828),
- $ k! $ es el factorial de $ k $.

<p align="justify">
<br>
La distribuci√≥n de Poisson es √∫til para modelar situaciones en las que se cuenta el n√∫mero de eventos que ocurren en un intervalo determinado.
<br><br>
Un ejemplo com√∫n es la modelaci√≥n del n√∫mero de llegadas de clientes a un banco en una hora determinada, donde se asume que las llegadas son independientes y ocurren con una tasa promedio constante. Esto puede ayudar en la planificaci√≥n de recursos, como la dotaci√≥n de personal, para asegurar un servicio eficiente basado en la tasa esperada de llegadas.
<br><br>
üëÄ Por ejemplo, supongamos que queremos simular el n√∫mero de llamadas de servicio al cliente recibidas en una hora`


In [None]:
# Simular el n√∫mero de llamadas de servicio al cliente recibidas en una hora
num_llamadas = np.random.poisson(lam=10, size=1)
num_llamadas

array([6])

- **lam $=10$**: Este es el par√°metro Œª de la distribuci√≥n de Poisson, que representa la tasa promedio de ocurrencia de eventos. En este caso, se asume que, en promedio, se reciben 10 llamadas de servicio al cliente por hora.
- **size $=1$**: Esto especifica el n√∫mero de muestras a generar. En este caso, se genera una sola muestra.

<p align="justify">
üëÄ Otro ejemplo, supongamos que queremos modelar el n√∫mero de llamadas de servicio al cliente recibidas en una hora, donde recibimos un promedio de 10 llamadas por hora, pero generamos 1000 muestras.


In [None]:
# Simular el n√∫mero de llamadas de servicio al cliente recibidas en una hora
num_llamadas = np.random.poisson(lam=10, size=1000)

In [None]:
px.histogram(x=num_llamadas,
             nbins=20,
             title="Distribuci√≥n de Poisson de llamadas de Servicio al Cliente",
             labels={"x":"N√∫mero de llamadas"},
             template="gridon").update_layout(bargap=0.2)

 # **<font color="DarkBlue">C√°lculo de medidas de tendencia central y dispersi√≥n</font>**

<p align="justify">
‚úÖ Las medidas de tendencia central y dispersi√≥n son fundamentales en estad√≠stica para resumir y comprender la distribuci√≥n de los datos. NumPy proporciona funciones para calcular estas medidas de manera eficiente. Son herramientas estad√≠sticas fundamentales que se utilizan para describir y resumir conjuntos de datos.
<br><br>
A continuaci√≥n, se presenta c√≥mo calcular y utilizar estas medidas en contextos empresariales:
</p>

 ## **<font color="DarkBlue">Medidas de tendencia central</font>**

 ### **<font color="DarkBlue">Media (Promedio)</font>**

<p align="justify">
‚úÖ La media es la suma de todos los valores dividida por el n√∫mero de valores. Es √∫til para calcular el valor promedio de un conjunto de datos.
<br><br>
  $$
  \text{Media} = \frac{\sum_{i=1}^{n} x_i}{n}
  $$

<br>

donde:
- $ x_i $ son los valores del conjunto y
- $ n $ es el n√∫mero total de valores.

<p align="justify">
<br>
üëÄ Por ejemplo, para calcular el promedio de las ventas mensuales de una empresa...


In [None]:
# Ventas mensuales de una empresa en miles de d√≥lares
ventas_mensuales = np.array([100, 120, 110, 130, 140])
ventas_mensuales

array([100, 120, 110, 130, 140])

In [None]:
# Calcular la media de las ventas mensuales
media_ventas = np.mean(ventas_mensuales)
media_ventas

120.0

 ### **<font color="DarkBlue">Mediana</font>**

<p align="justify">
‚úÖ La mediana es el valor que se encuentra en el centro de un conjunto de datos ordenados. Es √∫til cuando los datos est√°n sesgados o tienen valores at√≠picos. Es el valor que se encuentra en el medio de un conjunto de datos ordenados.
<br><br>
Si el n√∫mero de observaciones es impar, la mediana es el valor central. Si es par, la mediana se calcula como el promedio de los dos valores centrales.
<br><br>
  $$
  \text{Mediana} =
  \begin{cases}
  x_{\frac{n+1}{2}} & \text{si } n \text{ es impar} \\
  \frac{x_{\frac{n}{2}} + x_{\frac{n}{2} + 1}}{2} & \text{si } n \text{ es par}
  \end{cases}
  $$
<br><br>
üëÄ Por ejemplo, para calcular la mediana de los ingresos anuales de una muestra de empleados...


In [None]:
# Ingresos anuales de una muestra de empleados en miles de d√≥lares
ingresos_anuales = np.array([40000, 50000, 60000, 70000, 80000, 90000, 100000])
ingresos_anuales

array([ 40000,  50000,  60000,  70000,  80000,  90000, 100000])

In [None]:
# Calcular la mediana de los ingresos anuales
mediana_ingresos = np.median(ingresos_anuales)
mediana_ingresos

70000.0

 ### **<font color="DarkBlue">Moda</font>**

<p align="justify">
‚úÖ La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Es √∫til para identificar patrones de comportamiento.
<br><br>
üëÄ Por ejemplo, para calcular la moda de los productos m√°s vendidos en una tienda:


In [None]:
# N√∫mero de ventas diarias de diferentes productos en una tienda
ventas_diarias = np.array([20, 30, 25, 25, 40, 30, 30, 25, 40, 25, 30, 30, 45, 45, 30])
ventas_diarias

array([20, 30, 25, 25, 40, 30, 30, 25, 40, 25, 30, 30, 45, 45, 30])

In [None]:
# Calcular la moda de las ventas diarias
moda_ventas = np.argmax(np.bincount(ventas_diarias))
moda_ventas

30

 ## **<font color="DarkBlue">Medidas de dispersi√≥n</font>**

 ### **<font color="DarkBlue">Varianza</font>**

<p align="justify">
‚úÖ La varianza mide la dispersi√≥n de los datos con respecto a la media. Es √∫til para comprender la dispersi√≥n de los datos. Mide la variabilidad de los datos respecto a la media. Se calcula como el promedio de las diferencias al cuadrado entre cada valor y la media.
<br><br>
  $$
  \text{Varianza} = \frac{\sum_{i=1}^{n} (x_i - \text{Media})^2}{n}
  $$
<br>
üëÄ Por ejemplo, para calcular la varianza de los tiempos de entrega de los pedidos de una empresa:


In [None]:
# Tiempos de entrega de los pedidos en d√≠as
tiempos_entrega = np.array([2, 3, 2, 4, 3, 5, 2, 5, 3, 6, 3, 2, 5, 4])
tiempos_entrega

array([2, 3, 2, 4, 3, 5, 2, 5, 3, 6, 3, 2, 5, 4])

In [None]:
# Calcular la varianza de los tiempos de entrega
varianza_tiempos_entrega = np.var(tiempos_entrega)
varianza_tiempos_entrega.round(2)

1.68

 ### **<font color="DarkBlue">Desviaci√≥n est√°ndar</font>**

<p align="justify">
‚úÖ La desviaci√≥n est√°ndar es la ra√≠z cuadrada de la varianza. Proporciona una medida de dispersi√≥n en la misma unidad que los datos originales. Una desviaci√≥n est√°ndar alta indica que los datos est√°n m√°s dispersos.
<br><br>
  $$
  \text{Desviaci√≥n Est√°ndar} = \sqrt{\text{Varianza}}
  $$
<br>
üëÄ Por ejemplo, para calcular la desviaci√≥n est√°ndar de los precios de los productos en una tienda...


In [None]:
# Precios de los productos en una tienda en d√≥lares
precios_productos = np.array([20, 25, 30, 35, 40, 35, 40, 20])
precios_productos

array([20, 25, 30, 35, 40, 35, 40, 20])

In [None]:
# Calcular la desviaci√≥n est√°ndar de los precios de los productos
desviacion_precios = np.std(precios_productos)
desviacion_precios.round(2)

7.68

<br>
<br>
<p align="center"><b>
üíó
<font color="DarkBlue">
Hemos llegado al final de nuestro colab, a seguir codeando en NumPy...
</font>
</p>
