# Variables Aleatorias

Una **variable aleatoria** es una función que asigna un valor numérico a cada posible resultado de un experimento aleatorio. En otras palabras, una variable aleatoria es una cantidad numérica que depende del resultado de un experimento aleatorio.

Las variables aleatorias se clasifican en dos tipos: las **variables aleatorias discretas** y las **variables aleatorias continuas**.

- **Variable Aleatoria Discreta:** Toma un conjunto finito o numerable de valores posibles. Ejemplos incluyen el número de caras que aparecen en el lanzamiento de dos monedas, donde los posibles valores son 0, 1 o 2.
  
- **Variable Aleatoria Continua:** Toma valores en un intervalo continuo. Ejemplos incluyen la altura de las personas, donde la variable aleatoria puede tomar cualquier valor dentro de un rango continuo de alturas posibles.

En la teoría de la probabilidad, las variables aleatorias se utilizan para modelar experimentos aleatorios y describir cómo se distribuyen los resultados posibles.

## Variables Aleatorias Discretas

Una **variable aleatoria discreta** es aquella que puede tomar un conjunto finito o numerable de valores posibles. Estos valores suelen ser el resultado de contar eventos específicos. Por ejemplo, el número de llamadas recibidas en una central telefónica en una hora o el número de veces que un dado muestra un número par en 10 lanzamientos.

Las variables aleatorias discretas se caracterizan por tener una función de probabilidad que asigna una probabilidad específica a cada valor posible. Esta función de probabilidad se conoce como **función de masa de probabilidad (PMF, por sus siglas en inglés)**.

### Ejemplos de Variables Aleatorias Discretas

1. **Número de Caras al Lanzar una Moneda:**
   - Posibles valores: 0, 1 (para un lanzamiento)
   - PMF: La probabilidad de obtener 0 caras es 0.5 y de obtener 1 cara es 0.5.

2. **Número de Éxitos en una Serie de Lanzamientos de un Dado:**
   - Posibles valores: 0, 1, 2, ..., 6 (para un solo lanzamiento)
   - PMF: Cada número tiene una probabilidad de 1/6.

En Python, podemos generar variables aleatorias discretas utilizando bibliotecas como `numpy` y `scipy`. A continuación, se muestra un ejemplo de cómo generar y visualizar una variable aleatoria discreta usando `numpy`.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Generación de variables aleatorias discretas
# Supongamos que queremos generar valores 1 y 2 con igual probabilidad
valores = np.random.choice([1, 2], size=1000, p=[0.5, 0.5])

# Visualización de la distribución con un histograma
plt.hist(valores, bins=2, edgecolor='black', alpha=0.7)
plt.title("Distribución de una Variable Aleatoria Discreta")
plt.xlabel("Valor")
plt.ylabel("Frecuencia")
plt.xticks([1, 2])
plt.grid(True)
plt.show()

## Variables Aleatorias Continuas

Una **variable aleatoria continua** es aquella que puede tomar cualquier valor dentro de un intervalo continuo. A diferencia de las variables aleatorias discretas, que tienen un conjunto finito o numerable de posibles valores, las variables aleatorias continuas pueden tomar infinitos valores posibles dentro de un rango específico.

Las variables aleatorias continuas se describen mediante una **función de densidad de probabilidad (PDF, por sus siglas en inglés)**, que indica la probabilidad de que la variable aleatoria tome un valor dentro de un intervalo determinado.

### Ejemplos de Variables Aleatorias Continuas

1. **Altura de las Personas:**
   - La altura de una persona puede tomar cualquier valor dentro de un rango continuo, por ejemplo, de 0 a 2.5 metros.
   - La PDF correspondiente describe la probabilidad de que una persona tenga una altura dentro de un intervalo específico.

2. **Tiempo de Espera en una Fila:**
   - El tiempo de espera puede ser cualquier valor positivo, y no se limita a valores discretos.
   - La PDF correspondiente describe la probabilidad de que el tiempo de espera caiga dentro de un intervalo específico.

Para ilustrar esto con un ejemplo práctico en Python, generaremos datos aleatorios continuos usando `numpy`.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Generación de datos de altura de personas
# Supongamos que la altura promedio es de 1.75 metros con una variabilidad alrededor de este valor
media_altura = 1.75
variabilidad = 0.1

# Generamos 1000 alturas de personas como suma de múltiples variables uniformes
# Esto nos dará una distribución más centrada sin usar scipy
num_samples = 1000
num_uniforms = 10

# Suma de variables aleatorias uniformes para aproximar una distribución centrada
valores_altura = media_altura + (np.sum(np.random.rand(num_samples, num_uniforms), axis=1) - num_uniforms / 2) * variabilidad / np.sqrt(num_uniforms / 12)

# Visualización de la distribución con un histograma
plt.hist(valores_altura, bins=30, density=True, alpha=0.7, edgecolor='black')
plt.title("Distribución de Alturas de Personas")
plt.xlabel("Altura (metros)")
plt.ylabel("Densidad de Probabilidad")
plt.grid(True)
plt.show()

## Distribuciones de Probabilidad

En estadística, una **distribución de probabilidad** es una función matemática que describe la probabilidad de ocurrencia de diferentes resultados posibles en un experimento aleatorio. Las distribuciones de probabilidad son fundamentales para el análisis de datos y el modelado de fenómenos en diversos campos, como la física, la ingeniería, la economía, la biología, entre otros.

Las distribuciones de probabilidad se utilizan para describir la probabilidad asociada con cada posible valor de una variable aleatoria.
Estas distribuciones se pueden clasificar en dos tipos principales: las **distribuciones de probabilidad discretas** y las **distribuciones de probabilidad continuas**.

## Distribuciones Discretas
Las distribuciones de probabilidad discretas se utilizan para modelar variables aleatorias discretas, es decir, variables que toman un conjunto finito o numerable de valores. Las distribuciones discretas de probabilidad se describen mediante la función de probabilidad de masa (PMF), que asigna una probabilidad a cada valor posible de la variable aleatoria.

## Función de Probabilidad de Masa
La función de probabilidad de masa (PMF) de una variable aleatoria discreta $X$ se define como:

$$P(X = x_i) = p_i$$

donde $x_i$ es el valor posible de la variable aleatoria $X$, y $p_i$ es la probabilidad de que $X$ tome el valor $x_i$.

Las propiedades de la PMF son:

$0 \leq p_i \leq 1$ para todo $i$
</br></br>
$\sum_{i} p_i = 1$

## Función de Distribución Acumulada
La función de distribución acumulada (CDF, por sus siglas en inglés) es una función que nos permite describir la probabilidad acumulada de que una variable aleatoria $X$ tome un valor menor o igual a un valor dado $x$. La CDF se define como:

$$F(x) = P(X \leq x)$$

donde $X$ es una variable aleatoria y $x$ es un número real. La CDF de una variable aleatoria nos permite responder preguntas del tipo "¿Cuál es la probabilidad de que $X$ sea menor o igual a un valor dado $x$?".

A continuación se presentan algunas de las distribuciones discretas de probabilidad más comunes:

## Distribución de Bernoulli
La distribución de Bernoulli es una distribución de probabilidad discreta que se utiliza para modelar una variable aleatoria $X$ que toma dos valores posibles, generalmente etiquetados como "éxito" y "fracaso". Esta distribución se caracteriza por un parámetro $p$, que representa la probabilidad de "éxito".

Un ejemplo común de la distribución de Bernoulli es el lanzamiento de una moneda, donde el resultado puede ser "cara" o "cruz" con probabilidades iguales de 0.5 para cada uno. En este caso, si definimos "éxito" como obtener "cara", la variable aleatoria $X$ que representa el resultado de lanzar la moneda sigue una distribución de Bernoulli con $p=0.5$.

La función `np.random.random()` de `NumPy` genera un número aleatorio en el rango $[0, 1)$, es decir, un número aleatorio entre $0$ (incluido) y $1$ (excluido). Es importante destacar que la función devuelve un número aleatorio generado de manera uniforme, lo que significa que la probabilidad de obtener cualquier número en el rango $[0, 1)$ es la misma.

Podemos utilizar esta función para generar una distribución de Bernoulli con una probabilidad de éxito determinada `p`. En el siguiente ejemplo, generamos un número aleatorio en el rango $[0, 1)$ utilizando la función `np.random.random()`, y luego comparamos este número con `p` para determinar si la prueba fue un éxito o un fracaso. Si el número aleatorio es menor que `p`, la prueba se considera un éxito y se asigna un valor de `1` a la lista. De lo contrario, la prueba se considera un fracaso y se asigna un valor de `0` a la lista.

In [None]:
import numpy as np
# Generamos una distribución de Bernoulli con p=0.3
p = 0.3

# Generamos una lista de 10 valores aleatorios de una distribución de Bernoulli con p=0.3
dist_bernoulli = [1 if np.random.random() < p else 0 for _ in range(100)]

print(dist_bernoulli)

In [None]:
# Definimos la lista de valores
valores = dist_bernoulli

# Calculamos el histograma de los valores
conteos, bordes = np.histogram(valores, bins=[-0.5, 0.5, 1.5])

# Calculamos la proporción de cada valor
prop_0 = conteos[0] / len(valores)
prop_1 = conteos[1] / len(valores)

# Imprimimos las proporciones
print("Proporción de 0's: ", prop_0)
print("Proporción de 1's: ", prop_1)

In [None]:
# Valores posibles de la variable aleatoria X
x = np.arange(len(conteos))

# Graficamos la PMF con matplotlib
plt.bar(x, conteos / len(valores), alpha=0.7, edgecolor='black')
plt.title("Función de masa de probabilidad de una distribución de Bernoulli")
plt.xlabel("Valores de X")
plt.ylabel("P(X = x)")
plt.xticks(x)
plt.grid(True)
plt.show()

## Distribución Binomial

La distribución binomial es un modelo de probabilidad discreta que describe el número de éxitos $X$ en una serie de $n$ ensayos independientes e idénticamente distribuidos con una probabilidad de éxito $p$ constante en cada ensayo. La distribución binomial se denota por $B(n, p)$.

La función de probabilidad de masa ($PMF$) de la distribución binomial está dada por la siguiente fórmula:

$$P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}$$

donde $\binom{n}{k}$ es el coeficiente binomial, que representa el número de formas en que se pueden elegir $k$ éxitos en $n$ ensayos.

La función de distribución acumulada ($CDF$) de la distribución binomial está dada por la siguiente fórmula:

$$F(X \leq k) = \sum_{i=0}^k \binom{n}{i} p^i (1-p)^{n-i}$$

donde $k$ es un valor entero no negativo.

La media y la varianza de una distribución binomial $B(n, p)$ están dadas por:

$$\mu = np$$

$$\sigma^2 = np(1-p)$$

La distribución binomial es una generalización de la distribución de Bernoulli, que describe el resultado de un solo ensayo con una probabilidad de éxito $p$. De hecho, la distribución binomial se reduce a la distribución de Bernoulli cuando $n = 1$.

Supongamos que se sabe que el 80% de los estudiantes de una universidad pasan el examen de matemáticas. Si se toma una muestra aleatoria de 10 estudiantes de esta universidad, ¿cuál es la probabilidad de que exactamente 7 pasen el examen?

Este problema se puede modelar como una distribución binomial con n = 10 ensayos, una probabilidad de éxito p = 0.8 y se busca la probabilidad de que X = 7 éxitos. La fórmula para la PMF de la distribución binomial es:

$$
P(X = 7) = \binom{10}{7} (0.8)^7 (1-0.8)^{10-7}
$$

### Paso 1: Calcular el Coeficiente Binomial

El coeficiente binomial $ \binom{10}{7} $ se calcula usando la fórmula:

$$
\binom{n}{k} = \frac{n!}{k!(n-k)!}
$$

Para $ n = 10 $ y $ k = 7 $:

$$
\binom{10}{7} = \frac{10!}{7!(10-7)!} = \frac{10!}{7! \cdot 3!}
$$

### Paso 2: Calcular las Potencias

Calcular $ (0.8)^7 $:

$$
(0.8)^7 = 0.2097152
$$

Calcular $ (1-0.8)^{10-7} $:

$$
(0.2)^3 = 0.008
$$

### Paso 3: Multiplicar los Términos

Multiplicar el coeficiente binomial por las potencias calculadas:

$$
P(X = 7) = \binom{10}{7} \cdot (0.8)^7 \cdot (0.2)^3
$$

Calculamos el coeficiente binomial $ \binom{10}{7} $:

$$
\binom{10}{7} = \frac{10!}{7! \cdot 3!} = \frac{10 \times 9 \times 8}{3 \times 2 \times 1} = 120
$$

Entonces:

$$
P(X = 7) = 120 \cdot 0.2097152 \cdot 0.008 = 0.201326592
$$

### Resultado Final

La probabilidad de obtener exactamente 7 éxitos en 10 ensayos con una probabilidad de éxito de 0.8 es:

$$
P(X = 7) = 0.2013 \quad (\text{aproximadamente})
$$

Podemos calcular esta probabilidad en Python usando la función `scipy.stats.binom.pmf` de la siguiente manera:

In [None]:
from scipy.stats import binom

n = 10
p = 0.8
k = 7

prob = binom.pmf(k, n, p)
print("La probabilidad de que exactamente 7 pasen el examen es:", prob)

Por lo tanto, la probabilidad de que exactamente 7 estudiantes pasen el examen de matemáticas es del 20.13%.

También, podemos utilizar la función `np.random.binomial` para simular esta distribución binomial y calcular la probabilidad. Para ello, podemos hacer lo siguiente:

In [None]:
# Definimos los parámetros de la distribución binomial
n = 10
p = 0.8

# Simulamos la distribución binomial 10000 veces
simulaciones = np.random.binomial(n, p, size=10000)

# Calculamos la probabilidad de que exactamente 7 estudiantes pasen el examen
probabilidad = sum(simulaciones == 7) / len(simulaciones)

print("La probabilidad de que exactamente 7 estudiantes pasen el examen es:", probabilidad)

In [None]:
# Parámetros de la distribución binomial
p = 0.8
n = 10

# Generamos una lista de valores para el eje x (número de estudiantes que pasaron el examen)
x = np.arange(n + 1)

# Generamos una lista de valores para el eje y (probabilidad de que un número dado de estudiantes pasen el examen)
pmf = binom.pmf(x, n, p)

# Creamos la figura y la barra
plt.bar(x, pmf, alpha=0.7, edgecolor='black')

# Configuramos el diseño de la figura
plt.title("Función de masa de probabilidad de la distribución binomial")
plt.xlabel("Número de estudiantes que pasaron el examen")
plt.ylabel("Probabilidad")
plt.grid(True)

# Mostramos la figura
plt.show()

También podemos utilizar la función `scipy.stats.binom.cdf` para calcular la probabilidad acumulada de que $X <= k$:

In [None]:
n = 10
p = 0.8
k = 7

prob_acumulada = binom.cdf(k, n, p)
print("La probabilidad acumulada de que como máximo 7 pasen el examen es:", prob_acumulada)

In [None]:
# Parámetros de la distribución binomial
p = 0.8
n = 10

# Valores de la variable aleatoria
k = np.arange(n + 1)

# Probabilidades de la CDF
prob_cdf = binom.cdf(k, n, p)

# Creamos la figura y la línea de la CDF
plt.plot(k, prob_cdf, marker='o', linestyle='-', color='b')

# Configuramos el título y los ejes
plt.title('Función de distribución acumulada de una distribución binomial')
plt.xlabel('Valores de k')
plt.ylabel('Probabilidad acumulada')
plt.grid(True)

# Mostramos la figura
plt.show()

## Distribución de Poisson

La distribución de Poisson es una distribución de probabilidad discreta que se utiliza para modelar la ocurrencia de eventos raros en un intervalo de tiempo o espacio. Esta distribución se aplica comúnmente en áreas como la física, la ingeniería, la biología, la economía, entre otras.

La distribución de Poisson se define por un solo parámetro, lambda ($λ$), que representa el número esperado de eventos que ocurren en un intervalo de tiempo o espacio. La función de probabilidad de masa ($PMF$) de la distribución de Poisson se define como:

$$P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!}$$

donde $k$ es el número de eventos que ocurren en el intervalo de tiempo o espacio, $e$ es la constante matemática $e$ (aproximadamente 2.71828), $λ$ es el número esperado de eventos en el intervalo, y $k!$ es el factorial de $k$.

La distribución de Poisson también tiene una función de distribución acumulada (CDF), que se define como:

$$F(k) = P(X \leq k) = \sum_{i=0}^k \frac{e^{-\lambda} \lambda^i}{i!}$$

donde $k$ es el número de eventos que ocurren en el intervalo de tiempo o espacio.

### Aplicaciones Comunes
La distribución de Poisson se utiliza comúnmente para modelar eventos raros o infrecuentes, como el número de accidentes de tráfico en una ciudad en un día determinado, el número de errores de software en un programa, el número de llamadas de servicio al cliente en una hora, entre otros.

### Ejemplo de Cálculo
Un ejemplo clásico de la distribución de Poisson es el número de llegadas de clientes a una tienda en un día determinado, suponiendo que la tasa promedio de llegadas es conocida. Supongamos que la tasa promedio de llegadas a una tienda es de 4 clientes por hora. Queremos saber cuál es la probabilidad de que lleguen 6 clientes en una hora determinada.

Para resolver este problema, podemos utilizar la distribución de Poisson con un parámetro $\lambda$ de 4, ya que estamos interesados en el número de llegadas en una hora (un subintervalo de tiempo de una hora). La fórmula para la PMF de la distribución de Poisson es:

$$ P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!} $$

donde $X$ es el número de llegadas, $λ$ es la tasa promedio de llegadas y $k$ es el número de llegadas que estamos interesados en evaluar.

Para este ejemplo, queremos calcular la probabilidad de que lleguen exactamente 6 clientes, por lo que $k = 6$ y $λ = 4$. Entonces, la probabilidad de que lleguen exactamente 6 clientes en una hora es:

$$ P(X=6) = \frac{e^{-4} 4^6}{6!} \approx 0.1042 $$

Para obtener esta probabilidad en Python, podemos utilizar la función `poisson.pmf(k, mu)` del módulo `scipy.stats`. El parámetro `k` es el número de llegadas que estamos interesados en evaluar y `mu` es la tasa promedio de llegadas:

In [None]:
from scipy.stats import poisson

k = 6
mu = 4

prob = poisson.pmf(k, mu)
print("La probabilidad de que lleguen exactamente 6 clientes en una hora es:", prob)

### Visualización de la Distribución de Poisson
Para entender mejor cómo funcionan la PMF, es útil visualizar la distribución.

In [None]:
# Parámetro de la distribución de Poisson
lambda_poisson = 4

# Valores posibles de la variable aleatoria
k_values = np.arange(0, 15)

# Calculamos la PMF para cada valor de k
pmf_values = poisson.pmf(k_values, lambda_poisson)

# Graficamos la PMF
plt.bar(k_values, pmf_values, alpha=0.7, edgecolor='black')
plt.title('Función de Masa de Probabilidad de la Distribución de Poisson')
plt.xlabel('Número de eventos (k)')
plt.ylabel('Probabilidad')
plt.grid(True)
plt.show()

## Cálculo de Probabilidades Acumuladas con la Distribución de Poisson

La **distribución de Poisson** no solo se utiliza para calcular la probabilidad de que ocurra un número exacto de eventos, sino también para calcular la probabilidad acumulada de que ocurra hasta cierto número de eventos en un intervalo de tiempo o espacio. Esta probabilidad acumulada se obtiene utilizando la **función de distribución acumulada (CDF)**.

La CDF de la distribución de Poisson se define como:

$$
F(k) = P(X \leq k) = \sum_{i=0}^k \frac{e^{-\lambda} \lambda^i}{i!}
$$

donde $k$ es el número de eventos que ocurren en el intervalo de tiempo o espacio.

### Ejemplo: Probabilidad Acumulada del Número de Clientes

Supongamos que la tasa promedio de llegadas de clientes a una tienda es de 4 clientes por hora. Queremos saber cuál es la probabilidad de que lleguen hasta 6 clientes en una hora determinada. Este problema se puede modelar usando la distribución de Poisson acumulada.

Para resolver este problema, usamos el parámetro $\lambda = 4$, y calculamos la probabilidad acumulada hasta $k = 6$.

Podemos calcular esta probabilidad en Python usando la función `poisson.cdf` del módulo `scipy.stats`.

In [None]:
# Parámetro de la distribución de Poisson
lambda_poisson = 4

# Valor de interés
k = 6

# Calculamos la CDF para el valor k
prob_acumulada = poisson.cdf(k, lambda_poisson)
print("La probabilidad de que lleguen hasta 6 clientes en una hora es:", prob_acumulada)

# Valores posibles de la variable aleatoria
k_values = np.arange(0, 15)

# Calculamos la CDF para cada valor de k
cdf_values = poisson.cdf(k_values, lambda_poisson)

# Graficamos la CDF
plt.plot(k_values, cdf_values, marker='o', linestyle='-', color='b')
plt.title('Función de Distribución Acumulada de la Distribución de Poisson')
plt.xlabel('Número de eventos (k)')
plt.ylabel('Probabilidad acumulada')
plt.grid(True)
plt.show()

## Distribuciones Continuas

En estadística, una distribución continua es aquella en la que la variable aleatoria puede tomar cualquier valor en un rango continuo. Estas distribuciones se caracterizan por su función de densidad de probabilidad (PDF por sus siglas en inglés), que describe la probabilidad de que la variable aleatoria caiga dentro de un determinado intervalo.

En la mayoría de los casos, la PDF se puede expresar de forma analítica utilizando una fórmula matemática, pero en algunos casos, la PDF solo se puede calcular numéricamente o mediante simulaciones.

Las distribuciones continuas más comunes incluyen la distribución normal, la distribución uniforme, la distribución exponencial y la distribución gamma, entre otras. Cada una de estas distribuciones tiene una función de densidad de probabilidad específica, que se puede expresar en términos de una fórmula matemática.

## Distribución Uniforme

La distribución uniforme es una distribución continua en la que todos los valores dentro de un rango tienen la misma probabilidad de ocurrir. Se utiliza comúnmente en simulaciones y experimentos aleatorios.

### Función de Densidad de Probabilidad (PDF)

La función de densidad de probabilidad (PDF) de la distribución uniforme está dada por:

$f(x) = \begin{cases} \frac{1}{b-a} & \text{si } a \leq x \leq b \\ 0 & \text{en otro caso} \end{cases}$

donde $a$ y $b$ son los límites inferior y superior de la distribución, respectivamente.

La PDF de la distribución uniforme es una función constante dentro del rango de valores permitidos y cero fuera de ese rango.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import uniform

# Parámetros de la distribución uniforme
a = 0  # Límite inferior
b = 10  # Límite superior

# Valores de x para graficar
x = np.linspace(-0.5, 11.5, 1000)

# Función de densidad de probabilidad (PDF) de la distribución uniforme
pdf = uniform.pdf(x, loc=a, scale=b-a)

# Crear la figura con matplotlib
plt.plot(x, pdf, linestyle='-', color='b')

# Configurar el título y los ejes
plt.title("Distribución uniforme")
plt.xlabel("Valores")
plt.ylabel("Probabilidad")
plt.grid(True)

# Mostrar la figura
plt.show()

### Cálculo de Probabilidades en Distribuciones Continuas

Para calcular la probabilidad de que la variable aleatoria continua caiga dentro de un intervalo específico, multiplicamos la densidad de probabilidad por el ancho del intervalo.

#### Ejemplo de Cálculo

En el caso de una distribución uniforme con límites $a = 0$ y $b = 10$, la densidad de probabilidad es:

$$
f(x) = \frac{1}{b-a} = \frac{1}{10-0} = 0.1
$$

Si queremos calcular la probabilidad de que la variable aleatoria $X$ caiga dentro del intervalo [3, 5], realizamos el siguiente cálculo:

$$
P(3 \leq X \leq 5) = \int_3^5 0.1 \, dx = 0.1 \times (5 - 3) = 0.2
$$

Esto significa que la probabilidad de que $X$ esté entre 3 y 45 es 0.2.

### Interpretación

La densidad de probabilidad constante de 0.1 significa que la probabilidad de que la variable aleatoria caiga dentro de cualquier intervalo de longitud 1 dentro del rango [0, 10] es 0.1.

Este concepto es crucial para entender cómo funcionan las distribuciones continuas y cómo se diferencian de las distribuciones discretas, donde cada valor específico tiene una probabilidad distinta de cero.

## Función de distribución acumulativa (CDF)

La función de distribución acumulativa (CDF) de la distribución uniforme está dada por:

$F(x) = \begin{cases} 0 & \text{si } x < a \\ \frac{x-a}{b-a} & \text{si } a \leq x \leq b \\ 1 & \text{si } x > b \end{cases}$

La CDF de la distribución uniforme es una función lineal que aumenta uniformemente desde cero en $x=a$ hasta uno en $x=b$.

In [None]:
# Parámetros de la distribución uniforme
a = 0  # Límite inferior
b = 10  # Límite superior

# Valores de x para graficar
x = np.linspace(-0.5, 11.5, 1000)

# Función de distribución acumulativa (CDF) de la distribución uniforme
cdf = uniform.cdf(x, loc=a, scale=b-a)

# Crear la figura con matplotlib
plt.plot(x, cdf, linestyle='-', color='b')

# Configurar el título y los ejes
plt.title("Función de distribución acumulativa (CDF) de la distribución uniforme")
plt.xlabel("Valores")
plt.ylabel("Probabilidad acumulada")
plt.grid(True)

# Mostrar la figura
plt.show()

## Generación de números aleatorios

La distribución uniforme es fácil de generar mediante un generador de números aleatorios uniformemente distribuidos entre 0 y 1. Si se quiere generar números aleatorios uniformemente distribuidos entre $a$ y $b$, se puede utilizar la siguiente fórmula:

$X = a + (b - a)U$

donde $U$ es un número aleatorio uniformemente distribuido entre 0 y 1.

In [None]:
# Parámetros de la distribución uniforme
a = 0  # Límite inferior
b = 10  # Límite superior
n = 10000  # Número de muestras

# Generar números aleatorios
uniform_rvs = uniform.rvs(loc=a, scale=b-a, size=n)

# Crear la figura con matplotlib
plt.hist(uniform_rvs, bins=100, density=True, edgecolor='black', alpha=0.7)

# Configurar el título y los ejes
plt.title("Histograma de números aleatorios con la distribución uniforme")
plt.xlabel("Valores")
plt.ylabel("Densidad de probabilidad")
plt.grid(True)

# Mostrar la figura
plt.show()

El resultado será un conjunto de números aleatorios uniformemente distribuidos en el rango de $a$ a $b$.

## Distribución Normal

La **distribución normal** es una de las distribuciones de probabilidad más importantes y utilizadas en estadística. Es una distribución continua caracterizada por su forma de campana simétrica y por tener dos parámetros: la media $\mu$ y la desviación estándar $\sigma$.

### Función de Densidad de Probabilidad (PDF)

La función de densidad de probabilidad (PDF) de la distribución normal está dada por la ecuación:

$$
f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}
$$

donde $x$ es la variable aleatoria, $\mu$ es la media y $\sigma$ es la desviación estándar.

### Función de Distribución Acumulativa (CDF)

La función de distribución acumulativa (CDF) de la distribución normal no tiene una forma analítica cerrada, pero se puede calcular de manera numérica o utilizando tablas.

### Distribución Normal Estándar

La **distribución normal estándar** es una distribución normal con media $\mu=0$ y desviación estándar $\sigma=1$, y se denota como $N(0,1)$. Todas las demás distribuciones normales se pueden obtener mediante una transformación lineal de la variable aleatoria de la distribución normal estándar.

### Importancia y Aplicaciones

La distribución normal es fundamental porque muchos fenómenos naturales y sociales se distribuyen aproximadamente de manera normal. Ejemplos incluyen la altura de una población, el tiempo de reacción de una persona, y el puntaje de un examen estandarizado.

### Propiedades Importantes

1. **Simetría:** La distribución normal es simétrica respecto a su media $\mu$. Esto significa que la mitad de la probabilidad está a la izquierda de la media y la otra mitad está a la derecha.
2. **Área Bajo la Curva:** El área bajo la curva de la PDF de la distribución normal es igual a 1, lo que significa que la suma de todas las probabilidades de los posibles valores de la variable aleatoria es igual a 1.
3. **Distribución Normal Estándar:** La distribución normal estándar, con media $\mu=0$ y desviación estándar $\sigma=1$, es la más importante y ampliamente utilizada. Muchos procedimientos estadísticos, como las pruebas de hipótesis y los intervalos de confianza, se basan en la distribución normal estándar.
4. **Colas Largas:** La distribución normal tiene colas largas, lo que significa que la probabilidad de obtener valores muy alejados de la media es muy baja, pero no es nula.

### Uso en Python

En Python, se puede utilizar la función `scipy.stats.norm` para generar muestras aleatorias de la distribución normal, calcular probabilidades, y realizar operaciones estadísticas como el cálculo de la media y la desviación estándar. Además, la función `numpy.random.normal` permite generar muestras aleatorias de la distribución normal con diferentes parámetros de media y desviación estándar.

### Ejemplo en Python

Vamos a ver un ejemplo de cómo generar una distribución normal utilizando la función `scipy.stats.norm`:

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Parámetros de la distribución normal
mu = 0  # Media
sigma = 1  # Desviación estándar
n = 10000  # Tamaño de la muestra

# Generar una muestra aleatoria de la distribución normal
normal_rvs = norm.rvs(loc=mu, scale=sigma, size=n)

# Crear el histograma de la muestra aleatoria
plt.hist(normal_rvs, bins=30, density=True, alpha=0.5, color='g', edgecolor='black')

# Crear la PDF de la distribución normal para graficarla
x = np.linspace(mu - 3*sigma, mu + 3*sigma, 100)
pdf = norm.pdf(x, loc=mu, scale=sigma)
plt.plot(x, pdf, 'k', linewidth=2, label='PDF')

# Configurar el título y los ejes
plt.title('Distribución Normal')
plt.xlabel('Valores')
plt.ylabel('Densidad de Probabilidad')
plt.legend()
plt.grid(True)

# Mostrar la figura
plt.show()

### Función de Distribución Acumulativa

Para calcular la función de distribución acumulativa (CDF) de una distribución normal, se utiliza la función `norm.cdf` de la biblioteca `scipy.stats`. Esta función devuelve la probabilidad acumulada desde menos infinito hasta un valor dado de la variable aleatoria.

Aquí tienes un ejemplo de cómo calcular la CDF de una distribución normal con Plotly:

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Parámetros de la distribución normal
mu = 0  # Media
sigma = 1  # Desviación estándar

# Crear el rango de valores para la variable aleatoria
x = np.linspace(mu - 3*sigma, mu + 3*sigma, 100)

# Calcular la CDF para cada valor de la variable aleatoria
cdf = norm.cdf(x, loc=mu, scale=sigma)

# Crear la figura con matplotlib
plt.plot(x, cdf, linestyle='-', color='b', label='CDF')

# Configurar el título y los ejes
plt.title('Función de distribución acumulativa (CDF) de la distribución normal')
plt.xlabel('Valores')
plt.ylabel('Probabilidad acumulada')
plt.legend()
plt.grid(True)

# Mostrar la figura
plt.show()

Un problema clásico que se puede resolver utilizando la distribución normal es el cálculo de probabilidades asociadas a una variable aleatoria continua que sigue una distribución normal. Aquí te muestro un ejemplo:

Supongamos que el tiempo que tarda un usuario en completar un formulario en línea sigue una distribución normal con media de 5 minutos y una desviación estándar de 1 minuto. ¿Cuál es la probabilidad de que un usuario tarde más de 7 minutos en completar el formulario?

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Definir los parámetros de la distribución normal
mu = 5  # media
sigma = 1  # desviación estándar

# Calcular la probabilidad de tardar más de 7 minutos
p = 1 - norm.cdf(7, loc=mu, scale=sigma)

# Imprimir el resultado
print("La probabilidad de tardar más de 7 minutos en completar el formulario es:", p)

# Crear el rango de valores para la variable aleatoria
x = np.linspace(mu - 4*sigma, mu + 4*sigma, 1000)

# Calcular la PDF para cada valor de la variable aleatoria
pdf = norm.pdf(x, loc=mu, scale=sigma)

# Crear la figura con matplotlib
plt.figure(figsize=(10, 6))

# Graficar la PDF de la distribución normal
plt.plot(x, pdf, 'b', label='Distribución Normal (PDF)')

# Resaltar el área bajo la curva para x > 7
x_fill = np.linspace(7, mu + 4*sigma, 1000)
y_fill = norm.pdf(x_fill, loc=mu, scale=sigma)
plt.fill_between(x_fill, y_fill, alpha=0.5, color='r', label='P(X > 7)')

# Configurar el título y los ejes
plt.title('Distribución Normal y Probabilidad de Tardar Más de 7 Minutos')
plt.xlabel('Tiempo (minutos)')
plt.ylabel('Densidad de Probabilidad')
plt.legend()
plt.grid(True)

# Mostrar la figura
plt.show()

En este código se utiliza la función `norm.cdf` de SciPy para calcular la probabilidad de tardar más de 7 minutos en completar el formulario en línea. Para ello, se utiliza la media de 5 minutos y la desviación estándar de 1 minuto de la distribución normal. La función norm.cdf devuelve la probabilidad acumulada (CDF) de la distribución normal para un valor de la variable aleatoria dado. Como queremos calcular la probabilidad de tardar más de 7 minutos, se utiliza la expresión `1 - norm.cdf(7, loc=mu, scale=sigma)`, que corresponde a la probabilidad acumulada desde $-\infty$ hasta 7 minutos, y se le resta 1 para obtener la probabilidad acumulada desde 7 minutos hasta $\infty$.

## Distribución Exponencial

La **distribución exponencial** es una distribución de probabilidad continua que se utiliza para modelar el tiempo de espera entre eventos en un proceso de Poisson. Por ejemplo, el tiempo que transcurre entre dos llegadas sucesivas de clientes a un negocio podría seguir una distribución exponencial.

### Parámetro $\lambda$

El parámetro $\lambda$ es un parámetro de forma que representa la tasa de ocurrencia de los eventos. En otras palabras, $\lambda$ es el número esperado de eventos por unidad de tiempo. Un valor alto de $\lambda$ indica que los eventos ocurren con frecuencia, mientras que un valor bajo de $\lambda$ indica que los eventos son menos frecuentes.

- Si $\lambda = 0.5$, esto significa que, en promedio, ocurren 0.5 eventos por unidad de tiempo. Otra forma de interpretarlo es que el tiempo medio entre eventos es $1 / \lambda$.

### Función de Densidad de Probabilidad

La función de densidad de probabilidad (PDF) de la distribución exponencial está dada por la ecuación:

$$
f(x) =
\begin{cases}
\lambda e^{-\lambda x} & x \geq 0 \\
0 & x < 0
\end{cases}
$$

donde $\lambda$ es la tasa de ocurrencia de los eventos.

### Función de Distribución Acumulativa

La función de distribución acumulativa (CDF) de la distribución exponencial está dada por la ecuación:

$$
F(x) =
\begin{cases}
1 - e^{-\lambda x} & x \geq 0 \\
0 & x < 0
\end{cases}
$$

### Media y Varianza

La media y la varianza de la distribución exponencial están dadas por:

$$
\text{Media} = \frac{1}{\lambda}
$$

$$
\text{Varianza} = \frac{1}{\lambda^2}
$$

### Generación y Visualización

La distribución exponencial se puede generar utilizando la función `scipy.stats.expon` de la biblioteca `scipy.stats`. Esta función tiene como parámetro `scale` a la inversa de la tasa de ocurrencia $\lambda$.

A continuación, te muestro un ejemplo de cómo generar una distribución exponencial utilizando la función `scipy.stats.expon`, y graficar su PDF y su CDF. En este ejemplo, utilizaremos $\lambda = 0.5$, lo que implica que, en promedio, ocurre un evento cada 2 unidades de tiempo.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import expon

# Parámetro de la distribución exponencial
lambda_param = 0.5  # Tasa de ocurrencia (lambda)
scale_param = 1 / lambda_param  # Parámetro de escala para scipy

# Valores de x para graficar
x = np.linspace(0, 15, 1000)

# Función de densidad de probabilidad (PDF) de la distribución exponencial
pdf = expon.pdf(x, scale=scale_param)

# Crear la figura con matplotlib
plt.figure(figsize=(10, 6))
plt.plot(x, pdf, 'b', label='PDF')
plt.fill_between(x, pdf, alpha=0.5, color='b')

# Configurar el título y los ejes
plt.title('Función de Densidad de Probabilidad (PDF) de la Distribución Exponencial')
plt.xlabel('Tiempo (unidades)')
plt.ylabel('Densidad de Probabilidad')
plt.legend()
plt.grid(True)

# Mostrar la figura
plt.show()

### Interpretación de la Función de Densidad de Probabilidad (PDF) de la Distribución Exponencial

La gráfica mostrada representa la **Función de Densidad de Probabilidad (PDF)** de una distribución exponencial con un parámetro $\lambda = 0.5$. Esta curva nos proporciona información sobre la probabilidad relativa de que un evento ocurra en un intervalo de tiempo específico.

#### Conceptos Clave:

1. **Forma Descendente:** La curva comienza en su punto más alto cuando $x = 0$ y desciende exponencialmente hacia la derecha. Esto indica que la probabilidad de que el tiempo entre eventos sea muy corto es alta, y disminuye a medida que el tiempo entre eventos aumenta.

2. **Área Bajo la Curva:** La integral (o área) bajo la PDF en cualquier intervalo específico nos da la probabilidad de que el tiempo entre eventos caiga dentro de ese intervalo. La área total bajo la curva para todo el rango de $x$ (de 0 a infinito) es igual a 1, lo que significa que la suma de todas las probabilidades es 1.

3. **$\lambda = 0.5$:** En este ejemplo, $\lambda = 0.5$ significa que, en promedio, ocurre 0.5 eventos por unidad de tiempo. Esto implica que el tiempo medio entre eventos es $\frac{1}{\lambda} = 2$ unidades de tiempo.

4. **Decaimiento Rápido:** El rápido decaimiento de la curva muestra que es mucho más probable que los eventos ocurran en intervalos de tiempo cortos. A medida que el intervalo de tiempo aumenta, la probabilidad de que ocurra un evento disminuye exponencialmente.

In [None]:
# Función de distribución acumulativa (CDF) de la distribución exponencial
cdf = expon.cdf(x, scale=scale_param)

# Crear la figura con matplotlib
plt.figure(figsize=(10, 6))
plt.plot(x, cdf, 'r', label='CDF')

# Configurar el título y los ejes
plt.title('Función de Distribución Acumulativa (CDF) de la Distribución Exponencial')
plt.xlabel('Valores')
plt.ylabel('Probabilidad Acumulada')
plt.legend()
plt.grid(True)

# Mostrar la figura
plt.show()

### Interpretación de la Función de Distribución Acumulativa (CDF) de la Distribución Exponencial

La gráfica mostrada representa la **Función de Distribución Acumulativa (CDF)** de una distribución exponencial con un parámetro $\lambda = 0.5$. Esta curva nos proporciona información sobre la probabilidad acumulada de que un evento ocurra antes de cierto tiempo.

#### Conceptos Clave:

1. **Curva Creciente:** La CDF comienza en 0 cuando $x = 0$ y aumenta monotonamente hacia 1 a medida que $x$ se incrementa. Esto indica que la probabilidad acumulada de que el tiempo entre eventos sea menor o igual a un valor específico aumenta conforme incrementa dicho valor.

2. **Valor en el Eje Y:** El valor de la CDF en un punto específico del eje x representa la probabilidad de que el tiempo entre eventos sea menor o igual a ese valor. Por ejemplo, si la CDF a $x = 5$ es 0.9, esto significa que hay un 90% de probabilidad de que el evento ocurra antes de 5 unidades de tiempo.

3. **Asintótica a 1:** La CDF se aproxima asintóticamente a 1, lo que significa que conforme el valor de $x$ tiende a infinito, la probabilidad acumulada tiende a 1. Esto refleja que, a largo plazo, la certeza de que el evento ocurra es del 100%.

4. **$\lambda = 0.5$:** En este ejemplo, $\lambda = 0.5$ significa que, en promedio, ocurren 0.5 eventos por unidad de tiempo. Esto implica que el tiempo medio entre eventos es $\frac{1}{\lambda} = 2$ unidades de tiempo.

## Ejemplo de Problema con Distribución Exponencial

Un problema clásico que se puede resolver utilizando la distribución exponencial es el cálculo de la probabilidad de que un dispositivo falle antes de cierto tiempo.

### Explicación del Problema

Imagina que tienes un dispositivo electrónico y quieres saber la probabilidad de que falle antes de un tiempo determinado. Sabemos que la vida útil del dispositivo sigue una distribución exponencial. Esto significa que el tiempo entre fallos sigue un patrón específico, donde la tasa de fallos es constante.

Supongamos que la tasa de fallos del dispositivo es $\lambda=0.01$ por hora. Esto significa que, en promedio, el dispositivo falla 0.01 veces por hora. Queremos calcular la probabilidad de que el dispositivo falle antes de que hayan pasado 50 horas de uso.

### Solución del Problema en Python

Podemos utilizar la función `scipy.stats.expon.cdf` para calcular esta probabilidad. La función de distribución acumulativa (CDF) nos dará la probabilidad de que el dispositivo falle antes de un tiempo específico.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import expon

# Parámetro de la distribución exponencial
lambda_param = 0.01  # Tasa de fallos por hora
scale_param = 1 / lambda_param  # Parámetro de escala para scipy

# Tiempo específico para calcular la probabilidad de fallo
time_to_fail = 50  # horas

# Calcular la probabilidad de que el dispositivo falle antes de las 50 horas
prob_fallo_antes_de_50_horas = expon.cdf(time_to_fail, scale=scale_param)

# Imprimir el resultado
print("La probabilidad de que el dispositivo falle antes de las 50 horas de uso es:", prob_fallo_antes_de_50_horas)

In [None]:
# Visualización de la distribución exponencial y la probabilidad calculada

# Valores de x para graficar
x = np.linspace(0, 200, 1000)

# Función de distribución acumulativa (CDF) de la distribución exponencial
cdf = expon.cdf(x, scale=scale_param)

# Crear la figura con matplotlib
plt.figure(figsize=(10, 6))
plt.plot(x, cdf, 'r', label='CDF')

# Resaltar el área bajo la curva para x <= 50
x_fill = np.linspace(0, time_to_fail, 1000)
y_fill = expon.cdf(x_fill, scale=scale_param)
plt.fill_between(x_fill, y_fill, alpha=0.5, color='r', label='P(X <= 50 horas)')

# Configurar el título y los ejes
plt.title('Función de Distribución Acumulativa (CDF) de la Distribución Exponencial')
plt.xlabel('Horas de uso')
plt.ylabel('Probabilidad acumulada')
plt.legend()
plt.grid(True)

# Mostrar la figura
plt.show()

## Conclusiones

En esta libreta, hemos explorado varias distribuciones de probabilidad fundamentales, incluyendo las distribuciones de probabilidad discretas y continuas. Específicamente, hemos cubierto:

1. **Distribuciones de Probabilidad Discretas**:
   - Distribución Binomial
   - Distribución de Poisson

2. **Distribuciones de Probabilidad Continuas**:
   - Distribución Uniforme
   - Distribución Normal
   - Distribución Exponencial

### Reflexión Final

Entender las distribuciones de probabilidad y su aplicación en la vida real es un paso fundamental para cualquier estudiante que aspire a trabajar en campos que involucran análisis de datos y toma de decisiones basadas en datos. Estas herramientas estadísticas no solo permiten analizar y comprender datos históricos, sino también predecir futuros comportamientos y tomar decisiones informadas. Con un enfoque práctico y contextualizado, los estudiantes pueden desarrollar una apreciación más profunda y reducir el estrés asociado con el aprendizaje de estos conceptos.