# 2. VARIABLES ALEATORIAS.

Una **variable aleatoria** es una funci√≥n que asigna un n√∫mero real a cada resultado posible de un experimento aleatorio. Si $\Omega$ es el espacio muestral, entonces una variable aleatoria $X$ es una funci√≥n:

$$
X: \Omega \rightarrow \mathbb{R}
$$

donde a cada $\omega \in \Omega$ se le asocia un valor num√©rico $X(\omega)$. Esta funci√≥n permite representar cuantitativamente los resultados de un fen√≥meno aleatorio, haciendo posible su an√°lisis mediante herramientas matem√°ticas.

**Definici√≥n:** Sea $(\Omega, \mathcal{F}, P)$ un espacio de probabilidad, donde:
- $\Omega$ es el espacio muestral,
- $\mathcal{F}$ es una œÉ-√°lgebra de subconjuntos de $\Omega$ (eventos),
- $P$ es una medida de probabilidad definida sobre $\mathcal{F}$.

Una funci√≥n $X: \Omega \to \mathbb{R}$ es una **variable aleatoria** si es *medible*, es decir, si para todo conjunto boreliano $B \subseteq \mathbb{R}$, el conjunto:

$$
\{ \omega \in \Omega : X(\omega) \in B \}
$$

pertenece a $\mathcal{F}$. Esta propiedad garantiza que se puede calcular la probabilidad de eventos definidos en t√©rminos de la variable aleatoria.


**Interpretaci√≥n:**
- Aunque el experimento es aleatorio, la variable aleatoria es una funci√≥n determinista que act√∫a sobre un resultado incierto.
- Es la herramienta que nos permite modelar y analizar fen√≥menos aleatorios de forma cuantitativa.
- Puede representar resultados tanto cualitativos como cuantitativos, transform√°ndolos en valores num√©ricos.

---

**Fuente:**
- *Mood, Graybill y Boes*: La variable aleatoria es ‚Äúuna funci√≥n que asocia un n√∫mero real a cada resultado del espacio muestral‚Äù.
- *Sheldon Ross*: Destaca que la variable aleatoria no es aleatoria, sino una funci√≥n definida sobre resultados aleatorios.
- *Luis Rinc√≥n*: Se√±ala que permite estudiar el azar desde una perspectiva matem√°tica y operativa.



## 2.1. Variables aleatorias discretas.

Una **variable aleatoria discreta** es una variable aleatoria cuya imagen es un conjunto *finito o infinitamente numerable* de n√∫meros reales.

**Definici√≥n:** Una variable aleatoria $X$ es discreta si existe un conjunto numerable $\{x_1, x_2, x_3, \dots\} \subset \mathbb{R}$ tal que:

$$
P(X = x_i) \geq 0 \quad \text{para todo } i, \quad \text{y} \quad \sum_{i=1}^{\infty} P(X = x_i) = 1
$$

La funci√≥n que asigna a cada valor $x_i$ su probabilidad se llama funci√≥n de masa de probabilidad *(f.m.p)*:

$$
f(x_i) = P(X = x_i)
$$

donde $f(x)$ satisface:

- $f(x) \geq 0$ para todo $x$ en el rango de $X$,
- $\sum_x f(x) = 1$.

<font color="blue">**EJEMPLO:**</font> Sea $X$ la variable aleatoria que representa el n√∫mero de caras al lanzar dos monedas. Entonces:

- El espacio muestral es $\Omega = \{\text{CC}, \text{CS}, \text{SC}, \text{SS}\}$
- Los posibles valores de $X$ son $\{0, 1, 2\}$
- $X$ es discreta, y su funci√≥n de masa de probabilidad es:

$$
P(X = 0) = \frac{1}{4}, \quad P(X = 1) = \frac{1}{2}, \quad P(X = 2) = \frac{1}{4}
$$

In [None]:
import numpy as np # Importamos Numpy
import numpy.random as npr # para generar numeros aleatorios

import scipy.stats as sps # Importamos el modulo SciPy
from scipy.stats import randint # para trabajar una uniforme discreta en un rango de enteros

import matplotlib.pyplot as plt #Visualizar datos

import random # para generar numeros aleatorios


### 2.1.1. Variable aleatoria uniforme discreta

**Definici√≥n:** Una variable aleatoria $X$ tiene distribuci√≥n uniforme discreta en el conjunto $\{x_1,...,x_n\}$ si su funci√≥n de densidad est√° dada por
$$ f_X(x) = \mathbb{P}(X=x) = \begin{cases} \frac{1}{n}, \quad \text{si } x\in \{x_1,...,x_n\} \\
0, \quad \text{e.o.c} \end{cases}$$

Se llama uniforme porque cada uno de sus posibles resultados de $X$ tienene la misma probabilidad.

**Notaci√≥n:** $X\sim Unif(x_1,...,x_n)$

La esperanza y varianza de $X$, est√°n dadas por:

$$ \mathbb{E}[X] = \sum_{x} xf_X(x) = \frac{x_n + x_1}{2} $$
y
$$ \text{Var}(X) = \mathbb{E}\left[ (X-\mathbb{E}[X])^2\right] = \frac{(x_n - x_1 + 1)^2 -1}{12}$$

La funci√≥n de distribuci√≥n de una v.a. uniforme es:
$$ F_X(x) = \mathbb{P}(X\le x) = \begin{cases} 0, \quad \text{si } x < x_1 \\ \frac{x}{n}, \quad \text{si } x\in \{x_1,...,x_n\} \\
1, \quad \text{si } x > x_n \end{cases}$$

<font color="blue">**EJEMPLO:**</font> Se lleva a cabo una rifa donde los boletos est√°n enumerados del $00$ al $99$. Si $Y$ es la variable aleatoria definida como el n√∫mero del boleto ganador, entonces:  
$$\mathbb{P}(Y=k)=\begin{cases}
	\frac{1}{100} &\quad \text{si } k=00,01,\dots,99 \\
	0 &\quad \text{en otro caso}
\end{cases}$$
Consideremos que el premio de la rifa se determina a partir del n√∫mero premiado de la siguiente forma: $X=Y+1$, donde $X$ es el monto del premio en pesos y $Y$ es el n√∫mero premiado, entonces $X$ es una variable aleatoria, pues es una funci√≥n de $Y$, y adem√°s se tiene
	$$f_{X}(k)=\begin{cases}
		\frac{1}{100} &\quad \text{si } x=1,2,\dots,100 \\
		0 &\quad \text{en otro caso}
	\end{cases}$$

$\color{red}{\text{Ejercicio.}}$ Calcular la esperanza y varianza.    
Supongamos que nos interesa calcular la probabilidad de que el premio sea mayor a $\$80$, entonces
$$ \mathbb{P}(X>80) = \sum_{k=81}^{100} \frac{1}{100} = \frac{20}{100} = 0.2 $$

Supongamos que $X \sim \text{Uniforme}(1, 100)$.
Entonces:

$$
\mathbb{E}[X] = \frac{1 + 100}{2} = \frac{101}{2} = 50.5
$$

y

$$
\text{Var}(X) = \frac{(100 - 1 + 1)^2 - 1}{12} = \frac{100^2 - 1}{12} = \frac{9999}{12} = 833.25
$$


In [None]:
# Definir el rango de la distribuci√≥n uniforme discreta [low, high)
low = 1
high = 101  # Para incluir el 100

# Crear los valores posibles dentro del rango
x = np.arange(low, high)  # x = [1, 2, ..., 100]

# Calcular la funci√≥n de masa de probabilidad (PMF)
pmf = np.full_like(x, 1 / (high - low), dtype=float)  # Probabilidad uniforme

# Graficar la PMF
plt.figure(figsize=(12, 4))
plt.bar(x, pmf, width=0.8, color='skyblue', edgecolor='black')
plt.xlabel('Valores')
plt.ylabel('Probabilidad')
plt.title('Funci√≥n de masa de probabilidad (Uniforme discreta: 1 a 100)')
plt.grid(True, axis='y', linestyle='--', alpha=0.7)
plt.show()

# Calcular esperanza y varianza
esperanza = np.mean(x)
varianza = np.var(x)

print(f"Esperanza: {esperanza}")
print(f"Varianza: {varianza}")

# Calcular P(X > 80)
probabilidad_mayor_80 = np.sum(pmf[x > 80])
print(f"P(X > 80): {probabilidad_mayor_80}")

Para m√°s informaci√≥n, ver [Matplotlib colores](https://matplotlib.org/stable/gallery/color/named_colors.html)

#### Gr√°fica de la distribuci√≥n Uniforme Discreta

In [None]:
# Definir el rango de la distribuci√≥n uniforme discreta [low, high)
low = 0 #l√≠mite inferior
high = 10 #l√≠mite superior

#Crear los valores posibles dentro del rango
x = np.arange(low, high)

#Calcular la funci√≥n de masa de probabilidad
pmf = np.full_like(x, 1/ (high-low) , dtype = float )

#Para crear una figura m√°s grande
plt.figure(figsize=(10, 5))

#Graficar pmf
plt.bar(x, pmf, width=0.2, color='b', edgecolor='black')
plt.xlabel('Valores')
plt.ylabel('Probabilidad')
plt.title('Funci√≥n de densidad de una uniforme discreta')
plt.grid(True)
plt.show() #mostrar el gr√°fica


### 2.1.2. Variable aleatoria Bernoulli con par√°metro $p\in (0,1)$

**Definici√≥n:** Este modelo se aplica a un experiemento cuyo espacio muestral tiene dos resultados
$$ \Omega = \{\text{√©xito} , \text{fracaso}\}$$
y definimos
- $X(\{\text{√©xito}\}) =1$
- $X(\{\text{fracaso}\}) =0$

Las probabilidades asociadas a este modelo son
- $\mathbb{P}(\{\text{√©xito}\}) = p$
- $\mathbb{P}(\{\text{fracaso}\}) = 1-p$
donde $0<p<1$.

La funci√≥n de densidad, est√° definida de la siguiente manera
$$ f_X(x) = \mathbb{P}(X=x) = \begin{cases} p^x(1-p)^{1-x}, \quad \text{si } x\in \{0,1\} \\
0, \quad \text{e.o.c} \end{cases}$$

**Notaci√≥n:** $X\sim Ber(p)$

Mediante la combinaci√≥n de v.a. Bernoulli es posible construir otras v.a.

La esperanza y varianza de $X\sim Ber(p)$, es√° dada por:

$$ \mathbb{E}[X] =\sum_{x=0}^{1} x f_{X}(x) = 0\cdot (1-p) + 1 \cdot p = p $$
y
$$ \mathbb{E}[X^2] =\sum_{x=0}^{1} x^2 f_{X}(x) = 0^2 \cdot (1-p) + 1^2 \cdot p = p $$
entonces
$$ \text{Var}(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2  = p - p^2 = p(1-p)$$

Para m√°s informaci√≥n, ver [Bernoulli](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.bernoulli.html)

#### Gr√°fica de la distribuci√≥n Bernoulli

In [None]:
from scipy.stats import bernoulli

#Definimos nuestra probabilidad de √©xito
p=0.3

#Defino los posibles valores
x=[0,1]

#Calculamos la funci√≥n de densidad
pmf = bernoulli.pmf(x, p)

print("La funci√≥n de densidad = ", pmf)

#Graficamos la funci√≥n de densidad
plt.bar(x,pmf,width=0.2)
plt.xlabel('Valores')
plt.ylabel('Probabilidad')
plt.title('Funci√≥n de densidad de una bernoulli con p=0.3')
#plt.grid(True)
plt.show() #mostrar el gr√°fica

#Calculo de la esperanza
print("La esperanza es = ", bernoulli.mean(p))

#Calculo de la varianza
print("La varianza es = ", bernoulli.var(p))

### 2.1.3. Variable aleatoria Binomial con par√°metros $n$ y $p\in(0,1)$

**Definici√≥n:** Decimos que una v.a. $X$ tiene distribuci√≥n binomial con par√°metros $n$ y $p$, si su funci√≥n de densidad est√° dada por
$$ f_X(x) = \mathbb{P}(X=x) = \begin{cases} \binom{n}{x}p^x (1-p)^{n-x}, \quad \text{si } x\in \{0,1,...,n\} \\
0, \quad \text{e.o.c} \end{cases}$$
donde $n\in\mathbb{Z}_{+}$ y $0<p<1$.

**Obs:** Los ensayos deben ser independientes.

La esperanza de $X$ es
$$\begin{align*}
\mathbb{E}[X]
&=np.
\end{align*}$$
y
$$ \begin{align*}
\mathbb{E}[X^2]
&= (np)^2 +np(1-p),
\end{align*} $$

Por lo que la varianza de $X$ es
$$\text{Var}(X) = np(1-p) $$

<font color="blue">**EJEMPLO:**</font> Una moneda justa se tira seis veces, donde la probabilidad de obtener sol es de $0.3$. Sea $X$ el n√∫mero de veces que cae sol, entonces dabemos que $X$ tiene una distribuci√≥n binomial con par√°metros $n=6$ y $p=0.3$. Calcular:
1. La probabilidad de que $ X = 2 $ es:

$$
\mathbb{P}(X = 2) = \binom{6}{2} (0.3)^2 (1 - 0.3)^{6 - 2} = 0.3241
$$

2. La probabilidad de que $ X = 3 $ es:

$$
\mathbb{P}(X = 3) = \binom{6}{3} (0.3)^3 (1 - 0.3)^{6 - 3} = 0.1852
$$

3. La probabilidad de que $ 1 < X \leq 5 $ se calcula como la suma de las probabilidades de $ X = 2 $, $ X = 3 $, $ X = 4 $ y $ X = 5 $:

$$
\mathbb{P}(1 < X \leq 5) = \mathbb{P}(X = 2) + \mathbb{P}(X = 3) + \mathbb{P}(X = 4) + \mathbb{P}(X = 5)
$$

$$
= 0.3241 + 0.1852 + \binom{6}{4} (0.3)^4 (1 - 0.3)^{6 - 4} + \binom{6}{5} (0.3)^5 (1 - 0.3)^{6 - 5}
$$

$$
= 0.579
$$


Para m√°s informaci√≥n, ver [Binomial](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.binom.html)

Notemos que $\mathbb{P}(1<X\le 5) = F_X(5) - F_X(1) $

Usamos el atributo `.cdf ` para calcular estas probabilidades

In [None]:
from scipy.stats import binom
binom.cdf(5,6,0.3) # calcula la probabilidad acumulada de que haya 5 o menos √©xitos en 6 ensayos
binom.cdf(1,6,0.3) # calcula la probabilidad acumulada de que haya 1 o menos √©xitos en 6 ensayos
binom.cdf(5,6,0.3)-binom.cdf(1,6,0.3) # calcula la probabilidad deseada

#### Gr√°fica de la distribuci√≥n Binomial

In [None]:
n = 25 # n√∫mero de ensayos bernoulli
p = 0.8 # probabilidad de √©xito
s= 100000 # n√∫mero de muestras

#Vamos a generar numeros aleatorios que siguen una distribuci√≥n binomial
binom_numeros = sps.binom.rvs(n,p,size=s)

#Creamos un histograma
plt.figure(figsize=(10,6))
plt.hist(
    binom_numeros,
    density=True, # Normaliza el area para que sea 1
    bins=len(np.unique(binom_numeros)), # n√∫mero de barras del histograma
    color = "blue",
    edgecolor="grey"
)

plt.xlabel('Valores')
plt.ylabel('Probabilidad')
plt.title('Funci√≥n de densidad de una binomial')
#plt.grid(True)
plt.show() #mostrar el gr√°fica

### 2.1.4. Variable aleatoria Poisson

**Definici√≥n:** Es una distribuci√≥n de probabilidad discreta que sirve para calcular la probabilidad de que ocurra un determinado n√∫mero de eventos raros durante un intervalo dado (puede ser tiempo, lingitud, √°rea, etc).

Esta v.a. tomavalores sobre el conjunto $\{0,1,2,...\}$ y tiene un par√°metro $\lambda>0$, el cual representa el n√∫mero de veces que se **espera** que ocurra un evento durante un intervalo dado.

Su funci√≥n de densidad, est√° dado como sigue:
$$ f_X(x) = \mathbb{P}(X=x) = \begin{cases} e^{-\lambda}\frac{\lambda^x}{x!}, \quad \text{si } x\in \{0,1,...\} \\
0, \quad \text{e.o.c} \end{cases}$$

Notemos que $\mathbb{E}[X]=\lambda$ y que $\text{Var}(X)=\lambda$.

<font color="blue">**EJEMPLO:**</font> Supongamos que el n√∫mero de accidentes que ocurre en un punto en un d√≠a tiene distribuci√≥n Poisson con par√°metro $\lambda=2$,

- ¬øcu√°l es la probabilidad de que en un d√≠a ocurran m√°s de dos accidentes?
  $$ \begin{align*} \mathbb{P}(X>2) &= 1- \mathbb{P}(X\le 2) \\
    &= 1- [\mathbb{P}(X=0) + \mathbb{P}(X=1) + \mathbb{P}(X=2)] \\
    &= 1- \left[ e^{-2}\frac{2^0}{0!} + e^{-2}\frac{2^1}{1!} + e^{-2}\frac{2^2}{2!} \right] \\
    &= 1 - e^{-2}[1+2+2] = 1-5e^{-2} = 0.3233
    \end{align*} $$
- ¬øcu√°l es la probabilidad de que ocurran m√°s de dos accidentes sabiendo que por lo menos ocurre uno?
  $$ \begin{align*} \mathbb{P}(X>2 \mid X \ge 1) &= \frac{\mathbb{P}(\{X>2\} \cap \{X \ge 1\} )}{\mathbb{P}\{X \ge 1)\}} \\
       &= \frac{\mathbb{P}(\{X>2\})}{\mathbb{P}\{X \ge 1)\}} \\
       & = \frac{.3233}{1-\mathbb{P}(X<1)} = \frac{0.3233}{1-e^{-2}} \frac{0.3233}{.8646} = 0.3739
       \end{align*} $$.

$\color{red}{\text{Ejercicio.}}$ Usando el atributo `.cdf` [Poisson](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.poisson.html) calcula las probabilidades anteriores.

In [None]:
from scipy.stats import poisson
lambda_poisson = 2
distribucion_poisson = poisson(lambda_poisson)

# C√°lculo de P(X > 2)
probabilidad_mayor_2 = 1 - distribucion_poisson.cdf(2)
print(f"P(X > 2): {probabilidad_mayor_2}")

# C√°lculo de P(X > 2 | X >= 1)
probabilidad_mayor_igual_1 = 1 - distribucion_poisson.cdf(0)
probabilidad_condicional = probabilidad_mayor_2 / probabilidad_mayor_igual_1
print(f"P(X > 2 | X >= 1): {probabilidad_condicional}")

### 2.1.5. Aproximaci√≥n de Poisson a la Binomial
La distribuci√≥n de Poisson es una forma l√≠mite de la distribuci√≥n binomial, es decir, es una buena aproximaci√≥n cuando $n$ es suficientemente grande y $p$ suficientemente peque√±a.

$\textbf{Teorema (Poisson).-}$ Sean $S_{n}\sim Bin(n,p_{n})$ bajo el regimen $$\lim_{n\to \infty}np_{n}=\lambda>0.$$
Consideremos la siguiente sucesi√≥n de n√∫meros reales:
$$a_{j}(n,p_n)=\begin{cases}\binom{n}{j}(p_n)^{j}(1-p_{n})^{n-j} & j\leq n\\
0 & j\geq n+1\end{cases}$$

 Entonces,
 $$\lim_{n\to \infty}a_{j}(n,p_n)=a_{j}=e^{-\lambda}\frac{\lambda^{j}}{j!} \ \ \forall j\in \mathbb{N}.$$

 El teorema anterior implica que la distribuci√≥n de Poisson ofrece un modelo probabil√≠stico adecuado para todos aquellos experimentos aleatorios 	en los que las repeticiones son independientes unas de otras y en los 	que s√≥lo hay dos posibles resultados: √©xito o fracaso, con probabilidad de 	√©xito peque√±a, y en los que el inter√©s se centra en conocer el n√∫mero de √©xitos obtenidos al realizar el experimento un n√∫mero suficientemente grande de veces.

Emp√≠ricamente se ha establecido, que la aproximaci√≥n se puede aplicar con seguridad si $n\ge100$, $p\le 0.01$ y $np \le20$.

<font color="blue">**EJEMPLO:**</font> Supongamos que la probabilidad de que un producto producido por cierta m√°quina es defectuoso es de $0.1$. ¬øCu√°l es la probabilidad de que un lote de 10 productos contenga a lo m√°s un producto defectuoso?

Sea $X$ el n√∫mero de productos defectuosos, y sabemos que $X$ tiene una distribuci√≥n binomial con par√°metros $n=10$ y $p=0.1$, entonces
\begin{align*}
\mathbb{P}(X\le 1) &= \mathbb{P}(X=0)+\mathbb{P}(X=1) \\ &= \binom{10}{0}(0.1)^{0}(0.9)^{10-0}+\binom{10}{1}(0.1)^{1}(0.9)^{10-1} \\ &= 0.7361
	\end{align*}

Ahora, con la distribuci√≥n Poisson, tenemos que $\lambda=10(0.1)=1$, por lo que
$$\mathbb{P}(X\le 1) = \mathbb{P}(X=0)+\mathbb{P}(X=1) = \frac{e^{-1}1^{0}}{0!}+\frac{e^{-1}1^{1}}{1!} = e^{-1}+e^{-1} =0.7358$$

#### Gr√°fica de la aproximaci√≥n de la binomial a la Poisson

In [None]:
# Simulaci√≥n de la aproximaci√≥n de la Bonomial a la Poisson
param=3 # Parametro de la Poisson que queremos aproximar
n=1000 # Este es el n√∫mero de ensayos en la distribuci√≥n binomial
N=5000 # Este es el n√∫mero de simulaciones que realizaremos.

# Genera una muestra de N valores aleatorios de una distribuci√≥n binomial con par√°metros:
# n = 1000 (n√∫mero de ensayos), p = param/n = 3/1000
X=npr.binomial(n,param/n,N)

# Calcular la frecuencia relativa de los valores simulados
counts = np.bincount(X) / float(N)

# Crear un array de valores posibles
x = np.arange(len(counts))

# Calcular la funci√≥n de masa de probabilidad (FMP) de la distribuci√≥n Poisson te√≥rica
f_x = sps.poisson.pmf(x, param)

plt.close()
plt.bar(x - 0.5, counts, width=1., label="ley emp√≠rica")
p2 = plt.stem(x, f_x, "r", label="ley te√≥rica")
plt.legend()
plt.show()


### 2.1.6. Variable aleatoria Geom√©trica con par√°metro $p\in (0,1)$.

**Definici√≥n:** Esta variable aleatoria cuenta el n√∫mero de fracasos antes del primer √©xito en ensayos bernoulli independientes con par√°metro $0<p<1$, y su funci√≥n de masa de probabilidades est√° dada por:
$$f_{X}(x)=\begin{cases}
	p(1-p)^{x-1} &\quad \text{si } x=1,2,\dots \\
	\qquad 0 &\quad \text{en otro caso}  
\end{cases}$$


**Notaci√≥n:** $X\sim Geo(p)$

La cual es una funci√≥n de densidad ya que:
* $0\le f_{X}(x)\le 1$ para toda $x$.
* $$\begin{align*}
	\sum_{x\in R_{X}}f_{X}(x) &= \sum_{x=1}^{\infty}(1-p)^{x-1}p \\
	&= p\sum_{y=0}^{\infty}(1-p)^{y} \\
	&= p\left(\frac{1}{1-(1-p)}\right) = 1
    \end{align*}$$

Si por el contrario queremos contar el n√∫mero de √©xitos antes del primer fracaso, tenemos que la funci√≥n de est√° dada por:
$$f_{X}(x)=\begin{cases}
	p^{x}(1-p) &\quad \text{si } x=0,1,2,\dots \\
	\qquad 0 &\quad \text{en otro caso}  
\end{cases}$$

Para calcular la esperanza y varianza de $X$, necesitamos del siguiente lema:

**Lema 1.** Sea $x$ un n√∫mero real tal que $‚îÇx‚îÇ<1$. Entonces,
$$\sum_{k=1}^{\infty}kx^{k-1}=\frac{1}{(1-x)^2}.$$

La esperanza de $X$ es:
$$\begin{align*}
\mathbb{E}[X]&= \frac{1}{p}
\end{align*}$$

Por lo tanto,
$$\text{Var}(X)=\frac{1-p}{p^2}.$$

#### Gr√°fica de la distribuci√≥n geom√©trica.

In [None]:
p = 0.6 # probabilidad de √©xito
s= 100000 # n√∫mero de muestras

random.seed(3) #fijar una semilla
#Vamos a generar numeros aleatorios que siguen una distribuci√≥n geom√©trica
geom_numeros = sps.geom.rvs(p,size=s)

#Creamos un histograma
plt.figure(figsize=(10,6))
plt.hist(
    geom_numeros,
    density=True, # Normaliza el area para que sea 1
    bins=len(np.unique(geom_numeros)), # n√∫mero de barras del histograma
    color = "blue",
    edgecolor="grey"
)

plt.xlabel('Valores')
plt.ylabel('Probabilidad')
plt.title('Funci√≥n de densidad de una geom√©trica')
plt.show() #mostrar el gr√°fica

### 2.1.7. Variable aleatoria Binomial Negativa con par√°metros $r\geq 1$ y $p\in (0,1)$.

**Definici√≥n:** Supongamos que se realizan ensayos independientes, cada uno con probabilidad $0<p<1$ de ser un √©xito, hasta obtener un total de $r$ √©xitos acumulados. Sea $X$ el n√∫mero de ensayos que se requieren, entonces su funci√≥n de masa de probabilidades est√° dada por:
$$ f_{X}(x)=\begin{cases}
	\binom{x-1}{r-1}p^{r}(1-p)^{x-r} &\quad \text{si } x=r,r+1,\dots \\
	\qquad 0 &\quad \text{en otro caso}  
\end{cases}$$

**Notaci√≥n.** $X\sim \text{BN}(r,p)$.

Se tiene que
$$ \mathbb{E}[X]=\frac{r}{p}$$
y
$$ \text{Var}[X]=\frac{r(1-p)}{p^2}.$$

#### Gr√°fica de la distribuci√≥n Binomial Negativa.

In [None]:
r = 10
p = 0.4 # probabilidad de √©xito
s= 100000 # n√∫mero de muestras

random.seed(3) #fijar una semilla
#Vamos a generar numeros aleatorios que siguen una distribuci√≥n geom√©trica
nbinom_numeros = sps.nbinom.rvs(r,p,size=s)

#Creamos un histograma
plt.figure(figsize=(10,6))
plt.hist(
    nbinom_numeros,
    density=True, # Normaliza el area para que sea 1
    bins=len(np.unique(nbinom_numeros)), # n√∫mero de barras del histograma
    color = "blue",
    edgecolor="grey"
)

plt.xlabel('Valores')
plt.ylabel('Probabilidad')
plt.title('Funci√≥n de densidad de una BN con r=10 y p=0.4')
plt.show() #mostrar el gr√°fica

$\color{red}{\text{Ejercicio.}}$ Un examen de Estad√≠stica consta de 20 preguntas tipo test y se conoce de experiencias
anteriores que un alumno tiene probabilidad 0.7 de contestar bien cada pregunta. Obtener:

a) La probabilidad de que la primera pregunta que contesta bien sea la cuarta.

b) Sabiendo que para aprobar el examen es necesario contestar bien a 10 preguntas, ¬øcu√°l es la probabilidad de que apruebe al contestar la pregunta duod√©cima?

In [None]:
from scipy.stats import geom, binom

# Datos del problema
prob_correcta = 0.7  # Probabilidad de contestar bien cada pregunta
preguntas_totales = 20  # N√∫mero total de preguntas

# a) Probabilidad de que la primera pregunta correcta sea la cuarta
pregunta_objetivo_a = 4  # La cuarta pregunta
prob_a = geom.pmf(pregunta_objetivo_a, prob_correcta)
print(f"a) Probabilidad de que la primera pregunta correcta sea la cuarta: {prob_a}")

# b) Probabilidad de aprobar en la pregunta duod√©cima
preguntas_necesarias_aprobar = 10  # Necesita 10 correctas para aprobar
preguntas_b = 12  # Pregunta duod√©cima

# Calcular la probabilidad de 9 correctas en las primeras 11 preguntas
prob_b = binom.pmf(preguntas_necesarias_aprobar - 1, preguntas_b - 1, prob_correcta)

# Multiplicar por la probabilidad de que la pregunta 12 sea correcta
prob_c = prob_b * prob_correcta
print(f"b) Probabilidad de aprobar en la pregunta duod√©cima: {prob_c}")

#### $\color{red}{\text{Problema de la Caja de Cerillos de Banach.}}$

El **Problema de la Caja de Cerillos de Banach** es un ejemplo cl√°sico que ilustra conceptos fundamentales de procesos estoc√°sticos y variables aleatorias.

---
"Un matem√°tico lleva siempre consigo dos cajas de cerillos, una en el bolsillo derecho y otra en el izquierdo. Cada vez que necesita un cerillo, elige al azar uno de los dos bolsillos. Supongamos que inicialmente cada caja contiene N cerillos. ¬øCu√°l es la probabilidad de que, cuando el matem√°tico descubre que una de las cajas est√° vac√≠a, la otra caja contenga exactamente k cerillos?"

--- 

1. **Proceso Estoc√°stico**
Es un conjunto de variables aleatorias que evolucionan con el tiempo. En este problema, el n√∫mero de cerillos en la caja es una **variable aleatoria discreta** que cambia en cada extracci√≥n.

2. **Cadenas de Markov**
El problema puede modelarse como un **proceso de Markov**, donde el n√∫mero de cerillos en la caja es el "estado" y las transiciones entre estados dependen solo del estado actual (memoria sin memoria).

3. **Distribuci√≥n de Probabilidad**
La probabilidad de que haya un n√∫mero espec√≠fico de cerillos despu√©s de \(n\) extracciones se puede modelar con una **distribuci√≥n binomial**:
$$
P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}
$$
donde:
- \(n\) = n√∫mero de extracciones,
- \(p\) = probabilidad de que un cerillo no se reemplace,
- \(k\) = n√∫mero de cerillos restantes.

4. **Convergencia y Estado Estacionario**
Despu√©s de muchas extracciones, el sistema puede llegar a un **estado estacionario**, donde la probabilidad de estar en un determinado estado (n√∫mero de cerillos) se estabiliza.

Este problema es √∫til para entender c√≥mo las las probabilidades evolucionan en procesos estoc√°sticos y cadenas de Markov.


### 2.1.8. Variable aleatoria Hipergeom√©trica con par√°metros $n,N,m$.

**Definici√≥n:** Supongamos que se elige, sin reemplazo, una muestra de tama√±o $n$ de una urna que contiene $N$ bolas, de las cuales $m$ son rojas y $N-m$ son verdes. Sea $X$ el n√∫mero de bolas rojas seleccionadas, entonces su funci√≥n de masa de probabilidades est√° dada por:
$$ f_{X}(x)=
	\frac{\binom{m}{x}\binom{N-m}{n-x}}{\binom{N}{n}} \quad \text{si } x=0,1,\dots, n $$

**Notaci√≥n.** $X\sim \text{Hiper}(n,N,m)$.

Se tiene que
$$ \mathbb{E}[X]=\frac{nm}{N}$$
y
$$ \text{Var}[X]=\frac{nm}{N}\left[\frac{(n-1)(m-1)}{N-1}+1-\frac{nm}{N} \right].$$

**Nota.** Si $x\leq n$ y $X\sim \text{Hiper}(n,N,m)$, cuando $p=\frac{m}{N}$ y $m,N$ son muy grandes con respecto a $n$ y $x$:
$$\mathbb{P}(X=x)\approx \binom{n}{x}p^{x}(1-p)^{n-x}.$$

$\color{red}{\text{Ejercicio.}}$ Replicar la grafica de la funci√≥n de densidad.

In [None]:
from scipy.special import comb

def hipergeometrica_pmf(x, n, N, m):
    """Calcula la PMF de la distribuci√≥n hipergeom√©trica."""
    numerador = comb(m, x, exact=True) * comb(N - m, n - x, exact=True)
    denominador = comb(N, n, exact=True)
    return numerador / denominador

def graficar_hipergeometrica(n, N, m):
    """Grafica la PMF de la distribuci√≥n hipergeom√©trica."""
    x_values = np.arange(0, min(n, m) + 1)
    pmf_values = [hipergeometrica_pmf(x, n, N, m) for x in x_values]

    plt.figure(figsize=(10, 6))
    plt.bar(x_values, pmf_values, color='skyblue')
    plt.xlabel('N√∫mero de √©xitos en la muestra (x)')
    plt.ylabel('Probabilidad')
    plt.title(f'Distribuci√≥n Hipergeom√©trica (n={n}, N={N}, m={m})')
    plt.xticks(x_values)
    plt.grid(axis='y')
    plt.show()

# Ejemplo de uso
n = 10  # Tama√±o de la muestra
N = 50  # Tama√±o de la poblaci√≥n
m = 20  # N√∫mero de √©xitos en la poblaci√≥n

graficar_hipergeometrica(n, N, m)


$\color{red}{\text{Ejercicio.}}$ Una compa√±√≠a petrolera realiza un estudio geol√≥gico que indica que un pozo petrolero exploratorio deber√≠a tener un 20% de posibilidades de encontrar petr√≥leo.

- ¬øCu√°l es la probabilidad de que el primer pozo se produzca en el tercer pozo perforado?

- ¬øCu√°l es la probabilidad de que el tercer pozo se produzca en el s√©ptimo pozo perforado?

- ¬øCu√°l es la media y la varianza del n√∫mero de pozos que se deben perforar si la compa√±√≠a petrolera quiere establecer tres pozos productores?

In [None]:
from scipy.stats import geom, nbinom

# Datos del problema
prob_exito = 0.2  # Probabilidad de encontrar petr√≥leo

# a) Probabilidad de que el primer pozo se produzca en el tercer pozo
prob_a = geom.pmf(3, prob_exito)
print(f"a) Probabilidad: {prob_a}")

# b) Probabilidad de que el tercer pozo se produzca en el s√©ptimo pozo
prob_b = nbinom.pmf(4, 3, prob_exito)  # nbinom.pmf(k-r, r, p)
print(f"b) Probabilidad: {prob_b}")

# c) Media y varianza del n√∫mero de pozos para 3 √©xitos
media = 3 / prob_exito
varianza = (3 * (1 - prob_exito)) / (prob_exito ** 2)
print(f"c) Media: {media}, Varianza: {varianza}")

## 2.2. Variables Aleatorias (absolutamente) Continuas.

**Definici√≥n.** Una variable aleatoria absolutamente continua es aquella para la cual existe una funci√≥n $f_X$ no negativa, llamada funci√≥n de densidad, tal que:
$$
F_X(x) = \mathbb{P}(X\leq x) = \int_{-\infty}^{x} f_X(y) dy, \quad x\in \mathbb{R}
$$

**Lema.** Sea $F_X$ una funci√≥n de distribuci√≥n. Supongamos que $F_X$ es derivable y que su derivada es continua en $(a, b)$, donde:
$ a = \inf \{ x \in \mathbb{R} \mid F_X(x) > 0 \}, \quad b = \sup \{ x \in \mathbb{R} \mid F_X(x) < 1 \}$
entonces, la funci√≥n de densidad se puede obtener como:
$$ f_X(x) =
\begin{cases} 
F'_X(x), & \text{si } x \in (a, b), \\
0, & \text{e.o.c.}
\end{cases}$$

Es decir,
$$ \frac{dF_X(x)}{dx} = f_X(x)$$

In [None]:
import numpy as np # Importamos Numpy
import numpy.random as npr # para generar numeros aleatorios

import scipy.stats as sps # Importamos el modulo SciPy
from scipy.stats import randint # para trabajar una uniforme discreta en un rango de enteros

import matplotlib.pyplot as plt #Visualizar datos 

import random # para generar numeros aleatorios

### 2.2.1. Variable aleatoria uniforme sobre el intervalo $(a,b)$.

**Definici√≥n:** Una variable aleatoria $X$ se dice que tiene distribuci√≥n uniforme continua  en el intervalo $(a,b)$ con $a,b\in\mathbb{R}$, si su funci√≥n de densidad esta dada por:
$$f_{X}(x)=\begin{cases}
	\frac{1}{b-a} &\quad \text{si } a< x < b\\
	\qquad 0 &\quad \text{en otro caso}  
\end{cases}$$

**Notaci√≥n.** $X\sim \text{Unif}(a,b)$ $\text{Unif}[a,b]$

**Obs:**
* La distribuci√≥n uniforme continua en $(a,b)$ es sim√©trica.
* A los intervalos de la misma longitud contenidos en $(a,b)$ se les asigna la misma probabilidad. Esto se representa gr√°ficamente con la probabilidad de que $X$ se encuentre en el intervalo $(s,t)$:


La funci√≥n de distribuci√≥n de $X\sim Unif((a,b))$ esta dada por:
$$F_{X}(x)=\begin{cases}
	 0 &\quad \text{si } x\le a \\
	\frac{x-a}{b-a} &\quad \text{si } a<x<b\\
	 1 &\quad \text{si } x\ge b  
\end{cases}$$

La esperanza de una variable aleatoria uniforme es la siguiente,
$$\begin{align*}
\mathbb{E}[X] &= \frac{a+b}{2}.
\end{align*}$$

y su varianza es:

$$Var(X) = \frac{(b-a)^{2}}{12}.$$

#### Gr√°fica de la distribuci√≥n Uniforme.

In [None]:
# Par√°metros de la distribuci√≥n uniforme
a = 0  # l√≠mite inferior
b = 1  # l√≠mite superior

# Definimos las funciones de densidad y distribuci√≥n
# Funci√≥n de densidad (pdf) de la distribuci√≥n uniforme
def uniform_pdf(x, a, b):
    return np.where((x >= a) & (x <= b), 1 / (b - a), 0)

# Funci√≥n de distribuci√≥n (cdf) de la distribuci√≥n uniforme
def uniform_cdf(x, a, b):
    return np.where(x < a, 0, np.where(x > b, 1, (x - a) / (b - a)))
    
# Generar valores de x
x = np.linspace(-0.5, 1.5, 1000)

# Calcular la funci√≥n densidad 
pdf_values = uniform_pdf(x, a, b)

# Calcular la funci√≥n de distribuci√≥n
cdf_values = uniform_cdf(x, a, b)

# Graficar la PDF
plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.plot(x, pdf_values, label='PDF', color='blue')
plt.xlabel('x')
plt.ylabel('Densidad de probabilidad')
plt.title('Funci√≥n de Densidad (PDF)')
plt.grid(True)

# Graficar la CDF
plt.subplot(1, 2, 2)
plt.plot(x, cdf_values, label='CDF', color='orange')
plt.xlabel('x')
plt.ylabel('Funci√≥n de distribuci√≥n acumulada')
plt.title('Funci√≥n de Distribuci√≥n Acumulada (CDF)')
plt.grid(True)

plt.tight_layout()
plt.show()

<font color="blue">**EJEMPLO:**</font> Sea $X\sim Unif((-3,2))$. Vamos a calcular: $P(X\ge 0)$ y
$P(-5 \le X \le 1/2)$.

**Soluci√≥n.** La funci√≥n de densidad de esta variable aleatoria esta dada por:
$$f_{X}(x)=\begin{cases}
	\quad \frac{1}{5} &\quad \text{si } -3\le x \le 2\\
	\quad 0 &\quad \text{e.o.c}  
\end{cases}$$
Entonces,

$$\begin{align}
\mathbb{P}(X\ge 0) &= \int_{0}^{2}\frac{1}{5}dx=\frac{1}{5}x\Big|_{0}^{2}=\frac{2}{5} \\
\mathbb{P}(-5 \le X \le 1/2) &= \int_{-5}^{-3}f_{X}(x)dx+\int_{-3}^{1/2}\frac{1}{5}dx=\frac{1}{5}x\Big|_{-3}^{1/2}=\frac{1}{5}\left(\frac{1}{2}+3\right)=\frac{7}{10}
\end{align}$$

Utilizando la $F_X$, se tiene:

- $\mathbb{P}(X\ge 0)=1-F_X(0)$ 

In [None]:
from scipy.stats import uniform

# Par√°metros de la distribuci√≥n uniforme
a = -3  # l√≠mite inferior
b = 2   # l√≠mite superior

# Crear el objeto de distribuci√≥n uniforme usando scipy
uniform_dist = uniform(loc=a, scale=b-a)

# Calcular P(X >= 0) = 1 - P(X < 0)
p_0 = 1 - uniform_dist.cdf(0)

# Calcular P(-5 <= X <= 1/2)
p_interval = uniform_dist.cdf(1/2) - uniform_dist.cdf(-5)

# Imprimir los resultados
print(f"P(X >= 0) = {p_0}")
print(f"P(-5 <= X <= 1/2) = {p_interval}")

$\color{red}{\text{Ejercicio.}}$ Un alumno se dirige a la biblioteca para solicitar el pr√©stamo de un libro y decide que no puede esperar m√°s de $10$ minutos en ser atendido. Supongamos que el bibliotecario tarda por lo menos $0.5$ minutos en atender a una persona, entonces es razonable proponer una distribuci√≥n uniforme en el intervalo $[0.5,10]$ para modelar el comportamiento de la variable $X$ que es el tiempo en ser atendido (en  minutos).

- Da la funci√≥n de densidad y gr√°fica.
- ¬øCu√°l es la probabilidad de que el tiempo en ser atendido sea mayor a $5$ minutos pero menor a $8$ minutos?
- ¬øCu√°l es la esperanza y varianza?
- Calcula la funci√≥n de distribuci√≥n y gr√°ficala, y con ella calcula: $\mathbb{P}(2.51\le X \le 7.99)$.

In [None]:
# Definir los par√°metros de la distribuci√≥n uniforme
a, b = 0.5, 10  # Intervalo [0.5, 10]

# Crear la funci√≥n de densidad (PDF)
x = np.linspace(a - 1, b + 1, 1000)  # Valores en un rango mayor para visualizar mejor
pdf = uniform.pdf(x, loc=a, scale=b-a)

# ---- 2. Calcular P(5 < X < 8) ----
prob_5_8 = uniform.cdf(8, loc=a, scale=b-a) - uniform.cdf(5, loc=a, scale=b-a)
print(f"Probabilidad de que 5 < X < 8: {prob_5_8:.4f}")

# ---- 3. Calcular esperanza y varianza ----
esperanza = (a + b) / 2
varianza = ((b - a) ** 2) / 12
print(f"Esperanza (E[X]): {esperanza:.2f}")
print(f"Varianza (Var[X]): {varianza:.2f}")

# Graficar la funci√≥n de densidad
plt.figure(figsize=(8, 4))
plt.plot(x, pdf, label='Funci√≥n de Densidad (PDF)', color='b')
plt.axhline(y=1/(b-a), color='r', linestyle='--', label=f'Densidad constante = {1/(b-a):.3f}')
plt.xlabel("Tiempo de espera (X)")
plt.ylabel("Densidad de probabilidad")
plt.title("Distribuci√≥n Uniforme U(0.5,10)")
plt.legend()
plt.grid()
plt.show()

# ---- 4. Funci√≥n de distribuci√≥n acumulada (CDF) y P(2.51 ‚â§ X ‚â§ 7.99) ----
x_cdf = np.linspace(a - 1, b + 1, 1000)
cdf = uniform.cdf(x_cdf, loc=a, scale=b-a)

# Calcular P(2.51 ‚â§ X ‚â§ 7.99)
prob_2_51_7_99 = uniform.cdf(7.99, loc=a, scale=b-a) - uniform.cdf(2.51, loc=a, scale=b-a)
print(f"Probabilidad de que 2.51 ‚â§ X ‚â§ 7.99: {prob_2_51_7_99:.4f}")

# Graficar la funci√≥n de distribuci√≥n acumulada (CDF)
plt.figure(figsize=(8, 4))
plt.plot(x_cdf, cdf, label='Funci√≥n de Distribuci√≥n Acumulada (CDF)', color='g')
plt.xlabel("Tiempo de espera (X)")
plt.ylabel("Probabilidad acumulada")
plt.title("Distribuci√≥n Acumulada U(0.5,10)")
plt.legend()
plt.grid()
plt.show()


### 2.2.2. Variable aleatoria exponencial con par√°metro $\lambda >0$.

La distribuci√≥n exponencial es una de las distribuciones continuas m√°s utilizadas. A menudo se utiliza para modelar el tiempo transcurrido entre eventos.  

Algunos ejemplos en los que podr√≠a utilizarse la distribuci√≥n exponencial son:
* El tiempo transcurrido en un call center hasta recibir la primer llamada del d√≠a.
* El  tiempo entre terremotos de una determinada magnitud.
* Supongamos una m√°quina que produce hilo de alambre, la cantidad de metros de alambre hasta encontrar una falla en el alambre se podr√≠a modelar como una exponencial.

**Definici√≥n:** Se dice que la variable aleatoria $X$ tiene distribuci√≥n exponecial de par√°metro $\lambda>0$, si su funci√≥n de densidad est√° dada por:
$$f_{X}(x)=\begin{cases}
\lambda e^{-\lambda x} & x>0\\
0 & \text{en otro caso}
\end{cases}$$


Notaci√≥n. $X\sim \exp(\lambda).$

**Propiedad de p√©rdida de memoria:**
$$\mathbb{P}(X>t+s \mid X>t)=\mathbb{P}(X>s)=e^{-\lambda s}.$$

$\color{red}{\text{Ejercicio.}}$ Demostrar la propiedad de p√©rdida de memoria para $X\sim \exp(\lambda)$.
Usamos la definici√≥n de probabilidad condicional:

$$
\mathbb{P}(X > s + t \mid X > s) = \frac{\mathbb{P}(X > s + t \cap X > s)}{\mathbb{P}(X > s)} = \frac{\mathbb{P}(X > s + t)}{\mathbb{P}(X > s)}
$$

Dado que $X \sim \exp(\lambda)$, su funci√≥n de supervivencia es:

$$
\mathbb{P}(X > x) = e^{-\lambda x}
$$

Sustituimos:

$$
\frac{e^{-\lambda (s + t)}}{e^{-\lambda s}} = e^{-\lambda t}
$$

Por lo tanto:

$$
\mathbb{P}(X > s + t \mid X > s) = \mathbb{P}(X > t)
$$

Esto prueba que la distribuci√≥n exponencial **no tiene memoria**: el tiempo adicional a esperar no depende de cu√°nto tiempo ya ha pasado.

In [None]:
import seaborn as sns

# Par√°metro lambda
lamb = 1.5
size = 100_000

# Simulaci√≥n de X ~ Exp(lambda)
X = np.random.exponential(1/lamb, size)

# Par√°metros de tiempo
s, t = 2, 3

# Estimaciones por simulaci√≥n
P_cond = np.mean(X > s + t) / np.mean(X > s)
P_direct = np.mean(X > t)

print(f"P(X > {s+t} | X > {s}) ‚âà {P_cond:.4f}")
print(f"P(X > {t}) ‚âà {P_direct:.4f}")

# Gr√°fica de Distribuc√≥n exponencial
sns.set(style="whitegrid")

plt.figure(figsize=(10, 6))
sns.histplot(X[X > s] - s, bins=100, stat="density", label=f"$X - {s}$ dado $X > {s}$", color='skyblue', kde=True)
sns.histplot(X, bins=100, stat="density", label="$X$", color='salmon', kde=True, alpha=0.4)
plt.axvline(t, color='black', linestyle='--', label=f"$t = {t}$")

plt.title("Verificaci√≥n visual de la propiedad de p√©rdida de memoria")
plt.xlabel("Tiempo")
plt.ylabel("Densidad")
plt.legend()
plt.show()


<font color="blue">**EJEMPLO:**</font> Hip√≥tesis natural para modelar las duraciones de vida de √°tomos radioactivas (Rutherford y Soddy). Cada √°tomo radioactivo posee una duraci√≥n de vida que sigue una ley exponencial. En este campo, el par√°metro $\lambda$ se llama la constante de desintegraci√≥n.

 Si $t\mapsto \rho(t)=\mathbb{P}(X>t)$ verifica
$$\rho(t+s)=\rho(t)\rho(s),$$
de manera que (derivando en $s$, con $s=0$),
$$\rho^{\prime}(t)=-\rho(t)\lambda \qquad \ \lambda=-\rho^{\prime}(0)\geq 0.$$
As√≠,
$$\rho(t)=e^{-\lambda t} \qquad \text{y} \qquad f(t)=\lambda e^{-\lambda t} \ \  \rho(0)=1.$$

La esperanza y varianza de de una distribuci√≥n exponencial de la forma $$f_{X}(x)=\begin{cases}
\frac{1}{\lambda} e^{-\frac{x}{\lambda}} & x>0\\
0 & \text{en otro caso} \end{cases}$$

$$\Rightarrow \mathbb{E}[X]=\lambda$$
y
$$\Rightarrow \text{Var}(X) =\lambda^{2} $$


<font color="blue">**EJEMPLO:**</font> Consideremos la variable aleatoria $X$ como el tiempo (en minutos) entre la llegada de dos personas a la fila  de una sucuarsal bancaria.

Adicionalmente, el banco ha determinado que solo el $10\%$ de las veces, el tiempo que transcurre entre la llegada de una persona y otra es mayor a dos minutos.

Esto permite calcular el valor de $\lambda$, ya que
$$\mathbb{P}(X>2)=0.1$$
entonces
$$1-\mathbb{P}(X\le 2) = 1-F_{X}(2) = 0.1$$

Notemos que si $X\sim Exp\left( \lambda \right)$, entonces $F_{X})(x) = 1-e^{-\frac{x}{\lambda}}$

Por lo que $F_{X}(2)= 1-e^{\frac{-2}{\lambda}} =0.9$, entonces
$e^{\frac{-2}{\lambda}}=0.1$. Por lo que
$$\frac{-2}{\lambda}=\ln(0.1) \Rightarrow \lambda=0.87$$
Por lo tanto $X\sim\exp(0.87)$.

Ahora queremos calcular la probabilidad de que entre la llegada de una persona y otra transcurra por lo menos un minuto, lo cual puede calcularse de dos formas:


\begin{align*}
\mathbb{P}(X>1) &= \int_{1}^{\infty}f_{X}(x)dx = \int_{1}^{\infty}\frac{1}{0.87}e^{\frac{-x}{0.87}}dx = 0.32 
\end{align*}
$ $

\begin{align*}
\mathbb{P}(X>1) &= 1-\mathbb{P}(X\le 1) = 1-\left[1-e^{\frac{-1}{0.87}}\right] = -e^{\frac{-1}{0.87}}
\end{align*}



$\color{red}{\text{Ejercicio.}}$ Calcular las probabilidades con Scipy

In [None]:
from scipy.stats import expon
from scipy.integrate import quad

# Dato del problema
P_X_mayor_2 = 0.1

# Encontrar lambda a partir de: e^{-2/Œª} = 0.1
lambda_ = -2 / np.log(0.1)
print(f"Œª = {lambda_:.2f}")

# Definir la distribuci√≥n exponencial
X = expon(scale=lambda_)  # escala = 1/lambda

# Forma 1: por integral directa
P1, _ = quad(X.pdf, 1, np.inf)

# Forma 2: con funci√≥n de distribuci√≥n acumulada
P2 = 1 - X.cdf(1)

print(f"P(X > 1) por integral = {P1:.4f}")
print(f"P(X > 1) por CDF = {P2:.4f}")

# Visualizaci√≥n: funci√≥n de densidad y √°rea desde x=1
x_vals = np.linspace(0, 6, 500)
y_vals = X.pdf(x_vals)

plt.figure(figsize=(10, 5))
plt.plot(x_vals, y_vals, label="Funci√≥n de densidad $f_X(x)$", color='blue')
plt.fill_between(x_vals, y_vals, where=(x_vals > 1), color='skyblue', alpha=0.5, label="$P(X > 1)$")
plt.axvline(1, color='gray', linestyle='--')
plt.title("Distribuci√≥n Exponencial con Œª ‚âà 0.87")
plt.xlabel("x")
plt.ylabel("Densidad")
plt.legend()
plt.grid(True)
plt.show()


Una propiedad interesante de la distribuci√≥n exponencial es que puede verse como un an√°logo continuo de la distribuci√≥n geom√©trica. Para ver esto, recuerde el experimento aleatorio detr√°s de la distribuci√≥n geom√©trica: lanza una moneda (repite un experimento de Bernoulli) hasta que observa las primeras caras (√©xito).


$\mathbf{Teorema.-}$ Sea $\varepsilon>0$ y $Y_{\epsilon}\sim Geo(p_{\varepsilon})$. Supongamos que nos encontramos en el regimen:
$$\lim_{\varepsilon\to 0}p_{\varepsilon}=0 \qquad \text{y} \qquad \varepsilon^{-1}p_{\varepsilon}\sim \lambda>0$$
   Sea $X_{\varepsilon}:=\varepsilon Y_{\varepsilon}$. Entonces,
   $$\lim_{\varepsilon\to 0}F_{X_{\varepsilon}}(x)=F_{X}(x),$$
   en donde $X\sim \exp(\lambda)$. Este tambi√©n es un resultado de convergencia en ley.

Visualicemos lo anterior:

In [None]:
from scipy.stats import expon

# Configuraci√≥n de estilo
sns.set(style="whitegrid")
plt.rcParams.update({'font.size': 12})

# Par√°metros
lambda_ = 2
epsilons = [0.5, 0.2, 0.1, 0.05]
n = 100000

# Crear figura
fig, axs = plt.subplots(2, 2, figsize=(14, 10), sharex=True, sharey=True)
axs = axs.flatten()

# Rango para la densidad te√≥rica
x = np.linspace(0, 5, 1000)
pdf = lambda_ * np.exp(-lambda_ * x)

# Dibujar cada histograma
for i, epsilon in enumerate(epsilons):
    p_epsilon = lambda_ * epsilon
    Y = np.random.geometric(p_epsilon, size=n)
    X_epsilon = epsilon * Y

    sns.histplot(X_epsilon, bins=80, stat='density', element='step',
                 fill=True, color='skyblue', edgecolor='blue', alpha=0.4, ax=axs[i])

    axs[i].plot(x, pdf, 'r--', linewidth=2, label='Densidad Exponencial')
    axs[i].set_title(f'Œµ = {epsilon}', fontsize=14)
    axs[i].legend()
    axs[i].set_xlim(0, 5)
    axs[i].set_ylim(0, lambda_ + 1)
    axs[i].grid(True, linestyle='--', alpha=0.5)

# Etiquetas generales
fig.suptitle('Convergencia de $X_\\varepsilon = \\varepsilon Y_\\varepsilon$ a una Distribuci√≥n Exponencial(Œª)', fontsize=18)
for ax in axs[2:]:
    ax.set_xlabel('$x$', fontsize=13)
for ax in axs[::2]:
    ax.set_ylabel('Densidad', fontsize=13)

plt.tight_layout(rect=[0, 0.04, 1, 0.96])
plt.show()


Tambi√©n, tenemos el siguiente resultado:

$\mathbf{Teorema.-}$ Sea $X\sim \exp(1)$. Si $Y=\min\{k\in \mathbb{Z}: k\geq \lambda X \}$, con $\lambda>0$, entonces
$$Y\sim Geo\left(p=1-e^{-1/\lambda} \right).$$

### 2.2.3. Variable aletoria Geom√©trica.

**Definici√≥n:** Una **variable aleatoria geom√©trica** $Y$ con par√°metro $p \in (0,1]$ representa el n√∫mero de ensayos hasta el primer √©xito en una secuencia de ensayos de Bernoulli independientes.

Se denota:

$$
Y \sim \text{Geom}(p)
$$

Su funci√≥n de masa de probabilidad (pmf)

$$
\mathbb{P}(Y = k) = (1 - p)^{k - 1} p, \quad \text{para } k = 1, 2, 3, \dots
$$

Esto indica que se producen $k - 1$ fracasos antes del primer √©xito, que ocurre en el ensayo n√∫mero $k$.

- **Esperanza:**

  $$
  \mathbb{E}[Y] = \frac{1}{p}
  $$

- **Varianza:**

  $$
  \text{Var}(Y) = \frac{1 - p}{p^2}
  $$

- **Soporte:** $\{1, 2, 3, \dots\}$

- **Propiedad de falta de memoria:**

  $$
  \mathbb{P}(Y > m + n \mid Y > m) = \mathbb{P}(Y > n)
  $$

#### Gr√°fica de la v.a. Geom√©trica.

In [None]:
from scipy.stats import geom

# Par√°metro de la geom√©trica
p = 0.3

# Simular datos
np.random.seed(0)
muestras = np.random.geometric(p, size=10000)

# Graficar histograma
plt.figure(figsize=(8, 5))
plt.hist(muestras, bins=np.arange(1, 25) - 0.5, density=True, alpha=0.6, color='skyblue', edgecolor='black', label='Simulaci√≥n')

# Comparar con la pmf te√≥rica
k = np.arange(1, 25)
pmf_teorica = geom.pmf(k, p)
plt.plot(k, pmf_teorica, 'o-', color='red', label='PMF te√≥rica')

plt.title('Distribuci√≥n Geom√©trica (p = 0.3)')
plt.xlabel('N√∫mero de ensayos hasta el primer √©xito')
plt.ylabel('Probabilidad')
plt.xticks(k)
plt.legend()
plt.grid(True, linestyle='--', alpha=0.7)
plt.show()

### 2.2.4.  Variable aleatoria normal con par√°metros media $\mu$ y varianza $\sigma^{2}$.

La **distribuci√≥n normal** es una de las m√°s importantes y de mayor uso tanto en la teor√≠a de la probabilidad, como en la teor√≠a estad√≠stica.

Tambi√©n llamada distribuci√≥n gaussiana, en honor a Gauss, a quien se considera el padre de √©sta distribuci√≥n.

La importancia de la distribuci√≥n normal, radica en el famoso Teorema central del l√≠mite. Fue descubierta por De Moivre en 1733 como un l√≠mite de la distribuci√≥n binomial.


La importancia de esta distribuci√≥n radica en que permite modelar numerosos fen√≥menos naturales, sociales y psicol√≥gicos, por ejemplo:
* Estatura
* Efectos de un f√°rmaco
* Consumo de cierto producto por un grupo de individuos
* Coeficiente intelectual
* Nivel de ruido en telecomunicaciones
* Errores cometidos al medir ciertas magnitudes

Adem√°s, esta distribuci√≥n juega un papel de suma importancia en la inferencia estad√≠stica.

**Definici√≥n:** Se dice que la variable aleatoria $X$ tiene distribuci√≥n normal de par√°metros $\mu$ y $\sigma^{2}$, donde $\mu,\sigma\in\mathbb{R}$ y $\sigma>0$, si su funci√≥n de densidad est√° dada por:
$$f_{X}(x)=\begin{cases}
	\frac{1}{\sqrt{2\pi\sigma^{2}}}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}} &\quad \text{si }  x \in\mathbb{R} \\
	\qquad 0 &\quad \text{e.o.c}  
\end{cases}$$

**Notaci√≥n.** $X\sim N(\mu,\sigma^{2})$


Tal curva (**la campana de Gauss-Bell**) es una funci√≥n que depende de los par√°metros $\mu$ y $\sigma^{2}$.

Sabemos que:
* La varianza es usada como una medida para comparar la dispersi√≥n en dos o m√°s conjuntos de observaciones.
* Una desviaci√≥n est√°ndar peque√±a indica que los valores de la variable aleatoria se encuentran cercanos a la media.
* Una desviaci√≥n est√°ndar grande indica que los valores de la variable aleatoria se dispersan mucho con respecto a la media.

La funci√≥n de distribuci√≥n de una variable aleatoria $X\sim N(\mu,\sigma^{2})$ est√° dada por:
$$F_{X}(x) = \int_{-\infty}^{x}\frac{1}{\sqrt{2\pi\sigma^{2}}}e^{-\frac{(y-\mu)^{2}}{2\sigma^{2}}}dy$$

- La **media** de la distribuci√≥n es:

  $$
  \mathbb{E}[X] = \mu
  $$

- La **varianza** de la distribuci√≥n es:

  $$
  \mathrm{Var}(X) = \sigma^2
  $$


Esta nos proporciona la probabilidad de que $X$ tome calores menores o iguales a un valor espec√≠fico $x$, y corresponde al √°rea bajo la curva en el intervalo $(-\infty,x]$:

No es sencillo calcular $F_{X}(x)$, pero cualquier v.a. gaussiana puede transformarse a una v.a. estandarizada. Existen tablas para esta v.a., lo cual hace los c√°lculos m√°s f√°ciles.


**Proposici√≥n:**  Sea $X\sim N(\mu,\sigma^{2})$, entonces
$$Z=\frac{X-\mu}{\sigma}$$
tiene una distribuci√≥n gaussiana con media $0$ y varianza $1$, es decir, $Z\sim N(0,1)$.



#### Gr√°fica de la v.a. Normal.

In [None]:
from scipy.stats import norm
fig, ax = plt.subplots()
x= np.arange(-4,4,0.001) #generar valores de x
ax.set_title('N(0,$1^2$)')
ax.set_xlabel('x')
ax.set_ylabel('f(x)')
ax.plot(x, norm.pdf(x))
ax.set_ylim(0,0.45)
plt.show()

Propiedades de la funci√≥n de densidad de probabilidades de una distribuci√≥n normal est√°ndar:

1. Es positiva: $f(x)\geq 0$ para todo $x$ real.
2. Es continua y derivable en todas partes.
3. Es sim√©trica alrededor de $\mu$.
4. Conforme $x$ toma valores muy grandes de manera positiva y negativa, la funci√≥n decrece hacia cero muy r√°pidamente.
5. Tiene un m√°ximo global.
6. El √°rea total bajo la curva es igual a $1$.

Veamos el comportamiento de la funci√≥n conforme se cambia la varianza.

In [None]:
from scipy.stats import norm
fig, ax = plt.subplots()
x = np.linspace(-10,10,100)
stdvs = [0.5, 0.7, 1.0, 2.0, 3.0, 4.0]
for s in stdvs:
    ax.plot(x, norm.pdf(x,scale=s), label='stdv=%.1f' % s)

ax.set_xlabel('x')
ax.set_ylabel('pdf(x)')
ax.set_title('Distribuci√≥n normal')
ax.legend(loc='best', frameon=True)
ax.set_ylim(0,1)
ax.grid(True)

In [None]:
from scipy.stats import norm
fig, ax = plt.subplots()
x = np.linspace(-10,10,100)
means = [-1.0,-2.0, -1.0, 0.0, 1.0, 2.0, 5.0]
for mean in means:
    ax.plot(x, norm.pdf(x,loc=mean), label='mean=%.1f' % mean)

ax.set_xlabel('x')
ax.set_ylabel('pdf(x)')
ax.set_title('Distribuci√≥n normal')
ax.legend(loc='best', frameon=True)
ax.set_ylim(0,0.45)
ax.grid(True)

#### 2.2.4.1. Funci√≥n de distribuci√≥n acumulativa de una normal $N(\mu,\sigma^2)$.

Gracias a las propiedades anteriores, es posible calcular √°reas delimitadas de la funci√≥n $f$. Si $a$ y $b$ son reales cualesquiera, denotaremos por
$$P(a\leq X\leq b),$$
la probabilidad de que $X$ est√© en el intervalo $[a,b]$, al √°rea bajo la curva de $f(x)$ sobre el intervalo $[a,b]$.

Tambi√©n, $P(X\leq x)$ denotara al √°rea bajo la curva de la funci√≥n $f(x)$ sobre el intervalo $(-\infty,x)$ y $P(X>x)$ denotara al √°rea bajo la curva de la funci√≥n $f(x)$ sobre el intervalo $(x, \infty)$.

A la probabilidad $\text{cdf}(x):=P(X\leq x)$ se llama la distribuci√≥n acumulativa (hasta el valor $x$) de $f(x)$.

Con la notaci√≥n anterior,
$$P(a\leq X\leq b)=\text{cdf}(b)-\text{cdf}(a)$$
y
$$\text{sf}(a):=P(X>a)=1-\text{cdf}(a).$$

#### Gr√°fica de la Distribuci√≥n normal acumulativa.

In [None]:
from scipy.stats import norm
fig, ax = plt.subplots()
# for distribution curve
x= np.arange(-4,4,0.001)
ax.plot(x, norm.pdf(x))
ax.set_title("Distribuci√≥n normal acumulativa")
ax.set_xlabel('x')
ax.set_ylabel('pdf(x)')
ax.grid(True)
# for fill_between
px=np.arange(-4,1,0.01)
ax.set_ylim(0,0.5)
ax.fill_between(px,norm.pdf(px),alpha=0.5, color='g')
# for text
ax.text(-1,0.1,"cdf(x)", fontsize=20)
plt.show()

#### C√°lculo de probabilidades de una distribuci√≥n normal.

<font color="blue">**EJEMPLO:**</font> Calculemos $\text{cdf}(2)=\mathbb{P}(X<2)$ cuando $X\sim N(3,2^2)$.
$$Z = \frac{X-\mu}{\sqrt{\sigma^2}} \sim N(0,1)$$

In [None]:
norm.cdf(x=2, loc=3, scale=2) #v.a. con media=3 y st=2

In [None]:
from scipy.stats import norm
fig, ax = plt.subplots()
# for distribution curve
x= np.arange(-4,10,0.001)
ax.plot(x, norm.pdf(x,loc=3,scale=2))
ax.set_title("N(3,$2^2$)")
ax.set_xlabel('x')
ax.set_ylabel('pdf(x)')
ax.grid(True)
# for fill_between
px=np.arange(-4,2,0.01)
ax.set_ylim(0,0.25)
ax.fill_between(px,norm.pdf(px,loc=3,scale=2),alpha=0.5, color='g')
# for text
ax.text(-0.5,0.02,round(norm.cdf(x=2, loc=3, scale=2),2), fontsize=20)
plt.show()

In [None]:
s=np.sqrt(2)
norm(1, s).cdf(2) - norm(1,s).cdf(0.5)

In [None]:
fig, ax = plt.subplots()
x= np.arange(-6,8,0.001)
ax.plot(x, norm.pdf(x,loc=1,scale=2))
ax.set_title("N(1,$2^2$)")
ax.set_xlabel('x')
ax.set_ylabel('pdf(x)')
ax.grid(True)
px=np.arange(0.5,2,0.01)
ax.set_ylim(0,0.25)
ax.fill_between(px,norm.pdf(px,loc=1,scale=2),alpha=0.5, color='g')
pro=norm(1, 2).cdf(2) - norm(1,2).cdf(0.5)
ax.text(0.2,0.02,round(pro,2), fontsize=20)
plt.show()

<font color="blue">**EJEMPLO IMPORTANTE:**</font> Si $Z\sim N(0,1)$, encuentra $\mathbb{P}(-1.93 < Z < 1.93)$. La probabilidad buscada es:

In [None]:
norm(0,1).cdf(1.93)-norm(0,1).cdf(-1.93)

In [None]:
fig, ax = plt.subplots()
# for distribution curve
x= np.arange(-3,3,0.001)
ax.plot(x, norm.pdf(x,loc=0,scale=1))
ax.set_title("N(0,$1^2$)")
ax.set_xlabel('x')
ax.set_ylabel('pdf(x)')
ax.grid(True)
px=np.arange(-1.93,1.93,0.01)
ax.set_ylim(0,0.45)
ax.fill_between(px,norm.pdf(px,loc=0,scale=1),alpha=0.5, color='g')
pro=norm(0, 1).cdf(1.93) - norm(0,1).cdf(-1.93)
ax.text(0.2,0.02,round(pro,2), fontsize=20)
plt.show()

**C√°lculo de probabilidades:**
$\mathbb{P}(0<Z<b)$: 
Queremos calcular $\mathbb{P}(0<Z<0.43)$, lo cu√°l puede realizarse de la siguiente manera:
* Tablas de √°rea a la derecha: $\mathbb{P}(0<Z<0.43) = 0.1664$

$\mathbb{P}(-b<Z<b)$: Queremos calcular $\mathbb{P}(-0.16<Z<0.16)$, lo cu√°l puede realizarse de la siguiente manera:
* Tablas de √°rea a la derecha:  $\mathbb{P}(-0.16<Z<0.16) = \mathbb{P}(-0.16<Z<0)+\mathbb{P} (0<Z<0.16) = \mathbb{P}(0<Z<0.16)+\mathbb{P}(0<Z<0.16) = 2\mathbb{P}(0<Z<0.16) = 2(0.0636) = 0.1272$

$\mathbb{P}(Z<-b)$: Queremos calcular $\mathbb{P}(Z<-1.94)$, lo cu√°l puede realizarse de la siguiente manera:
* Tablas de √°rea a la derecha: $\mathbb{P}(Z<-1.94) = \mathbb{P}(Z<0)+\mathbb{P}(-1.94<Z<0) = \mathbb{P}(Z<0) + \mathbb{P}(0<Z<1.94) = 0.5 - 0.4738 = 0.0262$

$\mathbb{P}(Z>-b)$: Queremos calcular $(Z>-0.07)$, lo cu√°l puede realizarse de la siguiente manera:
* Tablas de √°rea a la derecha: $\mathbb{P}(Z>-0.07) = \mathbb{P}(-0.07<Z<0) + \mathbb{P}(Z>0) = \mathbb{P}(0<Z<0.07) + \mathbb{P}(Z>0) = 0.0279 + 0.5 = 0.5279$

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Rango de valores Z para la gr√°fica
z = np.linspace(-3, 3, 1000)
pdf = norm.pdf(z)

# Crear figura y subplots
fig, axs = plt.subplots(2, 2, figsize=(12, 8))
fig.suptitle('Distribuci√≥n Normal Est√°ndar - Probabilidades', fontsize=16)

# --- Cuadrante 1: P(0 < Z < 0.43) ---
x1 = np.linspace(0, 0.43, 100)
axs[0, 0].plot(z, pdf, color='blue')
axs[0, 0].fill_between(x1, norm.pdf(x1), color='orange', alpha=0.5)
axs[0, 0].set_title(r'$\mathbb{P}(0 < Z < 0.43)$')
axs[0, 0].grid(True)

# --- Cuadrante 2: P(-0.16 < Z < 0.16) ---
x2 = np.linspace(-0.16, 0.16, 100)
axs[0, 1].plot(z, pdf, color='blue')
axs[0, 1].fill_between(x2, norm.pdf(x2), color='green', alpha=0.5)
axs[0, 1].set_title(r'$\mathbb{P}(-0.16 < Z < 0.16)$')
axs[0, 1].grid(True)

# --- Cuadrante 3: P(Z < -1.94) ---
x3 = np.linspace(-3, -1.94, 100)
axs[1, 0].plot(z, pdf, color='blue')
axs[1, 0].fill_between(x3, norm.pdf(x3), color='red', alpha=0.5)
axs[1, 0].set_title(r'$\mathbb{P}(Z < -1.94)$')
axs[1, 0].grid(True)

# --- Cuadrante 4: P(Z > -0.07) ---
x4 = np.linspace(-0.07, 3, 1000)
axs[1, 1].plot(z, pdf, color='blue')
axs[1, 1].fill_between(x4, norm.pdf(x4), color='purple', alpha=0.5)
axs[1, 1].set_title(r'$\mathbb{P}(Z > -0.07)$')
axs[1, 1].grid(True)

# Ajustar distribuci√≥n de subplots
for ax in axs.flat:
    ax.set_xlim([-3, 3])
    ax.set_ylim([0, 0.45])
    ax.axhline(0, color='black', linewidth=0.5)
    ax.axvline(0, color='black', linewidth=0.5)

plt.tight_layout(rect=[0, 0.03, 1, 0.95])
plt.show()


### 2.2.5. Variable aleatoria Gamma con par√°metros $\alpha$ y $\lambda$.

La distribuci√≥n gamma se obtiene al considerar el tiempo que transcurre entre cierto n√∫mero de ocurrencias de eventos que ocurren aleatoriamente en el tiempo

La funci√≥n gamma $\Gamma:(0,\infty)\to \mathbb{R}$ est√° definida como
	$$\Gamma(\alpha)=\int_{0}^{\infty}t^{\alpha-1}e^{-t}dt.$$



*Propiedades de la funci√≥n gamma*.
- $\Gamma(\alpha)<\infty$ para cualquier $\alpha>0$.
- $\Gamma(\alpha+1)=\alpha\Gamma(\alpha)$.
- Si $n\geq 1$ $\Gamma(n)=(n-1)!$
- $\Gamma\left(\frac{1}{2} \right)=\sqrt{\pi}$.



 Si $\alpha$ y $\lambda$ son reales positivos, decimos que una variable aleatoria $X$ tiene distribuci√≥n gamma con par√°metros $\alpha$ y $\lambda$ si tiene por funci√≥n de densidad:
	$$\displaystyle f_{X}(x)=\begin{cases}
	\displaystyle \frac{\lambda^{\alpha}x^{\alpha-1}e^{-\lambda x} }{\Gamma(\alpha)} & x>0\\
	0 & \text{en otro caso}
	\end{cases}$$
En esta caso, escribimos la informaci√≥n anterior como $X\sim \Gamma(\alpha,\lambda) $
La esperanza, $\text{E}[X]$ para una variable aleatoria $X\sim Œì(\alpha, \lambda)$ es:

$$
\mathbb{E}(X) = \frac{\alpha}{\lambda}
$$
y su varianza es:
$$
\text{Var}(X) = \frac{\alpha}{\lambda^2}
$$



La distribuci√≥n gamma es esencial en varios campos por su capacidad para modelar tiempos de espera y eventos con tasas constantes. Sus aplicaciones incluyen:

  * $\textbf{Teor√≠a de colas y procesos estoc√°sticos:}$ Modela el tiempo de espera hasta el k-√©simo evento.
  * $\textbf{Confiabilidad y an√°lisis de supervivencia:}$ Utilizada para tiempos de fallo y eventos cr√≠ticos en medicina.
  * $\textbf{Hidrolog√≠a y meteorolog√≠a:}$ Aplica en la modelaci√≥n de precipitaciones acumuladas y tama√±os de gotas.
  * $\textbf{Procesamiento de im√°genes y se√±ales:}$ En el ajuste de modelos a datos de intensidades.
  * $\textbf{Finanzas:}$ Para rendimientos de activos que no siguen distribuciones normales.
  * $\textbf{Biolog√≠a y ecolog√≠a:}$ Para tasas de crecimiento y tiempos entre eventos biol√≥gicos.
  * $\textbf{F√≠sica:}$ Describe tiempos de decaimiento y distribuciones de energ√≠a.


<font color="blue">**EJEMPLO:**</font> Una computadora cu√°ntica cuenta con un tipo de aparato de medici√≥n, el cual tiene un tiempo de vida que se distribuye exponencialmente, de tal manera que su tiempo promedio de vida es de  $1000$ horas. Si se utilizan $10$ de estos aparatos en forma consecutiva, uno de ellos despu√©s de que el anterior ya no funciona. ¬øCu√°l es la probabilidad de que alguno de los aparatos estar√° funcionando despu√©s de $10,000$ horas?


**Soluci√≥n.**
Sea $X$ el tiempo total de vida de los $5$ aparatos, usados, como se indica, uno despu√©s del otro. Entonces $X\sim \Gamma(10, 0.001)$. As√≠,
$$\mathbb{P}(X>10000)=\int_{10000}^{\infty}\frac{(0.001)^{10}}{9!}x^{9}e^{-0.001x}dx=0.4579.$$

In [None]:
from scipy.stats import gamma

# Par√°metros de la distribuci√≥n
k = 10            # par√°metro de forma
theta = 1000      # par√°metro de escala (theta = 1/lambda)
x = 10000

# Calcular la probabilidad P(X > 10000)
prob = gamma.sf(x, a=k, scale=theta)

print(f"P(X > {x}) = {prob:.4f}")


<font color="blue">**EJEMPLO:**</font>  Consideremos un call center donde los tiempos entre llamadas son independientes y se distribuyen exponencialmente con una media de 3 minutos. Supongamos que queremos encontrar la probabilidad de que transcurran m√°s de 30 minutos antes de recibir 10 llamadas.


**Soluci√≥n.**
Sea $X$ el tiempo total para recibir $10$ llamadas. Dado que el tiempo medio entre llamadas es de $3$ minutos. Entonces $X \sim \Gamma(10, \frac{1}{3})$. As√≠
$$P(X > 30) = \int_{30}^{\infty} \frac{\left(\frac{1}{3}\right)^{10} x^{9} e^{-\frac{x}{3}}}{9!} \, dx = 0.45793.$$

**Nota.** Si $X\sim N(0,1)$, entonces $X^{2}\sim \Gamma\left(\frac{1}{2}, \frac{1}{2} \right)$.
En efecto, Para $z>0$, se tiene:
	$$F_{X^{2}}(z)=\mathbb{P}(X^2\leq z)=\mathbb{P}(-\sqrt{z}\leq X\leq \sqrt{z})=F_{X}(\sqrt{z})-F_{X}(-\sqrt{z}).$$
Por lo tanto,
$$f_{X^2}(z)=\frac{d F_{X^{2}}(z)}{dz}=\frac{1}{2\sqrt{z}}f_{X}(\sqrt{z})+\frac{1}{2\sqrt{z}}f_{X}(-\sqrt{z})=\frac{1}{\sqrt{z}}f_{X}(z).$$
Ahora,
$$f_{X}(\sqrt{z})=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}z}.$$

In [None]:
from scipy.stats import gamma

# Par√°metros de la distribuci√≥n Gamma
k = 10          # par√°metro de forma
theta = 3       # par√°metro de escala (theta = 1 / lambda)
x = 30

# Calcular P(X > 30)
prob = gamma.sf(x, a=k, scale=theta)

print(f"P(X > {x}) = {prob:.5f}")


#### Gr√°fica de la v.a. Gamma

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import gamma

# Par√°metros de la distribuci√≥n Gamma
shape_param = 2  # Par√°metro de forma (k o Œ±)
scale_param = 1  # Par√°metro de escala (Œ∏)

# Generar valores de x
x = np.linspace(0, 10, 1000)

# Calcular la PDF de la distribuci√≥n Gamma
gamma_pdf = gamma.pdf(x, a=shape_param, scale=scale_param)

# Graficar la PDF de la distribuci√≥n Gamma
plt.figure(figsize=(8, 5))
plt.plot(x, gamma_pdf, label=f'Gamma(Œ±={shape_param}, Œ∏={scale_param})', color='purple')
plt.xlabel('x')
plt.ylabel('Densidad de probabilidad')
plt.title('Funci√≥n de Densidad de la Distribuci√≥n Gamma')
plt.grid(True)
plt.legend()
plt.show()

- Si $\alpha = 1$, $\lambda > 0 \Rightarrow$ v.a. exponencial.

- Si $\lambda = \frac{1}{2}$, $\alpha = \frac{k}{2}$, $k \in \mathbb{Z}^{+} \Rightarrow$ ji-cuadrada.

- Si $\lambda > 1$ y $\alpha > 1 \Rightarrow$ Erlang $\Rightarrow$ aplicaciones.

### 2.2.6. Variable aleatoria Beta con par√°metros $\alpha$ y $\beta$.

La distribuci√≥n beta es una familia de distribuciones de probabilidad continua definida en el intervalo [0, 1]. Es particularmente √∫til para modelar variables que representan proporciones y porcentajes.

La funci√≥n beta, $B(\alpha, \beta)$, se define como:

$$
B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} dt = \frac{\Gamma(\alpha) \Gamma(\beta)}{\Gamma(\alpha + \beta)}
$$

La funci√≥n de densidad de probabilidad de la distribuci√≥n beta se expresa como:

$$
f_X(x) = \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha, \beta)},
$$
con $x\in (0,1)$.

**Notaci√≥n.** $X\sim \text{Beta}(\alpha, \beta)$.



**Esperanza y Varianza.**
Si $X\sim \text{Beta}(\alpha, \beta)$, entonces
  $$\mathbb{E}[X] = \frac{\alpha}{\alpha + \beta}$$
y
  $$\text{Var}(X) = \frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)}.$$

#### Gr√°fica de la v.a. Beta

In [None]:
from scipy.stats import beta

def funcion_beta(alpha, beta_param, size=1000):
    # Generar una muestra de la distribuci√≥n Beta
    muestra = beta.rvs(alpha, beta_param, size=size)
    
    # Graficar el histograma de la muestra
    plt.hist(muestra, bins=30, density=True, alpha=0.6, color='g')
    
    # Graficar la funci√≥n de densidad de la distribuci√≥n Beta
    x = np.linspace(0, 1, 1000)
    y = beta.pdf(x, alpha, beta_param)
    plt.plot(x, y, 'r-', lw=2)
    
    plt.title(f"Distribuci√≥n Beta con alpha={alpha}, beta={beta_param}")
    plt.xlabel('x')
    plt.ylabel('Densidad')
    plt.show()

# Ejemplo de uso
funcion_beta(2, 5)


**Aplicaciones en la Vida Real**

La distribuci√≥n beta se utiliza en una variedad de campos, incluyendo:
- Finanzas: para modelar la variabilidad en tasas de retorno de inversiones.
- Mercadotecnia: para analizar proporciones de respuesta de consumidores.
- Ciencias de la salud: en la evaluaci√≥n de la efectividad de tratamientos m√©dicos.
- Ecolog√≠a: para estimar proporciones en estudios de biodiversidad.

<font color="blue">**EJEMPLO:**</font> Supongamos que un an√°lisis sugiere que una nueva inversi√≥n tiene una alta probabilidad de √©xito. Usando una distribuci√≥n beta con $\alpha = 5$ y $\beta = 1$, entonces:

$$
f_{X}(x) = 5x^4, \quad \mathbb{E}[X] = \frac{5}{6}, \quad \text{Var}(X) = \frac{5}{252}
$$

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import beta

# Par√°metros
alpha = 5
beta_param = 1

# Definir el rango de x
x = np.linspace(0, 1, 1000)
pdf = beta.pdf(x, a=alpha, b=beta_param)

# Calcular esperanza y varianza
mean = beta.mean(a=alpha, b=beta_param)
variance = beta.var(a=alpha, b=beta_param)

# Mostrar resultados
print(f"E[X] = {mean:.5f}")
print(f"Var(X) = {variance:.5f}")

# Graficar la funci√≥n de densidad
plt.figure(figsize=(8, 5))
plt.plot(x, pdf, color='darkorange', label=r'$f_X(x) = 5x^4$')
plt.title(r'Distribuci√≥n Beta(5, 1)')
plt.xlabel('x')
plt.ylabel('Densidad')
plt.grid(True)
plt.legend()
plt.show()


## 2.3. Simulaci√≥n de Variables Aleatorias.

Daremos recopilaci√≥n de m√©todos para generar variables aleatorias utilizados en simulaci√≥n computacional. Se abordan distribuciones uniformes, exponenciales, normales, binomiales y Poisson, entre otras, as√≠ como t√©cnicas como la transformada inversa y el m√©todo del rechazo.

Ejemplos comunes en simulaci√≥n:
- Tiempo entre llegada de cada persona  
- N√∫mero de personas por minuto  
- N√∫mero de art√≠culos por persona  
- Cantidad de dinero ganado cada hora  
- Tiempo de atenci√≥n por cliente  
- N√∫mero de veces que la cajera solicita ayuda durante la jornada  
- Cantidad de gente que est√° formada  
- N√∫mero de personas que pagan con tarjeta

### 2.3.1. M√©todos de generaci√≥n de n√∫meros aleatorios rectangulares.

La generaci√≥n de variables aleatorias con esta distribuci√≥n es importante porque las variables que tengan una distribuci√≥n diferente, tendr√°n que usar a √©sta como base.

- Cada posible resultado entre $a$ y $b$ tiene la misma probabilidad $1/n$.

Las variables generadas deben cumplir con:
- Los valores generados deben ser independientes y estar id√©nticamente distribuidos
- La secuencia generada debe ser lo m√°s larga posible y ser reproducibles
- Debe permitir generar m√∫ltiples secuencias
- Que usen poca memoria

Hist√≥ricamente se han usado cuatro tipos de m√©todos para generar sucesiones de n√∫meros rectangulares:
- M√©todos manuales
- Tablas de biblioteca
- Computaci√≥n anal√≥gica
- Computaci√≥n digital

La generaci√≥n de los n√∫meros aleatorios rectangulares debe realizarse a trav√©s de relaciones matem√°ticas de recurrencia. Por esta raz√≥n se consideran **pseudoaleatorios**, ya que el proceso para generarlos es determin√≠stico.

Hay dos m√©todos que son los m√°s utilizados para la generaci√≥n. Ambos se basan en la siguiente definici√≥n:

**Definici√≥n.** Dos enteros $a$ y $b$ son congruentes m√≥dulo $m$ si su diferencia es un m√∫ltiplo entero de $m$ y se expresa como
$$ùëé \equiv ùëè ( \text{ùëöoùëë } ùëö)$$
Como consecuencia:
- $(a-b)$ es divisible entre $m$
- $a$ y $b$ dan el mismo residuo al ser divididos entre $m$

#### 2.3.1.1. M√©todo congruencial multiplicativo.

Generar una secuencia de n√∫meros pseudoaleatorios uniformes en el intervalo (0, 1) usando la siguiente f√≥rmula recursiva:

$$n_{i+1} = a n_i \mod m$$
- $m$ debe ser tan grande como sea posible, dependiendo de los bits por palabra que maneje la computadora, descontando el bit del signo ($b$). Por lo tanto: $m = 2^b$
- $a$ debe satisfacer que $a \approx 2^{(b+1)/2}$ y que $a \equiv \pm 3 \mod 8$. La segunda expresi√≥n equivale a $( a-(\pm3 ) )$ es m√∫ltiplo de $8$.
- $n_0$: entero positivo impar menor a $m$
- El periodo ser√° de longitud: $m/4$

<font color="blue">**EJEMPLO:**</font>

In [None]:
# n0 : valor inicial o semilla
# a : multiplicador
# m : modulo (2^b)
# n : el n√∫mero de numeros que quiero generar

def multiplicativo(n0,a,m,n):
    secuencia = []
    ni = n0 # iniciar con una semilla
    for _ in range(n):
        ni = (a * ni) % m # calculo el sig numero utilizando la formula recurrente
        secuencia.append(ni/m) # normaliza entre 0 y 1
    return secuencia

In [None]:
m = 2**31
a = 65539 # a ‚â°  +-3 mod 8
n0 = 12345
n=10

secuencia_mult = multiplicativo(n0,a,m,n)
print(secuencia_mult)

In [None]:
import numpy as np
import plotly.graph_objects as go # Para gr√°ficos interactivos

# Generamos ambas secuencias
secuencia_mult = multiplicativo(n0,a,m,n)
secuencia_numpy = np.random.uniform(0,1,n)

# figura con Plotly
fig = go.Figure()

# A√±adir los histogramas
fig.add_trace(go.Histogram(
    x=secuencia_mult,
    nbinsx = 40,
    opacity = 0.6,
    name = 'M√©todo multiplicativo',
    marker_color='red'
))

fig.add_trace(go.Histogram(
    x=secuencia_numpy,
    nbinsx = 40,
    opacity = 0.6,
    name = 'Numpy random uniform',
    marker_color='blue'
))

fig.update_layout(
    barmode='overlay', #superpone los histogramas
    title = 'Compararaci√≥n: M√©todo multiplicativo -vs- Numpy',
    xaxis_title='valor generado',
    yaxis_title='Frecuencia',
    legend_title='M√©todo',
    bargap=0.05
)

fig.show()

#### 2.3.1.2. M√©todo congruencial mixto.

Este m√©todo genera n√∫meros pseudoaleatorios con la f√≥rmula: 
$$n_{i+1} = (a n_i + c) \mod m$$

**Obs.** Se le llama ‚Äúmixto‚Äù porque incluye una constante adicional $c$ (a diferencia del m√©todo multiplicativo).

- $m = 2^b$
- $a \approx 2^{(b-1)/2}$, $a \equiv 1 \mod 4$
- $c$, $n_0$: enteros positivos impares $< m$

<font color="blue">**EJEMPLO:**</font>

In [None]:
# n0 : valor inicial o semilla
# a : multiplicador
# c : deber ser impar
# m : modulo (2^b)
# n : el n√∫mero de numeros que quiero generar

def mixto(n0,a,c,m,n):
    secuencia = []
    ni = n0 # iniciar con una semilla
    for _ in range(n):
        ni = (a * ni + c) % m # calculo el sig numero utilizando la formula recurrente
        secuencia.append(ni/m) # normaliza entre 0 y 1
    return secuencia

In [None]:
m = 2**31
a = 1103515245 # a cong 1 mod----
c = 12345
n0 = 42
n= 10

secuencia_mixto = mixto(n0,a,c,m,n)
print(secuencia_mixto)

In [None]:
# Generamos ambas secuencias
secuencia_mixto = mixto(n0,a,c,m,n)
secuencia_numpy = np.random.uniform(0,1,n)

# figura con Plotly
fig = go.Figure()

# A√±adir los histogramas
fig.add_trace(go.Histogram(
    x=secuencia_mixto,
    nbinsx = 40,
    opacity = 0.6,
    name = 'M√©todo mixto',
    marker_color='red'
))

fig.add_trace(go.Histogram(
    x=secuencia_numpy,
    nbinsx = 40,
    opacity = 0.6,
    name = 'Numpy random uniform',
    marker_color='blue'
))

fig.update_layout(
    barmode='overlay', #superpone los histogramas
    title = 'Compararaci√≥n: M√©todo mixto -vs- Numpy',
    xaxis_title='valor generado',
    yaxis_title='Frecuencia',
    legend_title='M√©todo',
    bargap=0.05
)

fig.show()

| **M√©todo**     | **F√≥rmula**                            | **Ventajas**                                          | **Riesgos / Limitaciones**                                |
|----------------|----------------------------------------|-------------------------------------------------------|------------------------------------------------------------|
| Multiplicativo | \( n_{i+1} = a n_i \mod m \)           | R√°pido, menos memoria                                 | Menor aleatoriedad, requiere \( a, m, n_0 \) bien elegidos |
| Mixto          | \( n_{i+1} = (a n_i + c) \mod m \)     | Mejor distribuci√≥n, periodo completo posible          | M√°s complejo, pero m√°s robusto                             |
| NumPy (`uniform`) | Motor moderno y validado           | Alta calidad, probado, r√°pido                         | Caja negra, sin control del generador interno              |


In [None]:
import random
n = 1000

# Generar secuencia usando random.random()
secuencia_random = [random.random() for _ in range(n)]

# Generar secuencia usando numpy
secuencia_numpy = np.random.uniform(0, 1, n)

# Graficar histogramas
fig = go.Figure()

fig.add_trace(go.Histogram(
    x=secuencia_random,
    nbinsx=40,
    opacity=0.6,
    name='random.random()',
    marker_color='crimson'
))

fig.add_trace(go.Histogram(
    x=secuencia_numpy,
    nbinsx=40,
    opacity=0.6,
    name='numpy.random.uniform',
    marker_color='royalblue'
))

fig.update_layout(
    barmode='overlay',
    title='Comparaci√≥n: random.random() vs numpy.random.uniform',
    xaxis_title='Valor generado',
    yaxis_title='Frecuencia',
    legend_title='M√©todo',
    bargap=0.05
)

fig.show()

### 2.3.2. M√©todos de generaci√≥n de n√∫meros aleatorios no rectangulares.

Los **m√©todos de generaci√≥n de n√∫meros aleatorios no rectangulares** son t√©cnicas utilizadas para generar muestras aleatorias a partir de distribuciones de probabilidad que no tienen una forma rectangular o uniforme. Es decir, se emplean cuando la distribuci√≥n de probabilidad no tiene una densidad constante, sino que es m√°s compleja o depende de otros par√°metros.

Estos m√©todos son necesarios cuando la distribuci√≥n que queremos simular tiene una forma espec√≠fica que no puede ser directamente modelada usando la distribuci√≥n uniforme $U(0,1)$.

#### 2.3.2.1. M√©todo de la transformada inversa.

El m√©todo utiliza la funci√≥n de distribuci√≥n $F(x)$ de la distribuci√≥n que se va a simular 
$$F(x) = \int_{-\infty}^{x} f(t)\,dt$$

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import beta

# Par√°metros de la distribuci√≥n Beta
alpha = 2
beta_param = 5

# Rango de x
x = np.linspace(0, 1, 1000)

# Funci√≥n de densidad y distribuci√≥n acumulada
pdf = beta.pdf(x, alpha, beta_param)
cdf = beta.cdf(x, alpha, beta_param)

# Crear la figura con dos subplots
fig, axs = plt.subplots(1, 2, figsize=(12, 5))

# Gr√°fica de f(x)
axs[0].plot(x, pdf, color='blue')
axs[0].set_title(r'$f(x)$ - Densidad Beta(2, 5)')
axs[0].set_xlabel('x')
axs[0].set_ylabel('Densidad')
axs[0].grid(True)

# Gr√°fica de F(x)
axs[1].plot(x, cdf, color='green')
axs[1].set_title(r'$F(x)$ - Funci√≥n de distribuci√≥n acumulada')
axs[1].set_xlabel('x')
axs[1].set_ylabel('Probabilidad acumulada')
axs[1].grid(True)

plt.tight_layout()
plt.show()


Como se sabe, los valores de $F(x)$ est√°n en el intervalo $(0,1)$ al igual que los n√∫meros rectangulares $U$. 

El m√©todo genera un $U$ y trata de determinar el valor de la variable aleatoria para la cual $F(x)$ sea igual a $U$.

Si $U \in (0,1)$:
$$ F(x) = U \quad \Rightarrow \quad x = F^{-1}(U)$$

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import beta

# Par√°metros Beta(2,5)
alpha = 2
beta_param = 5

# Dominio x y valores de F(x)
x = np.linspace(0, 1, 1000)
cdf = beta.cdf(x, alpha, beta_param)

# Valor uniforme simulado
u = 0.7  # Puedes cambiarlo
x_inv = beta.ppf(u, alpha, beta_param)

# Gr√°fica
plt.figure(figsize=(8, 5))
plt.plot(x, cdf, label=r'$F(x)$ - CDF Beta(2,5)', color='green')
plt.axhline(u, color='blue', linestyle='--', label=fr'$U = {u}$')
plt.axvline(x_inv, color='red', linestyle='--', label=fr'$x = F^{{-1}}({u:.2f}) \approx {x_inv:.3f}$')

# Anotaciones
plt.title('M√©todo de la Transformada Inversa sobre la CDF de Beta(2,5)')
plt.xlabel('x')
plt.ylabel('F(x)')
plt.legend()
plt.grid(True)
plt.show()


$\mathbf{Teorema}.$ Sea $X$ una variable aleatoria real. Supongamos que su funci√≥n de distribuci√≥n $F$ es estrictamente creciente (por lo que $F$ es una biyecci√≥n de $\mathbb{R}$ sobre $(0,1)$ y podemos denotar por $F^{-1}$ a su inversa). Sea $U\sim \text{unif}[0,1]$. Entonces $F^{-1}(U)$ tiene la misma ley que $X$.

Si $F$ no es estrictamente creciente, hemos visto que el teorema precedente sigue siendo v√°lido bajo la condici√≥n de definir 
$$F^{-1}(u)=\inf\{ x\in \mathbb{R} : F(x)\geq u\},$$
la inversa generalizada de $F$.

<font color="blue">**EJEMPLO:**</font> v.a Bernoulli.

In [None]:
# Vamos a simular una v.a. Bernoulli usando una Uniforme
import random
def bernoulli(p):
    u = random.random() # U -> Unif(0,1)
    return 1 if u <= p else 0

In [None]:
# Simulamos n valores con p de √©xito
p = 0.5
simulaciones = [bernoulli(p) for _ in range(100)]
print(simulaciones)

In [None]:
sum(simulaciones)

<font color="blue">**EJEMPLO:**</font> Distribuci√≥n exponencial.

Sea $\theta,\lambda>0$, entonces a trav√©s del teorema se puede generar una v.a. exponencial.

Sea $U \sim Unif[0,1]$, entonces si $X\sim Exp(\lambda)$, entonces

$$f_{X}(x) = \lambda e^{-\lambda x}$$ 
y que 
$$ F_X(x) = 1-e^{-\lambda x} $$

Sabemos que $1-e^{-\lambda x} = U$, entonces $1-U = e^{-\lambda x}$, y tomando logaritmo, se tiene que 
$ \ln(1-U) = -\lambda x$ y como $U$ es uniforme entonces $U \sim 1-U$, por lo que depejando a $x$, se tiene que 
$$ X = -\frac{\ln(U)}{\lambda} \sim Exp(\lambda) $$

In [None]:
import numpy as np
import plotly.graph_objects as go

# Semilla
np.random.seed(123)

# Par√°metro de la exponencial
lambd = 4
n = 10000

# Simulaci√≥n usando transformada inversa
uniformes = np.random.random(n)
exponenciales = -np.log(uniformes) / lambd

# Curva te√≥rica
x_vals = np.linspace(0, exponenciales.max(), 300)
y_vals = lambd * np.exp(-lambd * x_vals)

# Gr√°fico
fig = go.Figure()

fig.add_trace(go.Histogram(
    x=exponenciales,
    nbinsx=40,
    histnorm='probability density',
    marker_color='skyblue',
    name='Simulaci√≥n'
))

fig.add_trace(go.Scatter(
    x=x_vals,
    y=y_vals,
    mode='lines',
    name='Densidad te√≥rica',
    line=dict(color='darkblue')
))

fig.update_layout(
    title='Distribuci√≥n Exponencial simulada vs te√≥rica (Œª = 1)',
    xaxis_title='x',
    yaxis_title='Densidad',
    bargap=0.05
)

fig.show()

<font color="blue">**EJEMPLO:**</font> Distribuci√≥n Uniforme Continua.
$$f(x) = \frac{1}{b-a}, \quad a \leq x \leq b$$
$$F(x) = \frac{x-a}{b-a} = U \Rightarrow x = a + (b-a)U$$

In [None]:
# Par√°metros de la uniforme
a, b = 2, 5
n = 10000

# Simulaci√≥n por transformaci√≥n lineal
uniformes = np.random.random(n)
uniforme_continua = a + (b - a) * uniformes

# Densidad te√≥rica (constante)
x_vals = np.linspace(a, b, 300)
y_vals = np.ones_like(x_vals) * (1 / (b - a))

# Gr√°fico
fig = go.Figure()

fig.add_trace(go.Histogram(
    x=uniforme_continua,
    nbinsx=40,
    histnorm='probability density',
    marker_color='orange',
    name='Simulaci√≥n'
))

fig.add_trace(go.Scatter(
    x=x_vals,
    y=y_vals,
    mode='lines',
    name='Densidad te√≥rica',
    line=dict(color='red')
))

fig.update_layout(
    title='Distribuci√≥n Uniforme Continua simulada vs te√≥rica [2, 5]',
    xaxis_title='x',
    yaxis_title='Densidad',
    bargap=0.05
)

fig.show()


$\color{red}{\text{Ejercicio.}}$ Simulemos **la variable aleatoria de Cauchy** de par√°metro $1$ que tiene por funci√≥n de densidad
$$\frac{1}{\pi}\frac{1}{1+x^{2}}.$$
Por el teorema anterior, para $u\in (0,1)$
$$u=\frac{1}{\pi}\arctan(x)+\frac{1}{2} \qquad \text{si y s√≥lo si} \qquad x=\tan\left({\pi}\left(u-\frac{1}{2} \right) \right).$$

In [None]:
import plotly.graph_objects as go

In [None]:
# Semilla
np.random.seed(123)
# 1. Par√°metros
n = 10000

In [None]:
# Simulaci√≥n de la variable Cauchy a partir de una uniforme
uniformes = np.random.random(n)
cauchy_simulada = np.tan(np.pi * (uniformes - 0.5))

In [None]:
# Definir la funci√≥n de densidad de Cauchy
def f_cauchy(x):
    return (1 / np.pi) * (1 / (1 + x**2))

In [None]:
# Generar valores te√≥ricos para la curva
x_vals = np.linspace(-10, 10, 500)
y_vals = f_cauchy(x_vals)

In [None]:
# Crear gr√°fico interactivo con Plotly
fig = go.Figure()
fig.add_trace(go.Histogram(
    x=cauchy_simulada,
    nbinsx=100,
    histnorm='probability density',
    marker_color='blue',
    name='Simulaci√≥n'
))

In [None]:
# Curva Teorica
fig.add_trace(go.Scatter(
    x=x_vals,
    y=y_vals,
    mode='lines',
    name='Densidad te√≥rica',
    line=dict(color='red')
))

fig.update_layout(
    title='Distribuci√≥n Cauchy simulada vs te√≥rica',
    xaxis_title='x',
    yaxis_title='Densidad',
    bargap=0.05
)

fig.show()

## 2.4. Conceptos Adicionales.

### 2.4.1. Funci√≥n Generadora de Momentos (FGM)

La **Funci√≥n Generadora de Momentos (FGM)** de una variable aleatoria  $X$ es una herramienta que se usa para caracterizar la distribuci√≥n de \( X \) a trav√©s de sus momentos (esperanza, varianza, etc.). Se define como:

$$
M_X(t) = \mathbb{E}[e^{tX}]
$$

donde $t$ es un par√°metro real y $\mathbb{E}$ denota el valor esperado.

**Usos de la FGM:**

1. **C√°lculo de Momentos:** La FGM es √∫til para calcular los **momentos** de una distribuci√≥n. Los momentos de $X$ se obtienen mediante derivadas de $M_X(t)$ evaluadas en $t=0$:

   - **Primer momento (esperanza):** 
   $$
   \mathbb{E}[X] = M_X'(0)
   $$

   - **Segundo momento (varianza):** 
   $$
   \text{Var}(X) = M_X''(0) - (M_X'(0))^2
   $$

2. **Convoluci√≥n de Distribuciones:** Si \( X \) y \( Y \) son variables aleatorias independientes, la FGM de la suma \( X + Y \) es el producto de las FGM de \( X \) y \( Y \):
   $$
   M_{X+Y}(t) = M_X(t) \cdot M_Y(t)
   $$

3. **Simplificaci√≥n en C√°lculos:** Es √∫til cuando se requiere calcular distribuciones o momentos de variables aleatorias sin tener que trabajar directamente con sus densidades de probabilidad.


<font color="blue">**EJEMPLO:**</font> 

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Par√°metros de la distribuci√≥n normal
mu = 0  # media
sigma = 1  # desviaci√≥n est√°ndar

# Funci√≥n Generadora de Momentos (FGM) para una normal
def moment_generating_function(t, mu, sigma):
    return np.exp(mu * t + 0.5 * sigma**2 * t**2)

# Valores para t
t = np.linspace(-5, 5, 1000)

# C√°lculo de la FGM
mgf = moment_generating_function(t, mu, sigma)

# Gr√°fico de la Funci√≥n Generadora de Momentos (FGM)
plt.figure(figsize=(6, 6))
plt.plot(t, np.real(mgf), label='Real part of MGF', color='b')
plt.title('Funci√≥n Generadora de Momentos (MGF)')
plt.xlabel('t')
plt.ylabel('Real(MGF)')
plt.grid(True)
plt.legend()
plt.show()


### 2.4.2. Funci√≥n Caracter√≠stica (FC)

La **Funci√≥n Caracter√≠stica (FC)** de una variable aleatoria $ X $ se define como la esperanza del complejo exponencial de $ X $, es decir:

$$
\varphi_X(t) = \mathbb{E}[e^{itX}]
$$

donde $ i $ es la unidad imaginaria y $ t $ es un par√°metro real.

**Usos de la FC:**

1. **Caracterizaci√≥n de Distribuciones:** Al igual que la FGM, la funci√≥n caracter√≠stica caracteriza completamente la distribuci√≥n de una variable aleatoria. A trav√©s de su uso, podemos obtener momentos y propiedades como la varianza, la simetr√≠a, etc.
   
2. **Transformaciones y Sumas de Variables Aleatorias:** Para dos variables aleatorias independientes $ X $ y $ Y $, la funci√≥n caracter√≠stica de la suma $ X+Y $ es el producto de las funciones caracter√≠sticas de $ X $ y $ Y $:


<font color="blue">**EJEMPLO:**</font> 

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Par√°metros de la distribuci√≥n normal
mu = 0  # media
sigma = 1  # desviaci√≥n est√°ndar

# Funci√≥n Caracter√≠stica (FC) para una normal
def characteristic_function(t, mu, sigma):
    return np.exp(1j * mu * t - 0.5 * sigma**2 * t**2)

# Valores para t
t = np.linspace(-5, 5, 1000)

# C√°lculo de la FC
fc = characteristic_function(t, mu, sigma)

# Gr√°fico de la Funci√≥n Caracter√≠stica (FC)
plt.figure(figsize=(6, 6))
plt.plot(t, np.real(fc), label='Real part of CF', color='r')
plt.plot(t, np.imag(fc), label='Imaginary part of CF', color='g', linestyle='--')
plt.title('Funci√≥n Caracter√≠stica (CF)')
plt.xlabel('t')
plt.ylabel('CF')
plt.grid(True)
plt.legend()
plt.show()


## 2.4. Ley de los grandes n√∫meros (LGN).

La Ley de los Grandes N√∫meros establece que, a medida que el n√∫mero de ensayos de un experimento aleatorio aumenta, la media de los resultados observados se acerca a la esperanza matem√°tica (media) de la distribuci√≥n.

Formalmente:

$$
\lim_{n \to \infty} \frac{1}{n} \sum_{i=1}^{n} X_i = \mathbb{E}[X]
$$

donde $ X_1, X_2, \dots, X_n $ son variables aleatorias independientes e id√©nticamente distribuidas con esperanza $ \mathbb{E}[X] $.


#### Simulaci√≥n de LGN.

Simualaremos los lanzamientos de un dado y calcularemos la media 

$$ \Omega = \{ 1,2,3,4,5,6, \}$$

La media te√≥rica : $$\mathbb{E}[X] = 3.5$$

In [None]:
import numpy as np
import pandas as pd #Manejo y manipulacion de datos
import matplotlib.pyplot as plt
import seaborn as sns #Visualizacion de datos

In [None]:
np.random.seed(42) # numeros pseudoaletorios sean reproducibles
lanzamientos = np.random.randint(1,7,10000)

In [None]:
media_acum = np.cumsum(lanzamientos) / np.arange(1,10001)
df = pd.DataFrame( {
    'Lanzamiento': np.arange(1,10001),
    'Media Acumulada': media_acum } )

In [None]:
plt.figure(figsize=(10,6))
plt.plot(df['Lanzamiento'], df['Media Acumulada'], label='media muestral')
plt.axhline(3.5, color= 'red', linestyle='--', label='media te√≥rica (3.5)')
plt.xlabel('N√∫mero de lanzamientos')
plt.ylabel('Media')
plt.title('LGN en lanzamientos de un dado')
plt.legend()
plt.show()

<font color="blue">**EJEMPLO:**</font> Problema de la Ajuga de Bufon.

**Enunciado del Problema:**
Imagina que tienes una hoja de papel con l√≠neas paralelas, cada una separada por una distancia $ d $. Una aguja de longitud $ l $ se lanza al azar sobre la hoja. El problema consiste en calcular la probabilidad de que la aguja cruce una de las l√≠neas en la hoja.

**Supuestos:**
- La longitud de la aguja $ l $ es menor o igual a la distancia entre las l√≠neas $ d $, es decir, $ l \leq d $.
- La aguja se lanza de manera completamente aleatoria sobre la hoja, es decir, puede caer en cualquier √°ngulo y posici√≥n.

**Soluci√≥n Te√≥rica:**
La probabilidad de que la aguja cruce una de las l√≠neas es dada por la f√≥rmula:

$$
P = \frac{2l}{\pi d}
$$

Esta f√≥rmula permite estimar el valor de $ \pi $ si se conoce la probabilidad de que la aguja cruce una l√≠nea, la longitud de la aguja y la distancia entre las l√≠neas.


In [None]:
##Soluci√≥n Computacional

import numpy as np
import matplotlib.pyplot as plt

# Par√°metros del problema
L = 1.0  # Longitud de la aguja
d = 1.0  # Distancia entre las l√≠neas paralelas
num_trials = 100000  # N√∫mero total de lanzamientos
step = 1000  # N√∫mero de lanzamientos por paso para la estimaci√≥n de pi

# Listas para almacenar los valores de pi estimados y los lanzamientos
pi_estimates = []
trial_steps = []

# Contador para cu√°ntas agujas cruzan una l√≠nea
crossed_lines = 0

# Simulaci√≥n de lanzamientos de la aguja y estimaci√≥n de pi en pasos
for trial in range(1, num_trials + 1):
    # Posici√≥n del centro de la aguja
    center_position = np.random.uniform(0, d / 2)

    # √Ångulo aleatorio entre 0 y pi (√°ngulo en radianes)
    angle = np.random.uniform(0, np.pi)

    # Distancia desde el centro de la aguja hasta la l√≠nea m√°s cercana
    distance_to_nearest_line = L / 2 * np.sin(angle)

    # Verificamos si la aguja cruza una l√≠nea
    if center_position <= distance_to_nearest_line:
        crossed_lines += 1

    # Estimaci√≥n de pi en pasos
    if trial % step == 0 and crossed_lines > 0:
        pi_estimate = (2 * L * trial) / (crossed_lines * d)
        pi_estimates.append(pi_estimate)
        trial_steps.append(trial)

print(f"Estimaci√≥n de pi: {pi_estimate}")

# Plot de la estimaci√≥n de pi a lo largo de los lanzamientos
plt.figure(figsize=(10, 6))
plt.plot(trial_steps, pi_estimates, label="Estimaci√≥n de œÄ", color="blue")
plt.axhline(y=np.pi, color="red", linestyle="--", label="Valor real de œÄ")
plt.xlabel('N√∫mero de lanzamientos')
plt.ylabel('Estimaci√≥n de œÄ')
plt.title('Convergencia de la estimaci√≥n de œÄ con el problema de la aguja de Buffon')
plt.legend()
plt.grid(True)
plt.show()

## 2.5. Teorema central del l√≠mite (TCL).

El Teorema Central del L√≠mite establece que, bajo ciertas condiciones, la distribuci√≥n de la suma (o media) de un gran n√∫mero de variables aleatorias independientes e id√©nticamente distribuidas tiende a una distribuci√≥n normal, sin importar la distribuci√≥n original de las variables.

Formalmente, si $ X_1, X_2, \dots, X_n $ son variables aleatorias independientes e id√©nticamente distribuidas con esperanza $ \mu $ y varianza $ \sigma^2 $, entonces:

$$
\frac{\sum_{i=1}^{n} X_i - n\mu}{\sigma \sqrt{n}} \xrightarrow{d} N(0, 1) \quad \text{cuando} \quad n \to \infty
$$

donde $ N(0, 1) $ es la distribuci√≥n normal est√°ndar.


#### Simulaci√≥n de TCL.

In [None]:
# Crear el DataFrame con 50 muestras, cada una con 10 observaciones de una binomial(n=1000, p=0.6)
df = pd.DataFrame()

for i in range(1,51):
  muestra = np.random.binomial(1000,0.6,10)  # Muestra aleatoria de binomiales de 10 √©xitos, se realiza 1000 veces el experimento 
  col = f"muestra {i}"
  df[col] = muestra

df.head(5)  # Mostrar las primeras 5 filas

# Calcular el promedio de cada muestra
df_muestra_medias = pd.DataFrame(df.mean(), columns=["Media de la muestra"])

# Visualizar la distribuci√≥n de las medias
sns.distplot(df_muestra_medias)
#sns.histplot(df_muestra_medias["Media de la muestra"], kde=True)
plt.title("Distribuci√≥n de medias muestrales")
plt.xlabel("Media")
plt.ylabel("Frecuencia")
plt.show()

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Par√°metros
num_trials = 10000  # N√∫mero de experimentos
n_values = [10, 100, 1000]  # Diferentes valores de n

# Realizar simulaciones para cada n
plt.figure(figsize=(12, 8))

for n in n_values:
    # Simular n lanzamientos de dados, repetidos 'num_trials' veces
    sums = np.sum(np.random.randint(1, 7, size=(num_trials, n)), axis=1)

    # Graficar la distribuci√≥n de las sumas
    plt.hist(sums, bins=30, density=True, alpha=0.6, label=f'n = {n}')

# T√≠tulos y etiquetas
plt.title('Distribuci√≥n de la Suma de Lanzamientos de Dados')
plt.xlabel('Suma de los lanzamientos')
plt.ylabel('Frecuencia')
plt.legend()

# Mostrar gr√°fico
plt.grid(True)
plt.show()
