https://famaf.aulavirtual.unc.edu.ar/pluginfile.php/35331/mod_resource/content/21/notas_mys.pdf

# Generación de variables aleatorias continuas
**Proposición**. Sea $U\thicksim\mathcal{U}(0, 1)$ una variable aleatoria. Para cualquier función de distribución continua $F$, monótona creciente en $F^{-1}(0, 1)$, la variable aleatoria $X$ definida por: $X = F^{-1}(U)$ tiene distribución $F$.

## Metodo de la transformada inversa
Notemos que $U$ toma valores en el intervalo $(0, 1)$, excluyendo los puntos 0 y 1. La propiedad de monotonía de $F$ asegura que $F$ tiene inversa en $(0, 1)$. Así, si $X = F^{−1} (U)$, su función de distribucion está dada por:
$$\\F_X(x) = P(X \leq x) = P(F^{−1}(U) \leq x) \\$$
Como $F$ es creciente, entonces $a\le b$ si y sólo si $F(a)\le F(b)$. En particular, los conjuntos $\{F^{−1}(U) \leq x\}$ y $\{U \leq F(x)\}$ son iguales. Por lo tanto:
$$\\F_X(x) = P(F(F^{-1}(U)) \leq F(x)) = P(U\le F(x)) = F(x).\\$$
Luego $X$ tiene distribución $F$.

In [41]:
from random import random

def MetodoTransformadaInversa(G):
    U = random()
    return G(U) # G = F^−1

#### Ejemplo.
Sea 
$$f(x) = \begin{cases} 1-\frac x2 & \text{si } 0\le x\le 2 \\ 0 & \text{c.c.} \end{cases}, \quad F(x) = \int_{-\infty}^x f(t)dt=\begin{cases}
0 & \text{si } x<0 \\
x-\frac{x^2}4 & \text{si } 0\le x\le 2 \\
1 & \text{si} x>2\end{cases}.$$

Entonces, para $0 < u < 1$, 
$$F(x) = u \Rightarrow \frac{x^2}4 - x + u = 0 \Rightarrow x = (1 \pm \sqrt{1 - u})\times 2 \Rightarrow F^{-1}(x)=(1 - \sqrt{1 - u})\times 2$$

In [42]:
from math import sqrt
def ejemplo():
    U = random()
    return (1-sqrt(1-U))*2

### Simulación de una variable aleatoria exponencial
Si $X$ es una variable aleatoria con distribución exponencial con parámetro $λ = 1$,  $X ∼ \mathcal{E}(1)$, entonces su función de distribución acumulada está dada por:
$$\\F(x) = \begin{cases} 1 − e^{−x} & x > 0 \\ 0 & x ≤ 0 \end{cases} \\$$
Luego la inversa de $F$ sobre $u\in(0,1)$ está dada por: $F^{−1}(u) = −\ln(1 − u)$

In [43]:
import numpy as np

def VariableContinuaExponencial_1():
    return -np.log(1-random())

Notemos a demás que si $X$ es exponencial con parámetro $λ$, entonces $Y = \frac1\lambda X$ es exponencial con media $\frac1\lambda: Y ∼ \mathcal{E}(\lambda)$. Luego el método por transformada inversa para simular valores de $Y$ es

In [44]:
def VariableContinuaExponencial(lamda):
    return VariableContinuaExponencial_1()/lamda

### Simulación de un Proceso de Poisson
Sea $N(t)$, $t ≥ 0$, un proceso de Poisson homogéneo con intensidad λ. Entonces, se cumple que los tiempos de llegada entre eventos son variables aleatorias exponenciales de parámetro λ y el número de eventos en un intervalo de tiempo de longitud $t$ es una variable aleatoria Poisson de parámetro λ · $t$.

En particular $N(1)$ es una variable aleatoria Poisson de media λ que indica el número de arribos hasta el tiempo $t = 1$, y los tiempos entre arribos en el intervalo [0, 1] son exponenciales de parámetro λ.

Por lo tanto, si se simulan variables aleatorias exponenciales $X_1, X_2, . . .$ con $X_i ∼ \mathcal{E}(1)$, para $i\ge1$, hasta que $X_1 + X_2 + · · · + X_n \le 1$ y $X_1 + X_2 + · · · + X_n+X_{n+1} > 1$, entonces $n$ representa el número de arribos hasta $t = 1$. Esto es:
$$N(1) = \max\{n : X_1 + X_2 + · · · + X_n \le 1\}$$
Si se simula cada exponencial $X_i$ con el método de la transformada inversa, tenemos que

$$N(1) =$$
$$\max\{n:X_1 + X_2 + · · · + X_n \le 1\} =$$ 
$$\max\{n:-\frac{1}{\lambda}(\ln(1-U_1) + \ln(1-U_2) + · · · + \ln(1-U_n)) \le 1\} =$$ 
$$\max\{n:-\frac{1}{\lambda}\ln((1-U_1)\times(1-U_2) \times · · · +\times (1-U_n)) \le 1\} =$$ 
$$\max\{n:\ln((1-U_1)\times(1-U_2) \times · · · +\times (1-U_n)) \ge -\lambda\} =$$ 
$$\max\{n:(1-U_1)\times(1-U_2) \times · · · +\times (1-U_n) \ge e^{-\lambda}\} =$$
$$\min\{n : (1-U_1)\times(1-U_2) \times · · · +\times (1-U_n) < e^{-\lambda}\}-1$$

In [45]:
from random import random
import numpy as np

def VariableContinuaPoisson(lamda):
    n = 0
    Producto = 1 - random()
    cota = np.exp(-lamda)
    while Producto >= cota:
        Producto *= (1 - random())
        n += 1
    return n

### Simulación de una variable aleatoria Gamma
Hemos visto anteriormente que la suma de $n$ variables aleatorias exponenciales e independientes, con parámetro λ, es una variable aleatoria con distribución $Gamma(n, λ^{−1})$.

Esta propiedad nos permite dar un algoritmo de simulación de una variable Gamma a través de la generación de $n$ exponenciales independientes con el mismo parámetro. Notemos que si $U_1, U_2, . . . , U_n$ son valores de una variable uniforme $U_i ∼ \mathcal{U}(0, 1)$, para $i = 1, 2, . . . , n$, entonces:

$$X = -\frac1\lambda \ln(1-U_1) -\frac1\lambda \ln(1-U_2) - · · · -\frac1\lambda \ln(1-U_n) =$$
$$-(\ln((1-U_1) \times (1-U_2) \times · · · \times (1-U_n)))/\lambda$$

De esta forma, un algoritmo para la simulación de una variable $Gamma(n, λ^{−1})$ es como sigue:

In [46]:
'''Simula una gamma con parámetros n y 1/lamda'''
def VariableContinuaGamma(n,lamda):
    U = 1
    for _ in range(n):
        U *= 1-random()
    return -np.log(U)/lamda

#### Ver generar 2 va?

## Método de aceptación y rechazo
Supongamos que se quiere generar una variable aleatoria $X$ con función de densidad $f$ y función de distribución acumulada $F$. Supongamos también que se tiene un método para generar otra variable $Y$, con densidad $g$, tal que $\exist c>1$, y
$$f(y)\le cg(y) \quad \forall y ∈ \R\quad, \Rightarrow \quad \frac{f(y)}{g(y)} ≤ c, \quad \forall y ∈ \R, \quad f(y) \ne 0.$$
El metodo de rechazo para generar $X$ a partir de $Y$ tiene el siguiente algoritmo,

In [47]:
def Aceptacion_Rechazo_X(SimularY,f,g,c):
    while 1:
        Y = SimularY()
        U = random()
        if U < f(Y) / (c * g(Y)):
            return Y

De manera analoga al caso del método para simular variables aleatorias discretas, se puede 
probar que:
1. La variable aleatoria generada por el algoritmo Aceptacion Rechazo $X$ tiene densidad $f$.
2. El número de iteraciones del algoritmo es una variable aleatoria geométrica con media  $c$.
Entonces, para cada variable $X$ que se desee generar rechazando contra una variable $Y$, es necesario determinar una cota $c$ para el cociente $\frac{f(x)}{g(x)}$, válida para todo $x ∈ \R$. Para determinar este valor es útil recordar algunos resultados del Análisis Matemático. En primer lugar, considerar la función
$$ h(x) = \frac{f(x)}{g(x)},\quad x : f(x) \ne 0,$$
y para esta funcion determinar:
1. Puntos crıticos: Esto es, $f'(x) = 0$ o $f'(x)$ no existe.
2. Analizar cuales de estos puntos corresponden a máximos locales. 
3. Evaluar $h$ en los extremos de su dominio, si es acotado, o los límites correspondientes.
4. Elegir una cota $a$ partir de los valores obtenidos en 1. y 2.

#### Ejemplo.
Sea $X$ con densidad $f(x)=20x(1-x)^3\mathbb{I}_{[0,1]}(x)$. Utilizar el método de la transformada inversa para generar valores de $X$ resultaría muy complicado, por lo que se recurre al método de aceptación y rechazo.

Elegimos $Y\thicksim\mathcal{U}(0, 1)$, con función de densidad $g(y)=1\mathbb{I}_{[0,1]}(x)$, y debemos buscar una constante $c$ tal que $h(x)=\frac{f(x)}{g(x)}\le c$, $\forall x\in[0,1]$. Lo que estamos buscando es una cota mínima para este cociente, que es lo mismo que buscar el máximo, o supremo de la función $f(x)/g(x)$ en el intervalo $[0,1]$. Desarrollamos la función $h(x)$:

$$h(x)=\frac{f(x)}{g(x)}=\frac{20x(1-x)^3}{1}=20x(1-x)^3\quad x\in[0,1].$$

Luego $h$ alcanza un máximo en intervalo cerrado por ser contínuo, y lo hace o en los extremos o en los puntos críticos. Derivamos $h(x)$ e igualamos a 0 para encontrar los puntos críticos.

$$h'(x)=20(1-4x)(1-x)^2=0\Rightarrow x=\frac14, 1.$$

De esta manera, el $c$ óptimo es $h(1/4)\approx 2,109$, y el algoritmo para generar valores de $X$ es:

In [32]:
def ejemplo():
    while 1:
        Y = random()
        U = random()
        if U < 9.48*Y*(1-Y)**3:
            return Y

## Simulación de variables aleatorias normales
Dado que $Z\thicksim \mathcal{N}(0, 1) \Rightarrow X = μ + σZ\thicksim \mathcal{N}(μ, σ^2),$
es suficiente generar variables aleatorias normales estándar y luego transformarlas.

### Por composición

La función de distribución acumulada de $z$ es:
$$F_z(x) = \frac1{\sqrt{2\pi}}\int_{-\infty}^xe^{-\frac{t^2}2}dt$$
la cual no tiene una expresion cerrada y por lo tanto no se conoce una forma explícita de su inversa, por lo que no se puede utilizar el método de la transformada inversa.

Una observación es que la función de densidad de $Z$ es par, por lo cual puede intentarse generar $|Z|$ y usar luego un método de composición. Más precisamete, consideramos $U \thicksim \mathcal{U}(0, 1)$ y $X$ la variable aleatoria dada por:
$$X = \begin{cases} |Z| & U ≤ 0.5 \\ -|Z| & U > 0.5 \end{cases} $$
Entonces se cumple que:
$$P(X ≤ a)
= P(U \le 0.5, |Z|\le a ) + P(U > 0.5, -|Z|\le a )\\
= \frac12P(|Z|\le a)+\frac12P(-|Z|\le a)$$

* Caso $a\ge0$:
$$P(X ≤ a)=
\frac12P(-a \le Z \le a)+\frac121=
\frac122P(0 \le Z \le a)+\frac12=$$
$$P(Z \le a)-P(Z \ge 0)\frac12= P(Z \le a)=
P(Z \le a)-\frac12+\frac12=$$

* Caso $a<0$:
$$P(X ≤ a)=
\frac120+\frac12P(|Z|\le -a)=
\frac122P(Z\le a)=
P(Z\le a)$$

Demostramos que $P(X\le a) = P(Z\le a)$, es decir que $X$ tiene distribución normal. Así $F_Z(x)=0.5\times F_{|Z|}(x)+0.5\times F_{-|Z|}(x)$, y es necesario entonces un método para generar $|Z|$. Su densidad está dada por:
$$f_{|Z|}(x) = \frac2{\sqrt{2\pi}}e^{-\frac{x^2}2}1_{x\ge0}$$

Una posibilidad es utilizar el método de rechazo con una exponencial, por ejemplo, $X=\mathcal{E}(1)$. Denotamos $g$ a la densidad de $X$. Así, debemos encontrar una cota para:
$$\frac{f_{|Z|}(x)}{g(x)} = \frac2{\sqrt{2\pi}}e^{-\frac{x^2}2+x}$$
Esta función alcanza un máximo en el punto en que el exponente es máximo, lo cual ocurre en $x = 1$. El valor máximo y por consiguiente la cota mínima $c$ esta dada por:
$$c = \sqrt{\frac{2e}{\pi}}\approx1.32 \quad\Rightarrow\quad \frac{f(x)}{cg(x)}=e^{-\frac{(x-1)^2}{2}}$$

In [54]:
def ZAbsoluto():
    while 1:
        X = -np.log(1-random())
        U = random()
        if U < np.exp(-(X-1)**2/2):
            return X

def VariableContinuaNormal_Composicion(sigma,mu):
    Zabs = ZAbsoluto()
    if random() > .5:
        return (-Zabs)*sigma+mu
    else:
        return (Zabs)*sigma+mu


### Método polar
Otro método eficiente para generar variables normales es el método polar. El nombre se refiere al uso de coordenadas polares para referenciar puntos del plano:
$$x = r cos θ,\quad y = r sen θ,\quad r ≥ 0,\quad  0 ≤ θ < 2π.$$
Consideramos dos variables aleatorias $X$ e $Y$, normales estándar, independientes. Dado que toman cualquier valor real, entonces el par $(X, Y)$ denota a algún punto del plano. Las coordenadas polares correspondientes a este punto, $R$ y $Θ$, verifican:
$$R^2 = X^2 + Y^2,\quad Θ = arctan \frac{Y}{X}.$$
El objetivo es analizar la distribución de las variables $R^2$ y $Θ$ y simular estas variables para obtener dos normales estándar.

La función de densidad conjunta de $X$ e $Y$ está dada por:
$$f_{X,Y} (x, y) = f_X(x) · f_Y (y) = \frac1{2π}e^{−(x^2+y^2)/2}.$$

La transformación de coordenadas $(d, θ)$ a $(x, y)$ esta dada por: $d = x^2 + y^2,\quad θ = arctan\frac{y}{x}$,y por lo tanto la matriz jacobiana de esta transformación es:
$$\begin{pmatrix}
\frac{\partial}{\partial x}(x^2+y^2) &
\frac{\partial}{\partial y}(x^2+y^2) \\
\frac{\partial}{\partial x}\arctan\frac{y}{x} &
\frac{\partial}{\partial x}\arctan\frac{y}{x}
\end{pmatrix}
=
\begin{pmatrix}
2x & 2y \\ -\frac{y}{x^2+y^2} & \frac{x}{x^2+y^2} \end{pmatrix}$$

con determinante jacobiano igual a 2. Por lo tanto, la densidad conjunta de $R^2$ y $Θ$ satisface:
$$f_{R^2,Θ}(d, θ) = \frac12 f_{X,Y} (x, y) = \frac1{4π}e^{−d/2}.$$

Así, observando que $θ$ toma valores en $[0, 2π)$ y $d > 0$, formalmente resulta:
$$f_{R^2,Θ}(d, θ) = \frac1{2π}\mathbb{I}_{[0,2π)}(θ)\frac12e^{−d/2}
e^{−d/2}\mathbb{I}_{[0,∞)}(d).$$
Donde $\frac1{2π}\mathbb{I}_{[0,2π)}(θ)$ es la función de densidad de $θ\thicksim\mathcal{U}(0,2\pi)$, y $\frac12e^{−d/2}\mathbb{I}_{[0,∞)}(d)$ es la función de densidad de $R^2\thicksim\mathcal{E}(1/2)$.

Es decir, $R^2$ y $Θ$ resultan ser variables aleatorias independientes, con distribución exponencial $\mathcal{E}(1/2)$ y uniforme $\mathcal{U}(0, 2π)$, respectivamente. El Método polar genera dos variables normales estándar, y el algoritmo es como sigue.

In [53]:
from math import sin, cos
def VariableContinuaNormal_Polar(sigma,mu):
    Rcuadrado = -2 * np.log(1 - random())
    Theta= 2 * np.pi * random()
    X= sqrt(Rcuadrado) * cos(Theta)
    Y= sqrt(Rcuadrado) * sin(Theta)
    return (X * sigma + mu, Y * sigma + mu)

### Método Box-Muller
Las transformaciones:
$$\begin{cases} X = \sqrt{-2\log U_1} cos(2\pi U_2) \\ Y = \sqrt{-2\log U_1} sin(2\pi U_2) \end{cases}$$
se denominan transformaciones de Box-Muller. Una desventaja de estas transformaciones es que requieren el cálculo de dos funciones trigonométricas: seno y coseno. Para mejorar este paso, notemos que si generamos uniformemente puntos en el círculo unitario, y $(V_1, V_2)$ son las coordenadas de un punto aleatorio en este círculo, entonces para cada $r, 0 < r < 1$ se cumple que:

$$P(V^2_1 + V^2_2 ≤ r) = P(\sqrt{V^2_1 + V^2_2} ≤ \sqrt{r}) = \frac{πr}π,$$

y para $α$, $0 ≤ α < 2π$,

$$P(0 < \arctan\frac{V_2}{V_1} < α) = \frac{α/2}{π} = \frac1{2π}\alpha.$$

Así, las variables aleatorias $S^2 = V^2_1 + V^2_2$ y $Θ = arctan\frac{V_2}{V_1}$ resultan uniformemente distribuidas en $(0, 1)$ y $(0, 2π)$ respectivamente. Además por propiedades geométricas no es difícil ver que son independientes:

$$P(S^2 ≤ r, Θ < α) = r ·\fracα{2π}. $$
Así tenemos que:
$$cos Θ = \frac{V_1}{\sqrt{V^2_1 + V^2_2}},\quad sin Θ = \frac{V_2}{\sqrt{V^2_1 + V^2_2}}= \frac{V_2}{\sqrt{S^2}}.$$
En resumen, para generar $cos Θ$ y $sen Θ$ debemos:
1. Generar un punto aleatorio $(V1, V2)$ del círculo unitario.
2. Calcular $cos Θ$ y $sen Θ$ usando.
La generación de puntos aleatorios en el círculo se reduce a generar pares de puntos $(V1, V2)$ en el cuadrado $[−1, 1]×[−1, 1]$ hasta obtener uno en el círculo unitario. Las transformaciones de Box-Muller se reescriben entonces como:

$$ X = \sqrt{-2\log U} \frac{V1}{\sqrt{V^2_1 + V^2_2}},\quad Y = \sqrt{-2\log U} \frac{V2}{\sqrt{V^2_1 + V^2_2}}$$

Ahora, como $S=V^2_1 + V^2_2$ es uniforme en $(0, 1)$ y es independiente de $Θ$, resulta:
$$X = \sqrt{-2\log U} \frac{V1}{\sqrt{U}}=V_1 \sqrt{-2\log U}$$
$$Y = \sqrt{-2\log U} \frac{V2}{\sqrt{U}}=V_2 \sqrt\frac{-2\log U}U$$

Finalmente, el método polar con las transformaciones para simular dos variables normales resulta:

In [58]:
def VariableContinuaNormal_BoxMuller(mu,sigma):
    #Generar un punto aleatorio en el cırculo unitario.
    while True:
        V1, V2 = 2 * random()-1, 2 * random()-1
        if V1 ** 2 + V2 ** 2 <= 1:
            S = V1 ** 2 + V2 ** 2
            X = V1 * sqrt(-2 * np.log(S) / S)
            Y = V2 * sqrt(-2 * np.log(S) / S)
            return ( X * sigma + mu, Y * sigma + mu)