# Generación de variables aleatorias continuas
**Proposición**. Sea $U\thicksim\mathcal{U}(0, 1)$ una variable aleatoria. Para cualquier función de distribución continua $F$, monótona creciente en $F^{-1}(0, 1)$, la variable aleatoria $X$ definida por: $X = F^{-1}(U)$ tiene distribución $F$.

## Metodo de la transformada inversa
Notemos que $U$ toma valores en el intervalo $(0, 1)$, excluyendo los puntos 0 y 1. La propiedad de monotonía de $F$ asegura que $F$ tiene inversa en $(0, 1)$. Así, si $X = F^{−1} (U)$, su función de distribucion está dada por:
$$\\F_X(x) = P(X \leq x) = P(F^{−1}(U) \leq x) \\$$
Como $F$ es creciente, entonces $a\le b$ si y sólo si $F(a)\le F(b)$. En particular, los conjuntos $\{F^{−1}(U) \leq x\}$ y $\{U \leq F(x)\}$ son iguales. Por lo tanto:
$$\\F_X(x) = P(F(F^{-1}(U)) \leq F(x)) = P(U\le F(x)) = F(x).\\$$
Luego $X$ tiene distribución $F$.

In [None]:
from random import random

def MetodoTransformadaInversa(G):
    U = random()
    return G(U) # G = F^−1

#### Ejemplo.
Sea 
$$f(x) = \begin{cases} 1-\frac x2 & \text{si } 0\le x\le 2 \\ 0 & \text{c.c.} \end{cases}, \quad F(x) = \int_{-\infty}^x f(t)dt=\begin{cases}
0 & \text{si } x<0 \\
x-\frac{x^2}4 & \text{si } 0\le x\le 2 \\
1 & \text{si} x>2\end{cases}.$$

Entonces, para $0 < u < 1$, 
$$F(x) = u \Rightarrow \frac{x^2}4 - x + u = 0 \Rightarrow x = (1 \pm \sqrt{1 - u})\times 2 \Rightarrow F^{-1}(x)=(1 - \sqrt{1 - u})\times 2$$

In [None]:
from math import sqrt
def ejemplo():
    U = random()
    return (1-sqrt(1-U))*2

### Simulación de una variable aleatoria exponencial
Si $X$ es una variable aleatoria con distribución exponencial con parámetro $λ = 1$,  $X ∼ \mathcal{E}(1)$, entonces su función de distribución acumulada está dada por:
$$\\F(x) = \begin{cases} 1 − e^{−x} & x > 0 \\ 0 & x ≤ 0 \end{cases} \\$$
Luego la inversa de $F$ sobre $(0, 1)$ está dada por:
$$\\F^{−1}(u) = −\ln(1 − u), \quad u\in(0,1)\\$$

In [None]:
import numpy as np

def VariableContinuaExponencial_1():
    return -np.log(1-random())

Notemos a demás que si $X$ es exponencial con parámetro $λ$, entonces $Y = \frac1\lambda X$ es exponencial con media $\frac1\lambda: Y ∼ \mathcal{E}(\lambda)$. Luego el método por transformada inversa para simular valores de $Y$ es

In [None]:
def VariableContinuaExponencial(lamda):
    return -np.log(1-random())/lamda

### Simulación de una variable aleatoria Poisson
Sea $N(t)$, $t ≥ 0$, un proceso de Poisson homogéneo con intensidad λ. Entonces se cumple
que:
* Los tiempos de llegada entre eventos son variables aleatorias exponenciales de parámetro
λ, es decir, media $\frac1λ.$
* El número de eventos en un intervalo de tiempo de longitud $t$ es una variable aleatoria
Poisson de media $λ · t.\\$
En particular $N(1)$ es una variable aleatoria Poisson de media λ que indica el número de arribos
hasta el tiempo $t = 1$, y los tiempos entre arribos en el intervalo [0, 1] son exponenciales de
parámetro λ.
Por lo tanto, si se simulan variables aleatorias exponenciales $X_1, X_2, . . .$ con $X_i ∼ \mathcal{E}(1)$, para $i\ge1$, hasta que $X_1 + X_2 + · · · + X_n \ge 1$ y $X_1 + X_2 + · · · + X_n+X_{n+1} > 1$, entonces $n$ representa el número de arribos hasta $t = 1$. Esto es:
$$\\N(1) = \min\{n : X_1 + X_2 + · · · + X_n \ge 1\}$$
Si se simula cada exponencial $X_i$ con el método de la transformada inversa, tenemos que

$\\N(1) =
\max\{n:X_1 + X_2 + · · · + X_n \le 1\} \\= 
\max\{n:-\frac{1}{\lambda}(\ln(1-U_1) + \ln(1-U_2) + · · · + \ln(1-U_n)) \le 1\} \\= 
\max\{n:-\frac{1}{\lambda}\ln((1-U_1)\times(1-U_2) \times · · · +\times (1-U_n)) \le 1\} \\= 
\max\{n:\ln((1-U_1)\times(1-U_2) \times · · · +\times (1-U_n)) \ge -\lambda\} \\= 
\max\{n:(1-U_1)\times(1-U_2) \times · · · +\times (1-U_n) \ge e^{-\lambda}\} \\$

Luego: $N(1) = \min\{n : (1-U_1)\times(1-U_2) \times · · · +\times (1-U_n) < e^{-\lambda}\}-1$

In [None]:
def VariableContinuaPoisson(lamda):
    X = 0
    Producto = 1- random()
    cota = np.exp(-lamda)
    while Producto >= cota:
        Producto *= 1 - random()
        X += 1
    return X

Hemos visto que la suma de $n$ variables aleatorias exponenciales, independientes, con
parámetro λ, es una variable aleatoria con distribución $Gamma(n, λ^{−1})$. Esta propiedad nos
permite dar un algoritmo de simulación de una variable Gamma a través de la generación de $n$ exponenciales independientes con el mismo parámetro. Notemos que si $U_1, U_2, . . . , U_n$ son
valores de una variable uniforme $U ∼ \mathcal{U}(0, 1)$, entonces:

$$\\X =
\\-\frac1\lambda \ln(1-U_1) -\frac1\lambda \ln(1-U_2) - · · · -\frac1\lambda \ln(1-U_n) =
\\-\frac1\lambda(\ln(1-U_1) + \ln(1-U_2) + · · · + \ln(1-U_n))$$

De esta forma, un algoritmo para la simulación de una variable $Gamma(n, λ^{−1})$ es como sigue:

In [None]:
'''Simula una gamma con parámetros n y 1/lamda'''
def VariableContinuaGamma(n,lamda):
    U = 1
    for _ in range(n):
        U *= 1-random()
    return -np.log(U)/lamda

## Método de aceptación y rechazo
Supongamos que se quiere generar una variable aleatoria $X$ con función de densidad $f$:
$$\\F(x) = P(X ≤ x) = \int_{-\infty}^x f(t) dt,\\$$
y que se tiene un método para generar otra variable $Y$, con densidad $g$, tal que
$$\\ \frac{f(y)}{g(y)} ≤ c, \quad \forall y ∈ \R, \quad f(y) \ne 0.\\$$
El metodo de rechazo para generar $X$ a partir de $Y$ tiene el siguiente algoritmo,

In [None]:
def Aceptacion_Rechazo_X(SimularY,f,g,c):
    while 1:
        Y = SimularY()
        U = random()
        if U < f(Y) / (c * g(Y)):
            return Y

De manera analoga al caso del método para simular variables aleatorias discretas, se puede 
probar que:
1. La variable aleatoria generada por el algoritmo Aceptacion Rechazo $X()$ tiene densidad $f$.
2. El número de iteraciones del algoritmo es una variable aleatoria geométrica con media  $c$.
Entonces, para cada variable $X$ que se desee generar rechazando contra una variable $Y$, es necesario determinar una cota $c$ para el cociente $\frac{f(x)}{g(x)}$, válida para todo $x ∈ \R$. Para determinar este valor es útil recordar algunos resultados del Análisis Matemático. En primer lugar, considerar la función
$$ h(x) = \frac{f(x)}{g(x)},\quad x : f(x) \ne 0,$$
y para esta funcion determinar:
1. Puntos crıticos: Esto es, $f'(x) = 0$ o $f'(x)$ no existe.
2. Analizar cuales de estos puntos corresponden a máximos locales. 
3. Evaluar $h$ en los extremos de su dominio, si es acotado, o los límites correspondientes.
4. Elegir una cota $a$ partir de los valores obtenidos en 1. y 2.

## Simulación de variables aleatorias normales
Definimos $Z~\mathcal{N}(0, 1)$, y $X = μ + σZ$ una variable aleatoria normal con media $μ$ y desviación estándar $σ$. La función de distribución acumulada de $X$ es:
$$F(x) = \frac1{\sqrt{2\pi}}\int_{-\infty}^xe^{-\frac{t^2}2}dt$$
la cual no tiene una expresion cerrada y por lo tanto no se conoce una forma explıcita de su inversa.

### Por composición usando $|Z|$
Una observación es que la función de densidad de $Z$ es par, por lo cual puede intentarse un método para generar $|Z|$ y usar luego un método de composición. Más precisamnete, consideramos $U ∼ \mathcal{U}(0, 1)$ y $X$ la variable aleatoria dada por:
$$X = \begin{cases} Z & U ≤ 0.5 \\ -Z & U > 0.5 \end{cases} $$
Entonces se cumple que:
$$P(X ≤ a)
= P(U < 0.5, |Z|\le a ) + P(U > 0.5, -|Z|\le a )\\
= \frac12P(|Z|\le a)+\frac12P(-|Z|\le a)$$
Con un análisis de casos $a\ge0$ y $a<0$ podemos ver que $P(X\le a) = P(Z\le a)$, es decir que $X$ tiene distribución normal. Así $Z$ es la mezcla o composición de las variables $|Z|$ y $-|Z|$, ambas con ponderación $\frac12$: $$F_Z(x)=0.5\times F_{|Z|}(x)+0.5\times F_{-|Z|}(x)$$
Es necesario entonces un método para generar $|Z|$. Su densidad está dada por:
$$f_{|Z|}(x) = \frac2{\sqrt{2\pi}}e^{-\frac{x^2}2}1_{x\ge0}$$
Una posibilidad es utilizar el método de rechazo con una exponencial, por ejemplo, $X=\mathcal{E}(1)$. Denotamos $g$ a la densidad de $X$. Así, debemos encontrar una cota para:
$$\frac{f_{|Z|}(x)}{g(x)} = \frac2{\sqrt{2\pi}}e^{-\frac{x^2}2+x}$$
Esta función alcanza un máximo en el punto en que el exponente es máximo, lo cual ocurre en $x = 1$. El valor máximo y por consiguiente la cota mínima $c$ esta dada por:
$$c = \sqrt{\frac{2e}{\pi}}\approx1.32$$
Para describir el algoritmo, calculamos:
$$\frac{f(x)}{cg(x)}=exp\{-\frac{(x-1)^2}{2}\}$$
Luego el método de rechazo simula $Y_1 ~ \mathcal{E}(1)$, $U$ uniforme, e itera hasta que:
$$U \le exp\{-\frac{(Y_1-1)^2}{2}\},$$
es decir $$log(U) \le -\frac{(Y_1-1)^2}{2}.$$
Dado que $Y_2 = -\log(U)$ genera una exponencial $\mathcal{E}(1)$, el algoritmo por el método de rechazo para generar $Z$ se traduce en:

In [None]:
def Normal_composicion(mu, sigma):
    while True:
        Y1 = -np.log(random())
        Y2 = -np.log(random())
        if Y2 >=(Y1-1) ** 2 / 2:
            if random() < 0.5:
                return Y1 * sigma + mu
            return -Y1 * sigma + mu