Pada bagian ini kita akan mempelajari pembentukan variabel random kontinu dengan menggunakan data dari variabel random kontinu $[0,1]$. 
Dasar untuk memahami ini adalah sifat dasar berikut

Misalkan $U$ adalah variabel random uniform di $(0,1)$. Selanjutnya, jika $F$ adalah fungsi distribusi (artinya untuk $x\rightarrow -\infty$, maka nilai $F(x)\rightarrow 0$, dan sedangkan $x \rightarrow \infty$, maka nilai $F(x)\rightarrow 1$, dan $F$ monoton naik), maka fungsi distribusi dari variabel 
$$
X=F^{-1}(U)
$$
mempunyai distribusi $F$.

Untuk memahami hal tersebut, kita akan menghitung fungsi distribusi$F_X$ dari $X$ tersebut. Untuk itu
\begin{align}
F_X(x) &=P\{X\leq x \} \cr
  &= P\{F^{-1}(U) \leq x \} 
  \end{align}
Karena $F$ fungsi ynag monoton naik, maka $a\leq b$ jika dan hanya jika $F(a)\leq F(b)$. Dengan demikian
\begin{align}
F_X(x) &= P\{ U\leq F(x) \} \cr
    &= F(x)
\end{align}

Cara seperti ini disebut Metode Invers untuk membangun data variabel random dengan distribusi tertentu.

Untuk variabel random dengan distribusi yang mudah dicari inversnya, tidak menjadi masalah. Sebagai contoh
1. Misalkan variabel random $X$ dengan distribusi
$$
F(x)=x^n\qquad 0\leq x \leq 1
$$
dengan $n$ bilangan rasional, bahkan bilangan real

In [None]:
import numpy as np
import matplotlib.pyplot as plt
n=2
x=np.linspace(0,1, num=30)
plt.plot(x,x*x)

In [None]:
import math

n_sim=10000000
u = list(np.random.rand(n_sim))
x=[math.sqrt(i) for i in u]
plt.hist(x,density=True)

In [None]:
plt.hist(x,bins=100,density=True)

## Contoh Lain
Misalkan $X$ mempunyai fungsi distribusi kumulatf $F(x)=1-e^{-x}$. Untuk membangkitkan data untuk variabel random dengan distribusi tersebut, kita harus mencari invers $u=1-e^{-x}$, $e^{-x}=1-u$, $x=-\ln (1-u)$, $x=-\ln (u)$

In [None]:
x=np.linspace(0,5, num=300)
y=[1-math.exp(-t) for t in x]
yt=[math.exp(-t) for t in x]

In [None]:
plt.subplot(1,2,1)
plt.plot(x,y)

plt.subplot(1,2,2)
plt.plot(x,yt)

plt.show()

In [None]:
Nsim=10**4
u = list(np.random.rand(Nsim))
x=[-math.log(1-t) for t in u]
plt.hist(x,density=True,bins=10)

Untuk varibel random normal, cara di atas tidak dapat dilakukan karena kita tidak mungkin untuk mencari invers dari fungsi distribusi kumulatif $F$ dari distribusi normal. Tetapi kita dapat mencari invers dari fungsi kepadatan peluang dengan bentuk berikut (disebut distribusi Rayleigh)
$$
f(x)=
\left \{
\begin{array}{ll} 
0  & \mbox{jika } x\leq 0 \\
x e^{-\frac{1}{2} x^2} & \mbox{jika } x\geq 0 \\
\end{array} 
\right .
$$

Kemudian, fungsi distribusi kumulatifnya adalah
$$
F(x) = \int_0^x t e^{-\frac{1}{2} t^2} dt=1-e^{-\frac{1}{2} x^2}
$$
Jika $F(x)=u$, maka 
$$
x=\sqrt{-2 \ln(1-u)}
$$


In [None]:
x=np.linspace(0,5, num=300)
y=[1-math.exp(-t*t/2) for t in x]
yt=[t*math.exp(-t*t/2) for t in x]

In [None]:
plt.subplot(1,2,1)
plt.plot(x,y)

plt.subplot(1,2,2)
plt.plot(x,yt)

plt.show()


In [None]:
n_sim=10000000
u = list(np.random.rand(n_sim))
x=[math.sqrt(-2*i*math.log(1-i)) for i in u]

In [None]:
plt.hist(x,density=True,bins=10)

Sekarang kita akan membangun distribusi normal dengan memanfaatkan distribusi Rayleigh dan metode Terima-Tolak. 

Misalkan kita akan membangun fungsi kepadatan peluang $f$, kemudian kita menggunakan fungsi kepadatan peluang $g$ yang lebih sederhana dimana data dari distribusinya mudah dibangun. 
Kedua fungsi kepadatan peluang tersebut harus memenuhi
1. $f$ dan $g$ mempunyai support yang sama, dan saat $f(x)>0$ maka $g(x)>0$.
2. Ada konstanta $c$ sehingga $f(x)/g(x)\leq c$ untuk semua $x$.

Kemudian, untuk membangun data variabel random $X$ dengan fungsi kepadatan peluang $f$, pertama kita membangun data untuk variabel random $Y$ dengan fungsi kepadatan peluang $g$. Selanjutnya, secara independent (bebas) kita membangun data variabel random terdistribusi uniform $U$ di $[0,1]$.  Selanjutnya, jika
$$
U\leq \frac{1}{c} f(Y)/g(Y)
$$
maka data dari $Y$ diambil sebagian data untuk $X$.
Jadi algoritmanya sebagai berikut 
1. Bangun variabel random $Y \sim g$ dan $U\sim U(0,1)$.
2. Terima $x=y$ jika $u \leq \frac{1}{c} f(y)/g(y)$
3. Dalam hal lain kembali ke (1)

Kita akan membuktikan bahwa 
$$
P(Y\leq x | U \leq \frac{1}{c} f(Y)/g(Y)) =P(X\leq x)
$$
Untuk itu, kita akan menggunakan $P(A|B) =\frac{P(A\cap B)}{P(B)}$, dalam hal ini
\begin{align}
P(Y\leq x | U \leq \frac{1}{c} f(Y)/g(Y)) &= 
\frac{P(Y\leq x, U\leq \frac{1}{c} f(Y)/g(Y))}
{P(U\leq \frac{1}{c} f(Y)/g(Y))}\\
&= \frac{ \int_{-\infty}^x \int_0^{\frac{1}{c} f(y)/g(y)} du g(y) dy}
{\int_{-\infty}^{\infty} \int_0^{\frac{1}{c} f(y)/g(y)} du  g(y) dy} \\
&=\frac{ \int_{-\infty}^x \frac{1}{c} [f(y)/g(y)] g(y) dy}
{\int_{-\infty}^{\infty} \int_0^{\frac{1}{c} f(Y)/g(Y)} du  g(y) dy}\\
&= \frac{\int_{-\infty}^x f(y) dy}{\int_{-\infty}^\infty f(y) dy}=P(X\leq x)
\end{align}



Sekarang kita akan dapat membangun data variabel random $X$ dengan fungsi kepadatan peluang dari distribusi normal, yaitu 
$$
f(x)=\frac{2}{\sqrt{\pi}} e^{-\frac{1}{2} x^2} \qquad 0<x<\infty
$$
dan fungsi kepadatan peluang dari distribusi 
$$
g(x)=e^{-x}\qquad 0,x<\infty
$$
Untuk itu kita mencari nilai maksimum 
$$
\frac{f(x)}{g(x)} 
$$
atau mencari $c$ sehingga $
\frac{f(x)}{g(x)} \leq c
$. 

Dalam hal ini
$$
\frac{f(x)}{g(x)} =\sqrt{2/\pi} e^{x-x^2/2}
$$
Nilai maksimum dari hasil bagi tersebut cukup dicari dari maksimum
$$
x-x^2/2=-\left ( \frac{(x-1)^2}{2} \right)
$$
yang terjadi saat $x=1$. Oleh karena itu maka
$$
c=\max 
\frac{f(x)}{g(x)} =
\frac{f(1)}{g(1)}= \sqrt{2e/\pi} 
$$


Kita akan membangun data untuk variabel random dengan fungsi kepadatan distribusi 
$$g(x)=e^{-x}
$$
Dalam hal ini fungsi distribusi kumulatifnya adalah
$$
G(x)=\int_0^x e^{-t}dt =1-e^{-x}
$$
Sehingga jika $G(x)=u$, maka 
$$
x=-\ln (1-u)
$$


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import math
n_sim=10000000
u = list(np.random.rand(n_sim))
y=[-math.log(i) for i in u]

In [None]:
plt.hist(y,density=True)

Sekarang, kita akan membangun variabel random uniform $U$, jika 
$$
u\leq \frac{f(y)}{cg(y)}=\exp{\left (- \frac{(y-1)^2}{2}\right ) }
$$
maka kita menerima bahwa $x=y$, dalam hal lain kita lewatkan.

In [None]:
u2 = list(np.random.rand(n_sim))
for i in range(len(u2)):
    if u2[i]<math.exp(-(y[i]-1)**2/2):
        x.append(y[i])
x=x+[-i for i in x]

In [None]:
plt.hist(x,density=True)