Zaimplementować najprostszą metodę Monte Carlo obliczania całki

$$I(f)=\int\limits_a^b f(x) dx$$

Przedstawić dwie implementację używającą modułu $\color{green}{numpy}$ oraz wykonać testy numeryczne.

Dla ustalonego $n\in\mathbb{N}$ metoda ta ma postać

$$MC_n(f) = \frac{b-a}{n}\sum\limits_{j=1}^n f(\xi_j), $$

gdzie $\xi_1,\xi_2,\ldots,\xi_n$ są niezależnymi zmiennymi losowymi o rozkładzie jednostajnym na $[a,b]$. Wariancja empiryczna ma postać

$$\bar V_n(f) = \frac{1}{n}\sum\limits_{j=1}^n\Bigl((b-a)f(\xi_j)-MC_n(f)\Bigr)^2$$
$$=\frac{1}{n-1}\sum\limits_{j=1}^n((b-a)f(\xi_j))^2-\frac{n}{n-1}(MC_n(f))^2$$

Empiryczne przedziały ufności na poziomie ufoności $1-\alpha=0.95$, mają postać

$$\Bigl[MC_n(f)-2\cdot\sqrt{\frac{\bar V_n(f)}{n}}, MC_n(f)+2\cdot\sqrt{\frac{\bar V_n(f)}{n}}\Bigr]$$

In [1]:
import numpy as np

In [2]:
a = 0.0
b = np.pi

In [3]:
N = [11, 11**2, 11**3, 11**4]

In [4]:
I = 2.0+ (np.pi**3)/3

In [5]:
print(I)

12.335425560099939


In [6]:
def quad_MC(f, a, b, n):    
    random_samples_0 = np.random.uniform(a,b,n).astype('float32')
    f_values = f(random_samples_0)
    
    avg_f = np.mean(f_values)
    MC_f = (b-a) * avg_f
    
    random_samples_1 = np.power(f_values-avg_f,2)
    Var_f = (n / (n-1)) * np.power(b-a,2) * np.mean(random_samples_1)
    
    L_CI = MC_f - 2.0*np.sqrt(Var_f/n)
    R_CI = MC_f + 2.0*np.sqrt(Var_f/n)
    
    return MC_f, Var_f, L_CI, R_CI

In [7]:
def f_0(x):
    return np.sin(x)+x**2

In [8]:
N = [11, 11**2, 11**3, 11**4, 11**5, 11**7]

In [9]:
%%time
for i in range(0, len(N)):
    Q, VAR, L_CI, R_CI = quad_MC(f_0, a, b, N[i])
    ERR = abs(I-Q)
    print("n = %.i, Quad MC= %.10f, wariancja = %.10f, [%.10f, %.10f], błąd = %.10f" % (N[i], Q, VAR, L_CI, R_CI, ERR) )

n = 11, Quad MC= 14.1463738219, wariancja = 46.9482682100, [10.0145343368, 18.2782133071], błąd = 1.8109482618
n = 121, Quad MC= 12.7707196253, wariancja = 70.0229684427, [11.2492700290, 14.2921692217], błąd = 0.4352940652
n = 1331, Quad MC= 12.4941274596, wariancja = 82.9095582266, [11.9949634455, 12.9932914736], błąd = 0.1587018995
n = 14641, Quad MC= 12.3528768908, wariancja = 82.9812821075, [12.2023081925, 12.5034455890], błąd = 0.0174513307
n = 161051, Quad MC= 12.3578855478, wariancja = 82.2588635044, [12.3126854228, 12.4030856727], błąd = 0.0224599877
n = 19487171, Quad MC= 12.3349964272, wariancja = 81.9390416756, [12.3308953208, 12.3390975336], błąd = 0.0004291329
Wall time: 1.34 s


$$2\cdot\int\limits_0^1 \frac{dx}{\sqrt{1-x^2}}=\pi$$

Uwaga: całka z funkcji z osobliwością w $x=1$, deterministyczne kwadratury mogą mieć problem. Funkcja nie jest całkowalna z kwadratem!

In [10]:
def g(x):
    return 2.0/np.sqrt(1-np.power(x,2))

In [11]:
quad_MC(g, 0.0, 1.0, 301111)

(3.136610984802246, 18.254666871325536, 3.121038653275613, 3.152183316328879)

In [12]:
%%time
for i in range(0, len(N)):
    Q, VAR, L_CI, R_CI = quad_MC(g, 0.0, 1.0, N[i])
    print("n = %.i, Quad MC= %.10f, wariancja = %.10f, [%.10f, %.10f]" % (N[i], Q, VAR, L_CI, R_CI) )

n = 11, Quad MC= 2.3440544605, wariancja = 0.1935975730, [2.0787261404, 2.6093827807]
n = 121, Quad MC= 2.9901916981, wariancja = 2.3855199516, [2.7093711794, 3.2710122167]
n = 1331, Quad MC= 3.1433203220, wariancja = 13.4359435842, [2.9423763171, 3.3442643270]
n = 14641, Quad MC= 3.1422746181, wariancja = 19.9058948930, [3.0685291259, 3.2160201104]
n = 161051, Quad MC= 3.1637873650, wariancja = 19.4127277308, [3.1418294265, 3.1857453035]
n = 19487171, Quad MC= 3.1412694454, wariancja = 29.9615741846, [3.1387895240, 3.1437493668]
Wall time: 2.36 s


Zaimplementować najprostszą metodę Monte Carlo obliczania całki

$$I(f)=\int\limits_{-\infty}^{+\infty} f(x)\cdot\frac{1}{\sqrt{2\pi}}\cdot e^{-x^2/2} dx$$

Przedstawić implementację używającą modułu $\color{green}{numpy}$ oraz wykonać testy numeryczne.

Dla ustalonego $n\in\mathbb{N}$ metoda ta ma postać

$$MC_n(f) = \frac{1}{n}\sum\limits_{j=1}^n f(\xi_j), $$

gdzie $\xi_1,\xi_2,\ldots,\xi_n$ są niezależnymi zmiennymi losowymi o rozkładzie normalnym o średniej $0$ i odchyleniu standardowym $1$.

In [13]:
I2 = 0

In [14]:
def quad_MC_2(f, n):
    random_samples = np.random.normal(0,1,n).astype('float64')
    f_values = f(random_samples)
    
    return np.mean(f_values)

In [15]:
def f_1(x):
    return np.sin(x)

In [16]:
N = [11, 11**2, 11**3, 11**4, 11**6, 11**8]

In [17]:
%%time
for i in range(0, len(N)):
    Q = quad_MC_2(f_1, N[i])
    ERR = abs(I2-Q)
    print("n = %.i, wartość kwadratury Monte Carlo= %.10f, błąd = %.10f" % (N[i], Q, ERR) )

n = 11, wartość kwadratury Monte Carlo= 0.2176066369, błąd = 0.2176066369
n = 121, wartość kwadratury Monte Carlo= -0.0437826567, błąd = 0.0437826567
n = 1331, wartość kwadratury Monte Carlo= -0.0145050058, błąd = 0.0145050058
n = 14641, wartość kwadratury Monte Carlo= -0.0119377090, błąd = 0.0119377090
n = 1771561, wartość kwadratury Monte Carlo= -0.0005105372, błąd = 0.0005105372
n = 214358881, wartość kwadratury Monte Carlo= 0.0000233288, błąd = 0.0000233288
Wall time: 23.4 s


In [18]:
def f_2(x):
    return (1/(x**2+1))*np.sqrt(np.pi * 2) * np.exp((x**2)/2)

In [19]:
%%time
for i in range(0, len(N)):
    Q = quad_MC_2(f_2, N[i])
    ERR = abs(np.pi-Q)
    print("n = %.i, wartość kwadratury Monte Carlo= %.10f, błąd = %.10f" % (N[i], Q, ERR) )

n = 11, wartość kwadratury Monte Carlo= 2.2768324055, błąd = 0.8647602481
n = 121, wartość kwadratury Monte Carlo= 2.3184775209, błąd = 0.8231151327
n = 1331, wartość kwadratury Monte Carlo= 2.5912418317, błąd = 0.5503508218
n = 14641, wartość kwadratury Monte Carlo= 2.7005665347, błąd = 0.4410261189
n = 1771561, wartość kwadratury Monte Carlo= 2.7271057162, błąd = 0.4144869374
n = 214358881, wartość kwadratury Monte Carlo= 2.8216522272, błąd = 0.3199404264
Wall time: 38.5 s


Symulacja CDF rozkładu normalnego $N(0,1)$, tj.

$$\Phi(t)=\int\limits_{-\infty}^t \frac{1}{\sqrt{2\pi}}e^{-x^2/2}dx$$

In [20]:
def indicator(t, x):
    return float(x<=t)

In [21]:
def CDF_Normal(t, n):
    random_sample = np.random.normal(0,1,n)
    
    random_binary = np.where(random_sample <= t, 1.0, 0.0)
    
    return np.mean(random_binary)

In [22]:
CDF_Normal(0.0, 10**7)

0.5001726

Numerycznie sprawdzić następującą własność dystrybuanty $\Phi$ rozkładu normalnego $N(0,1)$:

$$\Phi(x)+\Phi(-x)=1, \quad\forall_{x\in\mathbb{R}}$$

In [23]:
CDF_Normal(0.23, 10**7)+CDF_Normal(-0.23, 10**7)

0.9997216

In [24]:
print(1.0-abs(CDF_Normal(0.23, 10**7)+CDF_Normal(-0.23, 10**7)))

-9.239999999999249e-05


Porównanie z implementacjami biblioteki SciPy

In [25]:
import scipy.stats as sc_stats

In [26]:
dist = sc_stats.norm(0,1)

In [27]:
cdf = dist.cdf(0.0)
print(cdf)

0.5


In [28]:
print('%.17f' % float(dist.cdf(0.23)+dist.cdf(-0.23)))

1.00000000000000000


Dla dowolnego $K\geq 0$ zaimplementować metodę Monte Carlo obliczania całki

$$I(f)=\int\limits_{-\infty}^{+\infty} (x-K)^{+}\cdot\frac{1}{\sqrt{2\pi}}\cdot e^{-x^2/2} dx$$

In [29]:
def call_option(K, n):
    random_sample_0 = np.random.normal(0,1,n)
    
    random_sample_1 = np.where(random_sample_0 >= K, random_sample_0-K, 0.0)
    
    return np.mean(random_sample_1)

In [30]:
call_option(3, 10**7)

0.00037658022337239534