## Εθνικό Μετσόβιο Πολυτεχνείο 
## Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών


### Μάθημα: Στοχαστικές διαδικασίες
### Διδάσκων: Μιχαήλ Λουλάκης
### Ακαδημαϊκό έτος: 2017-2018


### Ιωάννης Κ. Γεωργακόπουλος
### Α.Μ.: 03111512


# 7η Εργαστηριακή Άσκηση

Αρχικά, όπως κάθε φορά, εισάγονται οι βιλιοθήκες που είναι απαραίτητες για το εργαστήριο.

In [1]:
import numpy as np
from numpy import random 
from numpy.random import choice

import statistics as stat

from simple_markov_chain_lib import markov_chain

import matplotlib.pyplot as plt
%matplotlib inline
# plt.rcParams['figure.figsize'] = (10, 6)  # default figure size

from math import gamma, pi, cos 

Στη συνέχεια εισάγονται κάποιες συναρτήσεις που θα χρησιμοποιηθούν μετέπειτα.

In [2]:
def random_walk_next(state):
    if np.random.uniform() < 0.5:
        return 0
    return state + 1

def MCMC(N,fun = lambda x: x):
    
    if N<1: return None
    running_state = 0
    sum_result = 0
    
    for i in range(N):
        running_state = random_walk_next(running_state)
        sum_result += fun(running_state)

    return sum_result/N

### Εργοδικός Μέσος (Άσκηση 103)

Στην άσκηση αυτή γίνεται προσομοίωση της αλυσίδας της  ́*Ασκησης 80* για $p = 1/2$.
Υπενθυμίζεται ότι αυτή η αλυσίδα στον χώρο καταστάσεων $ \mathbb{N} \cup \{0\}$ 
είναι μη υποβιβάσιμη, γνησίως επαναληπτική, με αναλλοίωτη κατανομή $\pi$ που δίνεται από την

$$ \pi(k) = \frac{1}{2^{k+1}}, \quad k = 0, 1, 2, 3, ... $$

Ο κώδικας στο παρακάτω κελί προσομοιώνει τα πρώτα $N = 10^4$ βήματα της αλυσίδας 
και επιστρέφει τον εργοδικό μέσο

$$
\frac{X_1 + X_2 + ... + X_N}{N}
$$

Από το εργοδικό Θεώρημα η παραπάνω ποσότητα συγκλίνει καθώς $N \to \infty$ με πιθανότητα 1 στο 

$$ \sum_{k=0}^{\infty} k \pi(k) $$

οπότε ο κώδικας υπολογίζει αριθμητικά την παραπάνω ποσότητα με τη μέθοδο Markov Chain Monte
Carlo (MCMC).


In [3]:
N = 10**4
running_state = 0
sum_result = 0

for i in range(N):
    running_state = random_walk_next(running_state)
    sum_result += running_state

    
### Ergodic Limit Theorem
print("The simulated ergodic average [X1+X2+X3+...+XN]/N is: %.4f" % (sum_result / N))

The simulated ergodic average [X1+X2+X3+...+XN]/N is: 0.9688


## Παραδοτέο 1

Φτιάξτε ένα *Jupyter Notebook* και
1. Υπολογίστε αναλυτικά το παραπάνω άθροισμα και το στη συνέχεια το σφάλμα της εκτίμησης.
2. Σε ένα κελί κώδικα αλλάξτε τον κώδικα ώστε να υπολογίζει το παραπάνω άθροισμα 50 φορές 
και βρείτε τη δειγματική διασπορά των αποτελεσμάτων.
3. Αν θέλαμε να περιορίσουμε τη δειγματική τυπική απόκλιση των αποτελεσμάτων στο μισό, πόσο μεγάλο θα έπρεπε να
πάρουμε το N; Απαντήστε θεωρητικά και επιβεβαιώστε το αριθμητικά.
4. Αλλάξτε τον κώδικα ώστε να υπολογίζει με τη μέθοδο MCMC το άθροισμα

$$ \sum_{k=0}^{\infty} \frac{\cos(k + \cos(k))}{2^k} $$

#### 1.

Υπολογίζουμε αναλυτικά το παραπάνω άθροισμα: $$ \sum_{k=0}^{\infty} k \pi(k) = \sum_{k=1}^{\infty} \frac{k}{2^{k+1}} = \sum_{n=1}^{\infty} \sum_{i=n}^{\infty} \frac{1}{2^{i+1}} = \sum_{n=1}^{\infty} \frac{1}{2^n} = 1 $$ Το σφάλμα εκτίμησης δίνεται από το παρακάτω τμήμα κώδικα.

In [4]:
print("Estimation Error : %.5f" % (100 * abs(1- 1/MCMC(10**4))))

Estimation Error : 1.40984


#### 2.  

Με χρήση της συνάρτησης MCMC θα εξάγουμε το άθροισμα 50 φορές. Στη συνέχεια, μέσω της βιβλιοθήκης statistics θα βρούμε την δειγματική διασπορά.

In [5]:
N_samples = 50

samples = np.zeros(N_samples, dtype=float)

for i in range(N_samples):
    samples[i] = MCMC(10**4)

print("MCMC Sample mean value = %.5f" % stat.mean(samples))
print("MCMC Sample   variance = %.5f" % stat.variance(samples))

MCMC Sample mean value = 1.00057
MCMC Sample   variance = 0.00047


#### 4. 

Ορίζουμε:
$$F(k) = 2 \cos(k + \cos(k)) $$

Άρα:
$$ \sum_{k=0}^{\infty} \frac{\cos(k + \cos(k))}{2^k} = \sum_{k=0}^{\infty} \frac{2 \cos(k + \cos(k))}{2^{k+1}}= \sum_{k=0}^{\infty} {2 \cos(k + \cos(k))} \pi (k) = \sum_{k=0}^{\infty} F(k)\pi (k) $$

Συνεπώς, με χρήση της συνάρτησης $F(k)$ για τον υπολογισμό του `sum_result`, από το Εργοδικό θεώρημα έχουμε ότι η τελική ποσότητα που παράγεται θα συγκλίνει στην τιμή της σειράς:
$$ \sum_{k=0}^{\infty} \frac{\cos(k + \cos(k))}{2^k} $$

In [6]:
def fun(x):
    return 2*cos(x + cos(x))

### Ergodic Limit Theorem
print("The desired sum value is: %.4f" % MCMC(10**4,fun = fun))

The desired sum value is: 0.4676


## Παραδοτέο 2

Υπολογίστε τον όγκο της Ν-διάστατης σφαίρας όπως στο προηγούμενο εργαστήριο αλλά με χρήση του 
εργοδικού μέσου. Συγκεκριμένα, ξεκινώντας από το ότι $\omega(1)=2$ και εκτιμώντας **από το εργοδικό θεώρημα** τον λόγο $|\,D_d\,|/|\,C_d\,|$, υπολογίστε αριθμητικά για $d=2,3,\ldots,100$ τον όγκο $\omega(d)$ της μπάλας σε $d$ διαστάσεις και το % σφάλμα της τιμής που βρήκατε από την θεωρητική τιμή του $\omega(d)$.  Συγκρίνετε τα αποτελέσματα με αυτά που πήρατε στο προηγούμενο εργαστήριο με βάση τον νόμο των μεγάλων αριθμών. Προσοχή! προκειμένου η σύγκριση να είναι δίκαιη, θα πρέπει να ξοδέψετε περίπου τον ίδιο υπολογιστικό χρόνο στα δύο προβλήματα. Έτσι, αν στο προηγούμενο εργαστήριο πήρατε $N$ δείγματα και για να πάρετε καθένα από αυτά τρέξατε την αλυσίδα στη σφαίρα για $n$ βήματα, τώρα θα πρέπει να τρέξετε μία φορά την αλυσίδα στον κύλινδρο για $nN$ βήματα. Ποια από τις δύο προσεγγίσεις δίνει τα μικρότερα σφάλματα σε σχέση με τη θεωρητική τιμή;

In [7]:
def Vol1(d):
    x = d/2
    return pi ** x / gamma(x + 1)

def ratio(d, N = 10**5, delta = 1.0):
    x = np.zeros(d, dtype=float)
    rad = 0.0
    hits = 0
            
    for _ in range(N):
        k = random.choice([i for i in range(d-1)])
        z = random.uniform(-delta,delta)
        x[d-1] = random.uniform(-1.0,1.0)
        
        x_prop = x[k] + z
        rad_prop = rad - x[k]**2 + x_prop**2
        
        if rad_prop < 1.0:
            rad = rad_prop
            x[k] = x_prop
        
        if rad + x[d-1]**2 < 1.0:
            hits += 1
            
    return hits/N

res = np.zeros(100)
res[0] = 2

for i in range(1,100):
    r = ratio(i+1)
    res[i] = res[i-1]*r*2

Βάσει του παραπάνω κώδικα, τα αποτελέσματα είναι αποθηκευμένα στη λίστα `res`. 

Παρουσιάζονται τυπωμένα παρακάτω η προσέγγιση, η αναλυτική τιμή και το σφάλμα (%), για κάθε # διαστάσεων. 

In [8]:
# Print results in ascending order of # of dimensions.

print("d\tErgodic Theorem Value\tActual\t\t\tError(%)\n")
for i,v in enumerate(res[1:]):
    print("%d\t%.20f\t%.20f\t%.10f"% (i+2, v, Vol1(i+2), (100 * abs(1- Vol1(i+2)/v))))

d	Ergodic Theorem Value	Actual			Error(%)

2	3.14355999999999990990	3.14159265358979311600	0.0625833899
3	4.18521004160000043015	4.18879020478639052527	0.0855432141
4	4.90933508299763232685	4.93480220054467899615	0.5187488146
5	5.21567759217668491800	5.26378901391432485468	0.9224385689
6	5.15027299517078951396	5.16771278004996936772	0.3386186498
7	4.70817356126532882143	4.72476597033140155446	0.3524171072
8	4.05025338781411203826	4.05871212641676759603	0.2088446769
9	3.28321640122987545851	3.29850890273870644975	0.4657780554
10	2.55165012270783453374	2.55016403987734507908	0.0582400705
11	1.88781282678416451049	1.88410387938989942747	0.1964679624
12	1.34299004497425467086	1.33526276885458927701	0.5753785107
13	0.91809485454529993209	0.91062875478328297874	0.8132166001
14	0.60772370801771580240	0.59926452932079188329	1.3919448238
15	0.38698630279152107514	0.38144328082330436480	1.4323561140
16	0.23725356251542573105	0.23533063035889312253	0.8104966417
17	0.14190135574047613165	0.1409811

Τα αποτελέσματα είναι ακριβέστερα σε σχέση με τα αποτελέσματα που εξήχθησαν στο προηγούμενο εργαστήριο.