## Εργαστήριο 7

### Εργοδικός Μέσος (Άσκηση 103)

Στην άσκηση αυτή γίνεται προσομοίωση της αλυσίδας της  ́*Ασκησης 80* για $p = 1/2$.
Υπενθυμίζεται ότι αυτή η αλυσίδα στον χώρο καταστάσεων $ \mathbb{N} \cup \{0\}$ 
είναι μη υποβιβάσιμη, γνησίως επαναληπτική, με αναλλοίωτη κατανομή $\pi$ που δίνεται από την

$$ \pi(k) = \frac{1}{2^{k+1}}, \quad k = 0, 1, 2, 3, ... $$

Ο κώδικας στο παρακάτω κελί προσομοιώνει τα πρώτα $N = 10^4$ βήματα της αλυσίδας 
και επιστρέφει τον εργοδικό μέσο

$$
\frac{X_1 + X_2 + ... + X_N}{N}
$$

Από το εργοδικό Θεώρημα η παραπάνω ποσότητα συγκλίνει καθώς $N \to \infty$ με πιθανότητα 1 στο 

$$ \sum_{k=0}^{\infty} k \pi(k) $$

οπότε ο κώδικας υπολογίζει αριθμητικά την παραπάνω ποσότητα με τη μέθοδο Markov Chain Monte
Carlo (MCMC).


In [None]:
from random import random


def random_walk_next(state):
    if random() < 0.5:
        return 0
    return state + 1

N = 10**4
running_state = 0
sum_result = 0

for i in range(N):
    running_state = random_walk_next(running_state)
    sum_result += running_state

    
### Ergodic Limit Theorem
print("The simulated ergodic average [X1+X2+X3+...+XN]/N is: %.4f" % (sum_result / N))

### Παραδοτέο 1

Φτιάξτε ένα *Jupyter Notebook* και
1. Υπολογίστε αναλυτικά το παραπάνω άθροισμα και το στη συνέχεια το σφάλμα της εκτίμησης.
2. Σε ένα κελί κώδικα αλλάξτε τον κώδικα ώστε να υπολογίζει το παραπάνω άθροισμα 50 φορές 
και βρείτε τη δειγματική διασπορά των αποτελεσμάτων.
3. Αν θέλαμε να περιορίσουμε τη δειγματική τυπική απόκλιση των αποτελεσμάτων στο μισό, πόσο μεγάλο θα έπρεπε να
πάρουμε το N; Απαντήστε θεωρητικά και επιβεβαιώστε το αριθμητικά.
4. Αλλάξτε τον κώδικα ώστε να υπολογίζει με τη μέθοδο MCMC το άθροισμα

$$ \sum_{k=0}^{\infty} \frac{\cos(k + \cos(k))}{2^k} $$

### Όγκος Σφαίρας - Revisited

Αφού εξοικειωθήκαμε με τη χρήση του εργοδικού μέσου, θα τον χρησιμοποιήσουμε για να λύσουμε
το πρόβλημα του υπολογισμού του όγκου της Ν-διάστατης μπάλας. Υπενθυμίζουμε τη βασική ιδέα. Αν

$$D_d=\{(x_1,\ldots,x_d)\in\mathbb{R}^d: x_1^2+x_2^2+\cdots+x_d^2<1\}$$

είναι η μοναδιαία μπάλα σε $d$ διαστάσεις και 

$$C_{d}=D_{d-1}\times (-1,1)$$

ένας κύλινδρος σε $d$ διαστάσεις με βάση $D_{d-1}$ και ύψος 2, τότε

$$\frac{|\, D_{d}\,|}{|\, C_{d}\,|}=\frac{|\, D_{d}\,|}{2|\, D_{d-1}\,|}=\frac{\omega(d)}{2\,\omega(d-1)}.$$

Επομένως, αν με κάποιον τρόπο μπορούμε να εκτιμήσουμε αριθμητικά το αριστερό μέλος, αυτόματα έχουμε μια εκτίμηση 
για τον λόγο $\omega(d)/\omega(d-1)$. Επειδή είναι άμεσο ότι $\omega(1)=2$, η παραπάνω παρατήρηση μπορεί να μας βοηθήσει να υπολογίσουμε επαγωγικά τον όγκο $\omega(d)$ ακόμα και για μεγάλα $d$.

Στο προηγούμενο εργαστήριο εκτιμήσαμε τον λόγο $\frac{|\, D_{d}\,|}{|\, C_{d}\,|}$ παίρνοντας $N$ ανεξάρτητα τύχαια σημεία στον κύλινδρο $C_{d}$ και μετρώντας πόσα (nhits) από αυτά έπεσαν μέσα στη μπάλα $D_{d}$. Η πιθανότητα ένα σημείο ομοιόμορφα επιλεγμένο από τον κύλινδρο $C_{d}$ να πέσει μέσα στη μπάλα $D_{d}$ είναι $\frac{|\, D_{d}\,|}{|\, C_{d}\,|}$. Επομένως,  **ο νόμος των μεγάλων αριθμών** μας εξασφαλίζει ότι το ποσοστό nhits/$N$, όταν το πλήθος των σημείων $N$ είναι μεγάλο είναι μια καλή εκτίμηση του λόγου $\frac{|\, D_{d}\,|}{|\, C_{d}\,|}$. 

Προκειμένου να πάρουμε ένα σημείο τυχαία επιλεγμένο από τον κύλινδρο αρκεί να διαλέξουμε τις πρώτες $d$ συντεταγμένες ομοιόμορφα από τον δίσκο $D_{d-1}$ και την τελευταία συντεταγμένη ομοιόμορφα από το (-1,1). Το δεύτερο είναι μια απλή εντολή. Για να πετύχουμε το πρώτο θεωρήσαμε μια μαρκοβιανή αλυσίδα στη μπάλα $D_{d-1}$ με αναλλοίωτη κατανομή την ομοιόμορφη στην μπαλα $D_{d-1}$ και την αφήσαμε να τρέξει για αρκετά (n) βήματα ώστε να έρθει κοντά στην ισορροπία. Επομένως χρειάστηκε να κάνουμε συνολικά $nN$ βήματα της αλυσίδας: για να πάρουμε καθένα από τα $N$ δείγματα αφήνουμε την αλυσίδα να κάνει $n$ βήματα.

Σε αυτό το εργαστήριο θα χρησιμοποιήσουμε το **εργοδικό θεώρημα** για να υπολογίσουμε τον λόγο $\frac{|\, D_{d}\,|}{|\, C_{d}\,|}$. Συγκεκριμένα, θα φτιάξουμε μια μαρκοβιανή αλυσίδα στον κύλινδρο $C_{d}$ με αναλλοίωτη κατανομή την ομοιόμορφη. Το εργοδικό θεώρημα μας δίνει ότι το ποσοστό του χρόνου που η αλυσίδα ξοδεύει στη μπάλα $D_d$ σε βάθος χρόνου προσεγγίζει το βάρος που δίνει η αναλλοίωτη κατανομή στη μπάλα $D_d$, δηλαδή τον λόγο $\frac{|\,D_d\,|}{|\, C_{d}\,|}$. Προκειμένου να συγκρίνουμε με τα αποτελέσματα που πήραμε από τον νόμο των μεγάλων αριθμών θα αφήσουμε την αλυσίδα στον κύλινδρο $C_{d}$ να κάνει $Μ=nN$ συνολικά βήματα και θα μετρήσουμε σε πόσα από αυτά η αλυσίδα βρέθηκε στη μπάλα $D_d$. 

Προκειμένου να κατασκευάσουμε μια αλυσίδα $\{Y_n\}$ στον κύλινδρο $C_d$ με αναλλοίωτη κατανομή την ομοιόμορφη κατανομή στον κύλινδρο, μπορούμε να πάρουμε μια αλυσίδα $\{X_n\}$ στη μπάλα $D_{d-1}$ με αναλλοίωτη κατανομή την ομοιόμορφη κατανομή στη μπάλα $D_{d-1}$ (όπως αυτή που κατασκευάσαμε στο προηγούμενο εργαστήριο), μια ακολουθία $\{Z_n\}$ από ανεξάρτητες ισόνομες τυχαίες μεταβλητές με ομοιόμορφη κατανομή στο (-1,1) και να ορίσουμε $Y_n=(X_n,Z_n)$. 

## Παραδοτέο 2

(Συνεχίστε *στο ίδιο* jupyter notebook με το παραδοτέο 1)

Υπολογίστε τον όγκο της Ν-διάστατης σφαίρας όπως στο προηγούμενο εργαστήριο αλλά με χρήση του 
εργοδικού μέσου. Συγκεκριμένα, ξεκινώντας από το ότι $\omega(1)=2$ και εκτιμώντας **από το εργοδικό θεώρημα** τον λόγο $|\,D_d\,|/|\,C_d\,|$, υπολογίστε αριθμητικά για $d=2,3,\ldots,100$ τον όγκο $\omega(d)$ της μπάλας σε $d$ διαστάσεις και το % σφάλμα της τιμής που βρήκατε από την θεωρητική τιμή του $\omega(d)$.  Συγκρίνετε τα αποτελέσματα με αυτά που πήρατε στο προηγούμενο εργαστήριο με βάση τον νόμο των μεγάλων αριθμών. Προσοχή! προκειμένου η σύγκριση να είναι δίκαιη, θα πρέπει να ξοδέψετε περίπου τον ίδιο υπολογιστικό χρόνο στα δύο προβλήματα. Έτσι, αν στο προηγούμενο εργαστήριο πήρατε $N$ δείγματα και για να πάρετε καθένα από αυτά τρέξατε την αλυσίδα στη σφαίρα για $n$ βήματα, τώρα θα πρέπει να τρέξετε μία φορά την αλυσίδα στον κύλινδρο για $nN$ βήματα. Ποια από τις δύο προσεγγίσεις δίνει τα μικρότερα σφάλματα σε σχέση με τη θεωρητική τιμή;