In [None]:
import numpy as np
import matplotlib.pyplot as plt
import math

Generieren Sie $N=1000$ Zufallszahlen $x_i$, die gemäß einer Gaussverteilung 
\begin{equation}
P(x) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} 
\end{equation} 
mit Mittelwert $\mu=5$ und Standardabweichung $\sigma=2$ verteilt sind. Stellen Sie diese Zahlen in einem Histogramm dar und verifizieren Sie grafisch, dass sich die Verteilung der tatsächlichen Verteilungsfunktion $P(x)$ annähert.

In [None]:
samples = 1000 # Number of Samples
sigma = 2
mu = 5

# Uniform distribution
normal_numbers = sigma * np.random.randn(samples) + mu

x_vec=np.linspace(-5,15,201)
dist_normal=1/np.sqrt(2*np.pi*sigma**2)*np.exp(-(x_vec-mu)**2/(2*sigma**2))

n_bins = 40
plt.figure(dpi = 100)
plt.plot(x_vec,dist_normal)
plt.hist(normal_numbers, bins=n_bins,density=True)
plt.xlabel(r'$x$ ', fontsize = 20)
plt.ylabel(r'$P(x)$ ', fontsize =20)
plt.tick_params(axis='both', which='major', labelsize=16)
plt.show()


Erzeugen Sie einen Satz von $N\times M$ im Intervall $[1,3]$ gleich-verteilten Zufallszahlen $x_{i,m}$. Verifizieren Sie, dass für große $N$ der Mittelwert $\mu_x\simeq 2$ und die Standardabweichung $\sigma_x\simeq0.6$ dieses Ensembles den exakten Werten für diese Verteilung entsprechen.   


Generieren Sie aus diesem Ensemble die neuen Zufallszahlen
\begin{equation}
y_i= \sum_{j=1}^M x_{i,j},
\end{equation}
die jeweils der Summe von $M$ gleich-verteilten Zufallsvariablen entsprechen. Verifizieren Sie damit graphisch den zentralen Grenzwertsatz, der besagt, dass für große $M$ die Werte der $y_i$ einer Gaussverteilung folgen, mit Mittelwert $\mu_y= M \mu_x$ und einer Standardabweichung $\sigma_y = \sqrt{M} \sigma_x$.

In [None]:
N, M = 100, 100
samples = N * M

# Gleichverteilte Zufallszahlen
normal_numbers_flat = 2 * np.random.rand(samples) + 1
normal_numbers = normal_numbers_flat.reshape((N,M))

# Mittelwert
mu_x = sum(normal_numbers_flat) / (N*M)
print("\u03BC = {mu}".format(mu=round(mu_x,1)))

# Standardabweichung
sigma_x = np.sqrt(sum((normal_numbers_flat - mu_x)**2) / (N*M))
print("\u03C3 = {sigma}".format(sigma=round(sigma_x,1)))

# Die summierten Zufallszahlen
Ys = sum(normal_numbers.T)

# Analytische Verteilung mit mu_y, sigma_y
mu_y = mu_x * M
sigma_y = np.sqrt(M) * sigma_x
x_vec=np.linspace(mu_y - 50, mu_y + 50, 201)
dist_normal=1/np.sqrt(2*np.pi*sigma_y**2)*np.exp(-(x_vec-mu_y)**2/(2*sigma_y**2))

n_bins = 20
plt.figure(dpi = 100)
plt.plot(x_vec,dist_normal, label='Normalverteilung mit \n \u03BC={mu}, \u03C3={sigma}'.format(mu=round(mu_y,1), sigma=round(sigma_y,1)))
plt.hist(Ys, bins=n_bins,density=True)
plt.xlabel(r'$x$ ', fontsize = 20)
plt.ylabel(r'$P(x)$ ', fontsize =20)
plt.tick_params(axis='both', which='major', labelsize=16)
plt.legend()
plt.show()

In der Einleitungsvorlesung wurde gezeigt, dass sich die Binomialverteilung
\begin{equation}
w_N(N_1)= \frac{N!}{N_1! (N-N_1)!} p_1^{N_1} (1-p_1)^{(N-N_1)}   
\end{equation} 
für große $N$ und $N_1$ durch die Gaussverteilung
\begin{equation}
P(x) = \frac{1}{\sqrt{2\pi N p_1(1-p_1)}} e^{-\frac{(N_1-p_1N)^2}{2Np_1(1-p_1)}}
\end{equation} 
genähert werden kann. Verifizieren Sie diese Resultat numerisch.  

In [None]:
N = 200
p1 = 0.5
q1 = (1 - p1)
x_vec = np.linspace(0,N,N+1)

def binom_dist(N1):
    N1 = int(N1)
    prob = math.factorial(N)/ (math.factorial(N1) * (math.factorial(N-N1)))* p1**(N1) * q1**(N-N1)
    return prob

def norm_dist(x):
    prob = 1/np.sqrt(2*np.pi*N*p1*q1)*np.exp(-(x-p1*N)**2/(2*N*p1*q1))
    return prob

binom_vals = [binom_dist(i) for i in x_vec]
norm_vals = [norm_dist(i) for i in x_vec]

plt.figure(dpi = 100)
plt.plot(x_vec, binom_vals, '.', label = 'Binomial Dist.')
plt.plot(x_vec, norm_vals, '--', label = 'Normal Dist.')
plt.xlabel(r'$x$ ', fontsize = 20)
plt.ylabel(r'$P(x)$ ', fontsize =20)
plt.tick_params(axis='both', which='major', labelsize=16)
plt.legend()
plt.show()

In [None]:
### Differenz zwischen Binominal und Normalverteilung

def binom_dist(N1):
    N1 = int(N1)
    # print(N1)
    prob = math.factorial(N)/ (math.factorial(N1) * (math.factorial(N-N1)))* p1**(N1) * q1**(N-N1)
    return prob

def norm_dist(x):
    prob = 1/np.sqrt(2*np.pi*N*p1*q1)*np.exp(-(x-p1*N)**2/(2*N*p1*q1))
    return prob

Nlist = [i*2 + 2 for i in range(30)]
diff_list = []
for N in Nlist:
    p1 = 0.5
    q1 = (1 - p1)
    x_vec = np.linspace(0,N,N+1)
    binom_vals = np.asarray([binom_dist(i) for i in x_vec])
    norm_vals = np.asarray([norm_dist(i) for i in x_vec])
    diff = sum(binom_vals - norm_vals)
    diff_list.append(diff)

plt.figure(dpi = 100)
plt.plot(Nlist, diff_list, '.')
plt.xlabel(r'Verteilungsgröße N ', fontsize = 20)
plt.ylabel(r'$\Delta P = P_{binom} - P_{norm}$ ', fontsize =20)
plt.tick_params(axis='both', which='major', labelsize=16)
plt.yscale('log')
plt.show()