# Blatt 2

## Aufgabe 5

In [None]:
import numpy as np
from numpy import random
import matplotlib.pyplot as plt

uniform = random.uniform(size = 1000)

__a)__ Gleichverteilung auf dem Gebiet $[x_{min}, x_{max}]$:
$$f(x) = \frac{1}{x_{max} - x_{min}}$$
Bilde Verteilungsfunktion $F(x)$:
$$
F(x) = \int_{x_{min}}^{x}f(x') \, dx' = \frac{x - x_{min}}{x_{max} - x_{min}}
$$
Bilde Umkehrfunktion $F^{-1}(y)$:
$$
F^{-1}(y) = (x_{max} - x_{min}) y + x_{min}.
$$
Implementierung und Darstellung:

In [None]:
def uniform_intervall(y, xmin, xmax):
    assert xmax >= xmin
    return xmin + y * (xmax - xmin)

In [None]:
fig, ax = plt.subplots(1, 1)
ax.hist(uniform_intervall(uniform, 42, 44), bins = 20, histtype='step')
ax.set_xlabel('x')
ax.set_ylabel('Counts')
plt.show()

__b)__ Exponentialgesetz: 
$$f(t) = N e^{-\frac{t}{\tau}} = \frac{1}{\tau}e^{-\frac{t}{\tau}}, \quad t \in [0, \infty)$$

Verteilungsfunkion:
$$F(t) = \int_{0}^{t} f(t') \, dt' = (1 - e^{-\frac{t}{\tau}}) $$

Umkehrfunktion:
$$F^{-1}(y) = \tau \, \text{ln}\left(\frac{1}{1 - y}\right) $$
Implementierung: 

In [None]:
def F(y, tau = 1):
    return tau * np.log(1 / (1 - y))

In [None]:
fig, ax = plt.subplots(1, 1)
ax.hist(F(uniform), bins = 30, histtype='step')
ax.set_xlabel(r'$\frac{t}{\tau}$')
ax.set_ylabel('Counts')
plt.show()

__c)__ Potenzgesetz: 
$$f(x) = N x^{-n} = \frac{1 - n}{x_{max}^{1-n} - x_{min}^{1-n} } x^{-n}, \quad x \in [x_{min}, x_{max}], n \geq 2$$
Verteilungsfunktion: 
$$F(x) = \int_{x_{min}}^{x} f(x') \, dx' = \frac{x^{1-n} - x_{min}^{1-n}  }{ x_{max}^{1-n} - x_{min}^{1-n} }$$

Umkehrfunktion: 
$$  F^{-1}(y) = \left\{ \left(x_{max}^{1-n} - x_{min}^{1 - n}\right)y + x_{min}^{1-n}  \right\}^{\frac{1}{1 - n}}  $$
Implementierung:

In [None]:
def power(y, xmin, xmax, n):
    assert n >= 2
    return ( (xmax**(1-n) - xmin**(1-n)) * y +  xmin**(1-n) )**(1 / (1-n))

In [None]:
fig, ax = plt.subplots(1, 1)
ax.hist(power(uniform, xmin = 1, xmax = 4, n = 5), bins = 30, histtype='step')
ax.set_xlabel('x')
ax.set_ylabel('Counts')
plt.show()

__d)__ Cauchy-Verteilung: 
$$f(x) = \frac{1}{\pi} \frac{1}{1 + x^2}, \quad x \in (-\infty, \infty)$$
Verteilungsfunktion: 
$$  F(x) = \int_{-\infty}^{x} f(x')\, dx'   = \frac{1}{\pi} \left[\text{arctan}(x) + \frac{\pi}{2} \right]$$ 
Umkehrfunktion: 
$$F^{-1}(y) = \text{tan} \left( \pi y - \frac{\pi}{2} \right) $$
Implementierung:

In [None]:
def cauchy(y):
    return np.tan(np.pi * (y - 1/2))

In [None]:
fig, ax = plt.subplots(1, 1)
ax.hist(cauchy(uniform), bins = 500, histtype='step')
ax.set_xlim(-50, 50)
#ax.set_xscale('log')
ax.set_xlabel('x')
ax.set_ylabel('Counts')
plt.show()

__e)__ Verteilung aus empirischem Histogramm mit der 'rejection sampling' Methode

In [None]:
import pandas as pd
hist = pd.read_csv('empirisches_histogramm.csv')
binmids = hist['binmid']
counts = hist['counts']

fig, ax = plt.subplots(1, 1)
ax.errorbar(x = binmids, y = counts, xerr = 0.01, linestyle = '')
ax.set_xlabel('x')
ax.set_ylabel('Counts')
plt.show()

In [None]:
norm = np.sum(counts * 0.2) #bin width is 0.2
norm_counts = counts / norm #normalize data
u1 = random.uniform(size = 10000) #
u2 = random.uniform(size = 10000) #two uniform samples 

In [None]:
def empirical(counts, binmids, u1, u2):
    binindex = u1 // 0.02 #get index of bin that includes u1 values 
    return u1[ [ u2[i] <= counts[binindex[i]] 
                for i in range(len(u1)) ] ]
y = empirical(norm_counts, binmids, u1, u2)    

Von den erzeugten 20000 Zufallszahlen bleiben 4.905% übrig.

In [None]:
fig, ax = plt.subplots(1, 1)
counts, binedges = np.histogram(y, bins = 50)
ax.errorbar(x = (binedges[:-1] + binedges[1:]) * 0.5, y = counts, xerr = np.diff(binedges) * 0.5, linestyle = '')
ax.set_xlabel('x')
ax.set_ylabel('Counts')
plt.show()

__d)__ Die Matrix $M$ ist hier die transponierte derjenigen Rotationsmatrix, die die Inverse der Kovarianzmatrix $B$ diagonalisiert. $B$ ist gegeben durch: 
$$
B = Cov^{-1} = \frac{1}{\sigma_x^2 \sigma_y^2 - \text{Cov}(x, y) } 
\begin{pmatrix} 
    \sigma_y^2 & -\text{Cov}(x, y) \\
    -\text{Cov}(x, y) & \sigma_x^2
\end{pmatrix}.
$$
Das ist die Matrix, die in der quadratischen Form im Exponenten der mehrdim. Gaußverteilung steht. Eine Diagonalisierung entkoppelt also das Problem. Die Diagonalisierte Matrix hat die Eigenwerte auf der Diagonalen stehen. Hierbei handelt es sich um die gesuchten
$\frac{1}{{\sigma'}_x^2}$ und $\frac{1}{{\sigma'}_y^2}$. Die Eigenwerte ergeben sich aus 
$$
\text{det}\left(B - \frac{1}{{\sigma'}_i^2} \cdot 1  \right) \overset{!}{=} 0
$$
durch unspektakuläre Umformungen zu 
$$
\frac{1}{{\sigma'}_{x, y}^2} = \frac{1}{2[\sigma_x^2 \sigma_y^2 - \text{Cov}^2(x, y)]} \left\{\sigma_x^2 + \sigma_y^2 \pm  \left[ \left(\sigma_x^2 - \sigma_y^2\right)^2     + 4 \text{Cov}^2(x, y)\right]^{\frac{1}{2}}\right\}.
$$
Für die hier gegeben Werte kann man das dann ausrechnen: 

In [None]:
def newsig(sigx2, sigy2, cov2):
    return ((0.5 / (sigx2*sigy2 - cov2) * ( sigx2 + sigy2
                 + np.sqrt( 
                     (sigx2 - sigy2)**2
                     + 4 * cov2
                  )))**(-0.5), 
            (0.5 / (sigx2*sigy2 - cov2) * ( sigx2 + sigy2
                 - np.sqrt( 
                     (sigx2 - sigy2)**2
                     + 4 * cov2
                  )))**(-0.5))

In [None]:
mu_x = 4
mu_y = 2
sigx = 3.5
sigy = 1.5
cov = 4.2



gauss_2d = np.random.multivariate_normal([mu_x, mu_y], [[sigx**2, cov], [cov, sigy**2]], 10000)

newsigma = newsig(sigx**2, sigy**2, cov**2)

print('Die transformierten ')


Nun soll die Rotaionsmatrix $M$ bestimmt werden. Eine Rotationsmatrix in 2D ist allgemein gegeben durch 
$$
R = \begin{pmatrix}
cos(\alpha) & -sin(\alpha) \\
sin(\alpha) & cos(\alpha)
\end{pmatrix}.
$$
Die Transformation von Matrizen und Vektoren sähe dann so aus
$$
S' = R^{T} S R, \quad \vec{x}' = R^{T} \vec{x}.
$$
Die Matrix $M$ ist in der Aufgabenstellung andersrum gewählt, sodass angesetzt werden kann 
$$
M = \begin{pmatrix}
cos(\alpha) & sin(\alpha) \\
-sin(\alpha) & cos(\alpha)
\end{pmatrix}.
$$
Von $M$ kann man jetzt fordern, dass sie $B$ diagonalisiert
$$
\begin{pmatrix}
\frac{1}{{\sigma'}_y^2} & 0 \\
0 & \frac{1}{{\sigma'}_x^2}
\end{pmatrix}
\overset{!}{=} 
M B M^{T}.
$$
Das gibt eins nices überbestimmtes Gleichungssystem für den Winkel $\alpha$. Rechnen nur mit dem Eintrag unten links. Das ergibt die Gleichung 
$$
0 \overset{!}{=}  \sigma_y^2 sin(\alpha)cos(\alpha) + \text{Cov}(x, y)(cos^2(\alpha) - sin^2(\alpha)) - \sigma_x^2 sin(\alpha) cos(\alpha)
$$
Da kann man jetzt krasse Trigonometrie Skills rein stecken und erhält
$$
 0 = - \frac{1}{2}sin(2\alpha) (\sigma_x^2 - \sigma_y^2) - \text{Cov}(x, y)cos(2\alpha).
$$
Daraus dann 
$$
\alpha = \frac{1}{2} \text{arctan} \left(-\frac{2\text{Cov}(x, y)}{\sigma_x^2 - \sigma_y^2}\right).
$$

In [None]:
def alpha(cov, sigx2, sigy2):
    return 0.5 * np.arctan(- 2 * cov / (sigx2 - sigy2) )

In [None]:
print(f'alpha ist ca. {alpha(cov, sigx**2, sigy**2) * 180 / np.pi:.3f} Grad')

In [None]:
def rotate(x, alpha): 
    #function that rotates a given vector x by an angle alpha. 
    matrix = np.array([[np.cos(alpha), np.sin(alpha)], 
                       [-np.sin(alpha), np.cos(alpha)]] )
    return matrix.dot(x)

old_x_axis = np.array([1, 0])
old_y_axis = np.array([0, 1])

new_x_axis = rotate(old_x_axis, alpha(cov, sigx**2, sigy**2))
new_y_axis = rotate(old_y_axis, alpha(cov, sigx**2, sigy**2))

def linear_function_from_vector(x, vec, center): 
    # linear funtion along a vector x
    return vec[1] / vec[0] * (x - center[0]) + center[1]



In [None]:
fig, ax = plt.subplots(1, 1, figsize = (20, 20))
ax.set_aspect('equal')

ax.scatter(gauss_2d[:, 0],gauss_2d[:, 1], s=5, alpha = 0.3, label = 'Data')

xlim = ax.get_xlim()
ylim = ax.get_ylim()
ax.set_xlim(xlim)
ax.set_ylim(ylim)
#plt.axes('equal')
xplot = np.linspace(xlim[0], xlim[1], 1000)

new_y_axis_values = linear_function_from_vector(xplot, new_y_axis, (mu_x, mu_y))
new_x_axis_values = linear_function_from_vector(xplot, new_x_axis, (mu_x, mu_y))

ax.plot(xplot, 
        linear_function_from_vector(xplot, new_x_axis, (mu_x, mu_y)), 
        color = 'r', 
        linestyle = '--', 
        label = 'Hauptachsen')
ax.plot(xplot, 
        linear_function_from_vector(xplot, new_y_axis, (mu_x, mu_y)), 
        color = 'r', 
        linestyle = '--')

y = linear_function_from_vector(xplot, new_x_axis, (mu_x, mu_y))
mask = np.sqrt((xplot - mu_x)**2 + (y - mu_y)**2) <= newsigma[1]
ax.plot(xplot[mask], y[mask], linewidth = 5, color = 'k', label = '$\sigma\'$')

y = linear_function_from_vector(xplot, new_y_axis, (mu_x, mu_y))
mask = np.sqrt((xplot - mu_x)**2 + (y - mu_y)**2) <= newsigma[0]
ax.plot(xplot[mask], y[mask], linewidth = 5, color = 'k')

ax.legend()
plt.show()