---

# Rechnernutzung in der Physik
**Institut für Experimentelle Teilchenphysik**  
Prof. G. Quast, Dr. Th. Chwalek  
WS 2024/25 – Blatt 05

Abgabe: Mo./Di. 13./14. Januar bzw. Mo./Di. 20./21. Januar  

---

Vom 16.12.2024 bis 22.01.2025 läuft die Evaluierung dieser Vorlesung und der zugehörigen Übung. Bitte, nehmen Sie sich kurz Zeit und bewerten Sie Vorlesung und Übung. Die Umfrage finden Sie unter folgenden Links: 

[Link zur Vorlesungs-Umfrage](https://onlineumfrage.kit.edu/evasys/online.php?p=NL6Q6) 

[Link zur Übungs-Umfrage](https://onlineumfrage.kit.edu/evasys/online.php?p=RMLHT) 

---

Auf dem fünften Übungsblatt beschäftigen Sie sich vertieft mit der Parameterschätzung und wenden einen Hypothesentest an, um die Gemeinsamkeit zweier Datensätze zu überprüfen. 

Auf dem vergangenen Übungsblatt haben Sie die Parameterschätzung selbst implementiert, indem Sie eine Kostenfunktion (*Likelihood*) geschrieben, diese an diskreten Stellen eines vorgegebenen Parameterraumes ausgewertet und das Minimum an einer der Stützstellen berechnet haben. Wie Sie aus der Vorlesung oder Ihrer eigenen Erfahrung kennen, weist das Vorgehen an vielen Stellen Optimierungsbedarf auf. Sie könnten viel mehr Stützstellen verwenden, um einen besseren Scan der Likelihood zu erhalten, dann müssen Sie aber viel mehr rechnen, zudem müssen Sie Unsicherheiten berücksichtigen, das Verfahren für alle zukünftigen Herausforderungen verallgemeinern und alles so niederschreiben, dass der Code lesbar und einfach verständlich ist. An dieser Stelle können wir Sie beruhigen, denn all diese Aufgaben haben bereits eine Vielzahl an Menschen für Sie erledigt.

Im Folgenden beschäftigen Sie sich mit einem Minimierungsverfahren, welches Ihnen erlaubt deutlich effizienter ein Minimum in einer Parameterlandschaft zu finden.
Als weitere kleine Aufgabe sollen Sie eine der klassischen Profile-Likelihood-Kurven
analysieren, die Vorhersage der Masse des Higgs-Bosons aus Anpassungen von 
Rechnungen im Rahmen des Standard-Modells der Teilchenpysik and Präzisionsmessungen.
Zum Abschluss wenden sie den *Student'schen-t-Test* an und lernen ein modernes
Verfahren zur Durchführung nicht-parametrischer Tests kennen.

---
# Aufgabe 1: Simulated Annealing <a id="Aufgabe1"></a>
---

Wie Sie in Ihrem Studium möglicherweise bereits erkannt haben, ist das Finden eines Optimums einer hochdimensionalen Kostenfunktion $F(\vec{x})$ eine häufige Fragestellung. Damit Sie eine Vorstellung der Lösungsansätze erhalten, sollen Sie in dieser Aufgabe selbst einen Algorithmus schreiben, der Ihnen dabei hilft, jenes Optimum zu bestimmen. Der Algorithmus ist bei weitem nicht der beste oder schnellste, verdeutlich Ihnen aber den Einsatz von Monte-Carlo-Methoden in der Modernen Physik.<br>
Als Beispiel betrachten Sie die zweidimensionale, modifizierte Rosenbrock-Funktion

$$
F(x,y)=\left(x^2+y-a\right)^2+\left(x+y^2-b\right)^2+c\cdot\left(x+y\right)^2
$$

mit drei Parametern $a$, $b$ und $c$. Die Funktion weist einige lokale Minima, aber immer nur ein globales Minimum auf. Die Bearbeitung der Aufgabe erfolgt für die zufällige Wahl an Startparametern: $a=11$, $b=7$, $c=0.1$.

## a) Implementierung des Algorithmus
In der ersten Teilaufgabe erstellen Sie das Grundgerüst der Minimierung, indem Sie zunächst die modifizierte Rosenbrock-Funktion und anschließend das simulierte Abkühlen als Funktionen definieren. Zur Regulierung der Temperatur wird eine konstante Kühlrate verwendet, die als Parameter des Algorithmus betrachtet wird. Zusätzlich wird eine Schrittweite als Parameter eingeführt, welche die Distanz eines neuen Zustandes zum alten beeinflusst.

In [None]:
# necessary imports

import numpy as np
import matplotlib.pyplot as plt
# initialize random number generator
rng = np.random.default_rng(42)

In [None]:
# ->> to do: Implementierung der modifizierten Rosenbrock-Funktion mit der Signatur
#            modified_rosenbrock_function(x, par)


In [None]:
# ->> to do: Implementierung des Algorithmus für simulated annealing
#  Signatur der Funktion 
#   simulated_annealing(init_vals=[0,0], rosenbrock_pars=[0, 0, 0], init_temp=100, 
#                       final_temp=1, cool_speed=1, step_size=1)

    """
    Minimize the modified Rosenbrock function using simulated annealing.
    
    params:
        init_vals:       Initial x and y values.
        rosenbrock_pars: Parameters of the modified Rosenbrock function.
        init_temp:       Initial temperature the cooling starts from.
        final_temp:      Final temperature of the cooling.
        cool_speed:      Cooling speed in percent of the current temperature.
        step_size:       Step size used in the cooling procedure.
        
    returns:
        min_pars: List of floats.
                    List of the x and y values at the found minimum.
        listOfPoints: List of floats.
                    List of the visited points during the minimization process.
    """


## b) Finden des globalen Minimums
Testen Sie zunächst Ihren Algorithmus aus, indem Sie Startwerte für $x$ und $y$ in der Nähe des globalen Minimums wählen: $(x,y)=(-2, 3)$. Machen Sie sich dabei mit den Eigenschaften der Anfangs- und Endtemperaturen, der Abkühlrate und der Schrittgröße vertraut.

Sobald Sie mit Ihrem Algorithmus zufrieden sind, dieser also zuverlässig gegen das globale Minimum konvergiert, wählen Sie als Startpunkt einen Punkt in einem der Nebenminima (z. B. $(x,y)=(3, -2)$) aus und passen Sie die Parameter des Algorithmus so an, dass er wieder zuverlässig gegen das globale Minimum konvergiert. <br>
Zur korrekten Einstellung der Parameter bietet es sich an, entweder einen Bereich an Parametern systematisch zu untersuchen oder den Einfluss eines jeden Parameters graphisch zu untersuchen. Sie finden einen Vorschlag zur graphischen Untersuchung in den folgenden Zellen. In beiden Fällen bietet es sich jedoch an, sich die Eigenschaften der Algorithmusparameter vorher zu überlegen.

#### Hinweise und Überlegungen:
* Die Anfangs- und Endtemperatur sollen die Kostenfunktionswerte der Anfangsbedingung und des gesuchten Minimums widerspiegeln.
* Die Differenz zwischen Anfangs- und Endtemperatur und die Kühlrate beeinflussen die Anzahl an Iterationen.
* Die Temperaturskala beeinflusst die Wahrscheinlichkeit für Sprünge.
* Die Schrittgröße sollte adäquat im Bezug zum Abstand der Minima gewählt werden. 

In [None]:
# ->> to do: Tunen und Testen des oben implementierten Algorithmus
#     Aufgabe: Konvergenz für den Startpunkt (a = 11, b = 7, c = 0.1) zeigen


**Optional** : grafische Darstellung verchiedener Markov-Ketten, evtl. auch als Animation

In [None]:
import matplotlib.animation
from IPython.display import Image 

%matplotlib notebook

In [None]:
# reset matplotlib figures
plt.clf()
#%matplotlib inline
%matplotlib widget


---
# Aufgabe 2: Interpretation einer Profile-Likeliood-Kurve<a id="Aufgabe2"></a>
---

In dieser kleinen Aufgabe sollen Sie eine berühmte Profile-Likelihood-Kurve auswerten, 
die in der Grafik unten gezeigt ist. Die Kurve stellt das Ergebnis einer $\chi^2$-Anpassung
von Rechnungen im Standard-Modell der Teilchenphysik an Präzisionsmessungen dar. Die damals
(im Frühjahr 2012) noch unbekannte Masse des Higgs-Bosons ist ein freier Parameter in
dieser Anpassung, für den die unten gezeigte Profile-Likelihood bestimmt wurde. 
Bitte beachten, dass gilt $\Delta \chi^2 \,=\, 2\Delta\log\cal{L}_p$.

Die Profile-Likelihood der Higgs-Masse ist in der folgenden Code-Zelle gezeigt;
es handelt sich dabei um die Original-Grafik, der ein Koordinatensystem überlagert wurde. 

In [None]:
# Zelle ausführen

%matplotlib widget 
# - import image library 
from PIL import Image
# - cleaer all figures
plt.clf()
# - load image 
image = np.asarray(Image.open('blueband_Higgs2012.png'))
# print(repr(image))
# - display image in matplotlib Figure
imfig = plt.figure(figsize=(8., 8.))
ax0 = imfig.subplots()
im = ax0.imshow(image)
_ = ax0.axis('off')
# - overlay 2nd axis
ax = imfig.add_axes([0.2642, 0.2435,  0.617, 0.623])
ax.set_xlim(40, 200)
ax.set_xscale('log')
ax.set_ylim(0,6)
ax.patch.set_alpha(0.01)
_ = ax.axis('off')

**Aufgabe**: Bestimme Sie die Werte für $\Delta\chi^2$, die dem $\pm1\,\sigma$-Intervall und
der Obergrenze für die Masse des Higgs-Bosons mit 95% Konfidenzniveau entsprechen.

Zeichnen Sie die entsprechenden Linien in die Grafik oben ein. Lesen Sie die Werte
für das $\pm1\,\sigma$-Intervall und die 95% Obergrenze ab. 

*Hinweis*:  
    Nutzen Sie die Quantile der Gaußverteilung, um zu bestimmen, bei welchem Wert
    von $\Delta\chi^2$ Sie das 95%-Niveau erreichen!  Nutzen Sie dazu die kumulative
    Gaußverteilung im Paket *scipy.stats.norm*, *.cdf()* oder *.ppf()*. Recherchieren
    Sie, was die Funktion *norm.ppf()* bedeutet.  
*Erinnerung aus der Vorlesung:*  
    Ein Wert von $\Delta\chi2 = z^2$ oberhalb des Minimums entspricht einem
    Konifdenz-Intervall von $ \pm z\,\sigma$ einer Gaußverteilung. Die Größe
    $z$ nennt man auch *"$z$-value*".  
    Für eine einseitige Grenze, also den Bereich $[-\infty, \mu + z\,\sigma]$ 
    von 95% könnte man wegen der Symmetrie der Gaußverteilung auch das Quantil 
    $[\mu - z\,\sigma, \mu + z\,\sigma]$ für 90% berechnen. 


In [None]:
# --> to do: Berechen des \Delta\chi^2 Werts für ein 95% einseitiges Limit 
#       Einzeichnen in die Grafik oben


---
# Aufgabe 3: Vergleich von zwei Verteilungen durch *Hypothesentests* <a id="Aufgabe3"></a>
---

In der letzten Aufgabe machen Sie sich an einem einfachen Beispiel klar, wie ein sehr simpler 
Hypothesentest Ihnen dabei helfen kann, eine von Ihnen geforderte Entscheidung zu treffen. Als 
Beispiel dienen zwei Datensätze, *sample1.dat* und *sample2.dat*. Sie sollen die Aussage treffen, 
ob die Datensätze Strichproben aus einer gemeinsamen Grundgesamtheit sind, oder ob sie
unterschiedlich sind. Dazu führt man üblicherweise einen 
[*Studentschen-t-Test*](https://de.wikipedia.org/wiki/Zweistichproben-t-Test#Welch-Test) durch. 
Als auf einen  möglichen Unterschied der beiden Proben empfindliche Prüfgröße (entl.: test statistic) 
verwendet man die Differenz $d$ der Erwartungswerte $\mu_1$ und $\mu_2$ normiert auf deren 
Unsicherheit $\sigma$: 
\begin{align*}
d &= \frac{\left|\mu_1-\mu_2\right|}{\sigma}, \\
\sigma &= \sqrt{\frac{\sigma_1^2}{N_1}+\frac{\sigma_2^2}{N_2}}.
\end{align*}
Dabei geben $\sigma_{1,2}$ bzw. $N_{1,2}$ die Standardabweichung bzw. Größe der Stichproben an.
Die zu überprüfende Nullhypothese $H_0$ **Die Stichproben haben gleiche Erwartungswerte** geht
davon aus, dass $\mu_1\,=\,\mu_2$ gilt. 

Unter der Annahme, dass die Stichproben gaußverteilt sind, ist die Verteilung der Differenzen
der Mittelwerte durch die *Student'sche t-Verteilung* geben, die im Paket *scipy.stats.t*
bereit gestellt wird. 

Für den Hypothesentest wird nun die Prüfgröße, $d_\mathrm{obs}$ der beiden Stichproben
berechnet und das Quantil der *t*-Verteilung für $|d| > |d_ \mathrm{obs}|$ bestimmt. 
Wenn dieses Quantil kleiner als ein vorher festgelegter kritischer Wert $\alpha$ ist, 
wird die Nullhypothese verworfen. Für $\alpha$ wählt man typischerweise Werte von 
10%, 5% oder auch 1%, abhängig davon, wie hoch die Kosten für eine Fehleinschätzung 
im jeweiligen Anwendungsfall ausfallen. Für unser Beispiel wählen wir $\alpha\,=\,0.05$.

## a) Vorbereitung des Hypothesentests

Implementieren Sie eine Funktion zur Berechnung der Größe $d$ und der Anzahl der Freiheitsgrade
 $n_\mathrm{dof}=N_1+N_2-2$. 

In [None]:
# --> to do:  Funktion zur Berechnung der Student'schen Prüfgröße, Signatur der Funktion
#             calc_Student_t(d1,d2):
  '''
    Calculate test statistic t for Student's t-test
    input: d1, d2: 1d numpy-arrays containing the data
    Args: 
     d1, d2: 1d numpy-arrays containing the data
   
    Returns:
     float: value of Student's test
     float: number of degrees of freedom
  '''


**Aufgabe**: Wie immer ist es ratsam, eine grafische Darstellung der Daten zu erzeugen, 
sich einen Überblick zu verschaffen. Lesen Sie die Daten ein und stellen Sie sie als
Histogramme dar. 


In [None]:
# --> to do Daten im CSV-Format einlesen und Datensätze grafisch darstellen


## b) *Studentscher-t-Test*

Berechnen Sie nun die beobachtete Größe $d_\mathrm{obs}$. Stellen Sie die *t*-Verteilung 
graphisch dar und zeichnen Sie den beobachteten Wert ein. Stellen Sie ebenfalls fest, 
ob Sie die Nullhypothese mit einer Irrtumswahrscheinlichkeit von $\alpha=0.05$ verwerfen 
können.

#### Hinweis:
- Im *SciPy*-Paket 
*[scipy.stats.t](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.t.html)* 
sind Methoden zur Berechnung der Verteilungsdichte (*.pdf()*)
  und der kumulativen Verteilungsfunktion (*.cdf()*) implementiert, die Sie im Folgenden 
  verwenden können.


In [None]:
import scipy.stats as stat
import scipy.integrate as integrate

In [None]:
alpha = 0.05
# --> to do Berechnen der Prüfgröße, Einzeichnen des Werts der Prüfgröße 


## c) Nicht-parametrischer Test mit der Bootstrap-Methode

Im Vorgriff auf die nächste Vorlesung soll eine andere, auf dem sogenannten "Bootstrap"-Verfahren
beruhende Methode (im Deutschen auch "Münchhausen-Methode") verwendet, um die Verteilung der
 Prüfgröße zu bestimmen. Eine analytisch, durch Parameter festgelegte Verteilungsdichte
wird dazu nicht benötigt. Die Methode wurde zuerst im Jahr 1979 von B. Efron untersucht.

Bootstrapping ist ein Monte Carlo Verfahren, bei dem sehr häufig Stichproben mit Zurücklegen
aus der ursprünglichen Stichprobe gewürfelt werden. Das Paket *numpy* ermöglicht das
mit der Methode *numpy.choice(data, size)*. 

In der Code-Zelle unten finden Sie eine Illustration. Aus lediglich 30 Datenpunkten wir durch 
10'000-faches Resampling (d.h. "Ziehen mit Zurücklegen") die Verteilung der Mittelwerte und
das zentrale 68,3%-Konfidenzintervall gewonnen! Der Code für das resampling sieht so aus: 

```
# generate multiple samples using Bootstrap method,
#      i.e. by resampling form data itself,
  niter=10000   # draw <niter> samples
  m =  []
  for i in range(niter):
    mi=np.random.choice(d0, size=n).mean()
    m.append(mi) 
  m = np.array(m)
```

Hier das vollständig lauffähige Beispiel, das Sie ausprobieren und verstehen sollten, 
um sich von der Mächtigkeit der Methode zu überzeugen: 

In [None]:
# script bootstrap.py (als Beispiel)
''' 
   Illustrate bootstrap method

.. author:: Guenter Quast <g.quast@kit.edu> 
     fuer den Kurs Rechnernutzung in der Physik
'''
# -------------------------------------------------------------
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stat

import matplotlib.pyplot as plt

def getData(n=100):
  # provide a data sample from uniform distribution
  #return 2*np.random.rand(n)-1.
  return np.random.randn(n)

# Gauss distribution
def fGauss(x, mu=0., sigma=1.):
    return (np.exp(-(x-mu)**2/2./sigma**2)/np.sqrt(2.*np.pi)/sigma)

# -------------------------------------------------------------
#
n=30
d0 = getData(n)

# caculate classical mean and error on mean
mean = d0.mean()
std = np.sqrt( d0.var(ddof=1)/n )
#  

# generate multiple samples using Bootstrap method,
#      i.e. by resampling form data itself,
niter=10000   # draw <niter> samples
m = []
for i in range(niter):
    mi=np.random.choice(d0, size=n).mean()
    m.append(mi) 
m = np.array(m)

# print mean mean
print('*==* Test Bootstrap Method:')
print( '     mean value -/+ std   %.3f :  %.3f'%(mean - std, mean + std) )
print( '*==* Confidence Interval from bootstrap method:')
print( '           68%% CI        %.3f : %.3f'\
         %(np.percentile(m, 16 ),np.percentile(m, 84 )) )
  

# plot data and sample distribution
fig0 = plt.figure('Sample from Gaussian Distribution', figsize=(7.5, 5.))
ax0 = fig0.add_subplot(1,1,1)
x = np.linspace(-3., 3., 200)
ax0.plot(x, fGauss(x), 'r-', label='Normalverteilung')   
ax0.plot(d0, np.ones(len(d0))*0.005, 'b|', markersize=20, label='Stichprobenwerte')
ax0.set_xlabel('x')
ax0.set_ylabel('Gauss(x)')
plt.legend(loc='best')

# plot resampled distribution of mean  
fig = plt.figure('Bootstrap example', figsize=(7.5, 5.))
ax = fig.add_subplot(1,1,1)
bc, be, _ = ax.hist(m, 100, alpha=0.7)
x = np.linspace(-3./np.sqrt(n), 3./np.sqrt(n), 200)
ax.plot(x, (be[1]-be[0])*niter*fGauss(x, mu=mean, sigma=1./np.sqrt(n)), 'r--')   
ax.set_xlabel('distribution of means')
ax.set_ylabel('frequency')
ax.axvline(np.percentile(m,16), color='r', linestyle='--')
ax.axvline(np.percentile(m,84), color='r', linestyle='--')
ax.text(0.45, 0.95, '68% CL', color='darkred',
      transform=ax.transAxes)
plt.show()


**Aufgabe:** Bestimmen Sie mit Hilfe der Bootstrap-Methode den p-Wert für die Hypothese, 
dass beide Verteilungen der gleichen Grundgesamtheit entsprechen. Erzeugen Sie dazu durch 
10'000-faches Resampling aus der Vereinigungsmenge beider Datensätze jeweils 10'000 
Datensätze der Längen $n_1$ und $n_2$ und bestimmen Sie jeweils die Prüfgröße $d_i$. 
Die Prüfgröße ist die gleiche, die auch schon oben im klassischen t-Test verwendet wurde. 

Stellen Sie die Verteilung grafisch dar und bestimmen Sie den p-Wert dafür, einen 
größeren Werd für $d_i$ als den in den Daten tatsächlich beobachteten zu finden. 
Das ist der p-Wert für das Verwerfen der Null-Hypothese.

In [None]:
# --> to do   Mittels Bootstrapping die Verteilung der Prüfgröße d bestimmen
#             p-Wert bzgl. dieser Verteilung bestimmen

# read data if not yet done
# d1 = np.loadtxt('sample1.dat')
# d2 = np.loadtxt('sample2.dat')

