# Entfaltung: Hands-On

In diesem Hands-On sollen die in den letzten Vorlesungen vorgestellten Grundlagen der Entfaltung anhand eines einfachen Beispiels praktisch demonstriert werden.

In [1]:
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from matplotlib.colors import LogNorm
from tqdm.auto import tqdm

In [2]:
%matplotlib widget

In [3]:
plt.rcParams['image.cmap'] = 'inferno'
plt.rcParams['figure.dpi'] = 100
plt.rcParams['figure.constrained_layout.use'] = True

## Daten einlesen und ansehen

Zunächst wird der "Trainings"-Datensatz eingelesen.

Training meint hier die Berechnung der Antwortmatrix und Detektionseffizienz. 

Diese enthalten sowohl die im echten Experiment verfügbaren Observablen als auch die Wahrheit,
die aus Simulation bekannt ist.

In [4]:
labels_train = pd.read_hdf('training.hdf5', 'labels')
observables_train = pd.read_hdf('training.hdf5', 'observables')

Die Labels in unseren Simulationen beinhalten die Energien und eine Parametrisierung des Tracks (mit den Komponenten $\phi$ und $d$). Zusätzlich existiert noch der Eintrag `noise`, der das Level des Hintergrundrauschens angibt. Dieser ist hier konstant auf 4.5 gesetzt und nicht weiter wichtig.

In [5]:
labels_train.head()

Unnamed: 0,E,phi,d,noise
0,1.110809,2.300641,-0.018607,4.5
1,1.768499,0.825967,-0.207421,4.5
2,3.900696,1.399377,-1.148939,4.5
3,2.352842,1.483698,-0.08006,4.5
4,1.527332,2.743621,-0.475558,4.5


In [6]:
observables_train.head()

Unnamed: 0,px_0_0,px_0_1,px_0_2,px_0_3,px_0_4,px_0_5,px_0_6,px_0_7,px_1_0,px_1_1,...,px_7_7,q_tot,cog_x,cog_y,conc,cov_xx,cov_yy,cov_xy,cov_phi,cov_a
0,11,5,6,5,1,4,9,5,6,6,...,7,322.0,-0.01331,-0.011535,0.034161,0.436,0.453283,0.036226,0.902483,0.407399
1,3,3,4,5,5,3,7,3,5,4,...,5,372.0,0.050691,0.079109,0.032258,0.390891,0.38808,-0.026942,0.811457,0.416464
2,5,3,1,2,2,9,10,11,4,8,...,11,402.0,0.285714,0.022743,0.042289,0.426947,0.424399,-0.002335,1.035102,0.428333
3,2,5,7,4,14,7,2,3,4,5,...,0,374.0,-0.015279,-0.011459,0.048128,0.316148,0.431059,-0.02353,-1.376449,0.311516
4,4,6,6,5,5,2,5,7,6,6,...,4,327.0,-0.010048,-0.053735,0.039755,0.428221,0.38649,0.011131,-1.325768,0.431004


In [7]:
# the first 64 columns have the detector pixels
images_train = observables_train.iloc[:, :64].to_numpy().reshape((-1, 8, 8))

In [8]:
from ipywidgets import interact


fig, ax = plt.subplots()
plot = ax.imshow(images_train[0])
bar = fig.colorbar(plot)


def show_event(event=0):
    plot.set_data(images_train[event])
    plot.autoscale()
    bar.update_normal(plot)
    
interact(show_event, event=(0, len(images_train) - 1))

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

interactive(children=(IntSlider(value=0, description='event', max=545662), Output()), _dom_classes=('widget-in…

<function __main__.show_event(event=0)>

Die Observablen sind einerseits die genauen Ladungswerte für alle Pixel (`px_i_j`), und andererseits eine Anzahl an Features, die im Anschluss an die Simulation anhand der Pixelwerte berechnet wurden. 

Wichtig ist hier zuächst nur die Gesamtladung $Q_\mathrm{tot}$. 

Diese ist besonders stark korreliert mit der ursprünglichen Energie $E$ der Einzelereignisse.

In [9]:
plt.figure()

# geomspace creates bins that are equidistant in log-space
bins_E = np.geomspace(labels_train.E.min(), labels_train.E.max(), 101)
bins_q_tot = np.geomspace(observables_train.q_tot.min(), observables_train.q_tot.max(), 101)

h = plt.hist2d(
    labels_train.E,
    observables_train.q_tot,
    bins=[bins_E, bins_q_tot], 
    norm=LogNorm(),
)

plt.xscale('log')
plt.yscale('log')

plt.xlabel('$E$')
plt.ylabel(r'$Q_\mathrm{tot}$')
plt.colorbar(h[3])
plt.show()

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

Wir lesen nun auch einen Test-Datensatz ein.

Gemessene Daten verfügen nicht wie die Simulationsdaten über Label/Wahrheit, d.h. es gibt nur Observablen.

Die Aufgabe der Entfaltung ist es nun die Verteilung einer Variablen nur durch Kenntnis über die Observablen und über den Detektionsprozess zu ermitteln.

Damit im Anschluss unsere Entfaltung dennoch mit einer Wahrheit verglichen werden kann, werden hier Simulationsdaten verwendet, die die Wahrheit dennoch enthalten.

In [10]:
observables_test = pd.read_hdf('test.hdf5', 'observables')
labels_test = pd.read_hdf('test.hdf5', 'labels')
images_test = observables_test.iloc[:, :64].to_numpy().reshape((-1, 8, 8))

Vergleicht man nun die Verteilungen der Observablen miteinander, so wird klar, dass das simulierte Energiespektrum des Trainingsdatensatzes nicht dem im Testdatensatz entspricht:

In [11]:
plt.figure()

# creates bins that are equidistant in log-space
bins = np.geomspace(observables_test.q_tot.min(), observables_test.q_tot.max(), 21)

plt.hist(observables_train.q_tot, bins=bins, density=True, histtype='step', label='Training')
plt.hist(observables_test.q_tot, bins=bins, density=True, histtype='step', label='Test')


plt.xlabel(r'$Q_\mathrm{tot}$')
plt.yscale('log')
plt.xscale('log')
plt.legend()
plt.show()

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

## Trigger

Um die Detektion von reinen Rausch-Ereignissen zu verringern, ist es notwendig eine Trigger-Bedingung an den Detektor zu stellen, d.h. das Ereignis muss eine gewisse Bedingung erfüllen um als Ereignis gewertet zu werden. Hier wird die Bedingung gestellt, dass für die Gesamtladung $Q_\mathrm{tot} > 385$ gilt. Dies sorgt dafür, dass Hintergrundereignisse weggeschnitten werden, aber auch, dass Ereignisse weggeworfen werden, insbesondere im Niederenergie-Bereich:

In [12]:
q_tot_cut = 385.0


triggered_train = observables_train.q_tot > q_tot_cut
triggered_test = observables_test.q_tot > q_tot_cut


print(f'all events:       {len(observables_train)}')
print(f'Q_tot_min:        {observables_train.q_tot.min()}')
print(f'triggered events: {np.count_nonzero(triggered_train)}')
print(f'ratio:            {np.count_nonzero(triggered_train) / len(observables_train):.1%}')

all events:       545663
Q_tot_min:        321.0
triggered events: 177638
ratio:            32.6%


In [13]:
threshold = 10
n_over_threshold = 10

def trigger(images, threshold, n_over_threshold):
    return np.count_nonzero(images > threshold, axis=(-2, -1)) >= n_over_threshold

triggered_train = trigger(images_train, threshold, n_over_threshold)
triggered_test = trigger(images_test, threshold, n_over_threshold)


print(f'all events:       {len(observables_train)}')
print(f'Q_tot_min:        {observables_train.q_tot.min()}')
print(f'triggered events: {np.count_nonzero(triggered_train)}')
print(f'ratio:            {np.count_nonzero(triggered_train) / len(observables_train):.1%}')

all events:       545663
Q_tot_min:        321.0
triggered events: 109377
ratio:            20.0%


In [14]:
plt.figure()

kwargs = dict(bins=bins_q_tot, histtype='step', )
plt.hist(observables_train.q_tot, label='All Events', **kwargs)
plt.hist(observables_train.q_tot[triggered_train], label='Triggered Events', **kwargs)
# plt.axvline(q_tot_cut, color='C1', label='trigger cut')

plt.xscale('log')
plt.yscale('log')
plt.xlabel(r'$Q_\mathrm{tot}$')

plt.legend()
plt.show()

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

In [15]:
plt.figure()

plt.hist(
    labels_train.E, bins=bins_E,
    histtype='step',
    label='Alle simulierten Ereignisse',
)

plt.hist(
    labels_train.E[triggered_train], bins=bins_E,
    histtype='step',
    label='Vom Trigger akzeptiert'
)

plt.legend()
plt.yscale('log')
plt.xscale('log')
plt.xlabel('$E$')

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

Text(0.5, 0, '$E$')

Es ist von Interesse diese Effekte des Triggers auszugleichen. Bei echten Experimenten muss darüber hinaus von der entfalteten Zählrate auf den eigentlich gesuchten physikalischen Fluss geschlossen werden. Dieses Vorgehen wird als _Akzeptanzkorrektur_ bezeichnet.

# Definition des Binnings für die Entfaltung

Um die Entfaltung mit den hier behandelten Methoden durchzuführen ist es notwendig ein Binning, sowohl für die Zielvariable (hier die Energie), als auch die Observable (hier die Gesamtladung $Q_\mathrm{tot}$)  zu definieren.

In [16]:
n_bins_E = 27
n_bins_qtot = 60

binning_E = np.geomspace(3, 250, n_bins_E + 1)
binning_qtot = np.geomspace(450, 225e3, n_bins_qtot + 1)

## Underflow und Overflow Bins

Um den Fall einzuschließen, dass Ereignisse in keines der so definierten Bins fallen, sollte man Under- und Overflow-Bins definieren. Ein Ereignis liegt innerhalb eines Underflow-Bins, wenn es unterhalb der kleinsten Bingrenze liegt und innerhalb des Overflow-Bins, wenn es oberhalb der größten Bingrenze liegt.

In [17]:
def add_overflow(bins, positive=True):
    new = np.empty(len(bins) + 2)
    new[0] = 0 if positive else -np.inf
    new[1:-1] = bins
    new[-1] = np.inf
    return new

binning_E = add_overflow(binning_E)
binning_qtot = add_overflow(binning_qtot)

# Berechung der Migrationsmatrix

Die Einträge der Migrationsmatrix $\mathrm{A}$ beschreiben wie ein Ereignis aus einem Energie-Bin sich statistisch in Observablenbins wiederfinden wird. D.h, dass der Eintrag $A_{ij}$ die Wahrscheinlichkeit ist, dass ein Ereignis, das im Energiebin $j$ liegt, ebenfalls im Observablenbin $i$ liegt.

Diese Matrix ist eine sogenannte stochastische Matrix, d.h. dass

$$\sum_i A_{ij} = 1$$

Die Migrationsmatrix berechnet man, indem man ausgehend von Simulationen ein zweidimensionales Histogramm bzgl. der gewählten Observablen und Zielvariablen berechnet und dieses anschließend normiert.

In [18]:
observable_train = observables_train.q_tot[triggered_train]
energy_train = labels_train.E[triggered_train]

observable_test = observables_test.q_tot[triggered_test]
energy_test = labels_test.E[triggered_test]

In [19]:
H, *_ = np.histogram2d(
    observable_train,
    energy_train,
    bins=(binning_qtot, binning_E)
)

In [20]:
A = H / np.sum(H, axis=0)

In [21]:
plt.figure()
im = plt.pcolormesh(A)

plt.gca().set_aspect(1)
plt.xlabel('Energie Index')
plt.ylabel('$Q_\mathrm{tot}$ Index')
plt.colorbar(im)
plt.show()

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

## Berechnung der Vektoren $\mathbf{g}$ und $\mathbf{f}$
Ähnlich können auch die Vektoren $\mathbf{g}$ (der Vektor, der die Bininhalte in den Observablenbins enthält) und $\mathbf{f}$ (der Vektor, der die Bininhalte in den Bins der Zielvariablen enthält) berechnet werden. Im Anschluss kann auch geprüft werden, ob die Entfaltungsgleichung 
$$A \cdot \mathbf{f} = \mathbf{g}$$
gültig ist.

In [22]:
g_train, _ = np.histogram(observable_train, binning_qtot)
f_train, _ = np.histogram(energy_train, binning_E)

g_test, _ = np.histogram(observable_test, binning_qtot)
f_test, _ = np.histogram(energy_test, binning_E)

f_train, f_test, g_test, g_test

(array([10317, 16201, 16051, 13657, 11309,  9101,  7161,  5755,  4560,
         3495,  2783,  2070,  1594,  1234,   966,   766,   570,   479,
          322,   258,   159,   145,   113,    81,    61,    45,    27,
           28,    69]),
 array([233, 389, 387, 374, 309, 250, 266, 440, 662, 238, 103,  98,  87,
         64,  55,  36,  30,  21,  15,  12,  13,   8,   9,   9,   6,   6,
          0,   2,  22]),
 array([288, 604, 463, 355, 279, 239, 188, 190, 158, 167, 156, 165, 183,
        141, 101,  55,  49,  32,  32,  24,  34,  25,  19,  21,  15,  10,
         11,  15,  14,  10,   4,   7,   4,   8,   7,   8,   2,   6,   4,
          4,   1,   3,   0,   1,   0,   4,   4,   5,   2,   3,   0,   2,
          1,   4,   2,   0,   1,   0,   0,   0,   2,  12]),
 array([288, 604, 463, 355, 279, 239, 188, 190, 158, 167, 156, 165, 183,
        141, 101,  55,  49,  32,  32,  24,  34,  25,  19,  21,  15,  10,
         11,  15,  14,  10,   4,   7,   4,   8,   7,   8,   2,   6,   4,
          4,   1,   3

In [23]:
plt.figure()

plt.stairs(g_train, lw=5, label='$g$')
plt.stairs(A @ f_train, label='$A \cdot f$')

plt.legend()
plt.yscale('log')
plt.show()

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

## Berechnung der Akzeptanz

Wie zuvor angekündigt ist es interessant die Trigger-bedingten Akzeptanz-Effekte herauszurechnen. Hierzu wird der Vektor $\mathbf{f}$ mit allen Events ohne Berücksichtigung des Triggers berechnet und einmal mit Trigger. Das Verhältnis der einzelnen Einträge dieser Vektoren ist dann die Akzeptanz in diesem Fall.

In [24]:
energy_all = labels_train.E.values
f_untriggered, _ = np.histogram(energy_all, binning_E)

In [25]:
acceptance = f_train / f_untriggered

In [26]:
acceptance

array([0.02529985, 0.53154631, 0.66419763, 0.71803365, 0.76226746,
       0.78019717, 0.80154466, 0.82901181, 0.85425253, 0.86467095,
       0.90327816, 0.91877497, 0.92566783, 0.96481626, 0.982706  ,
       0.98966408, 0.9947644 , 1.        , 1.        , 1.        ,
       1.        , 1.        , 1.        , 1.        , 1.        ,
       1.        , 1.        , 1.        , 1.        ])

In [27]:
e_center = 0.5 * (binning_E[:-1] + binning_E[1:])


plt.figure()
plt.stairs(acceptance[1:-1], binning_E[1:-1])
plt.xscale('log')
plt.xlabel('$E$')
plt.ylabel('Akzeptanz')
plt.axhline(1.0, ls=':', color='k')

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

<matplotlib.lines.Line2D at 0x7f4fe3e32d90>

# Lösung der Entfaltungsgleichung

## Naiver Ansatz: Pseudo-Inverse

Der naivste Ansatz zur Lösung der Entfaltungsgleichung ist die Pseudoinverse:

$$\mathrm A \cdot \mathbf f = \mathbf g \Longleftrightarrow \mathbf f = \mathrm A^+ \mathbf g$$

In [28]:
def plot_unfolding_result(unfolded_hist, legend_title=None):
    fig, ax = plt.subplots()
    
    ax.stairs(unfolded_hist[1:-1], binning_E[1:-1], label='Entfaltung')
    ax.stairs((f_test / acceptance)[1:-1], binning_E[1:-1], label='Wahrheit')
    
    ax.legend(title=legend_title)
    
    ax.set_xscale('log')
    ax.set_yscale('log')
    
    ax.set_xlabel('E')
    ax.set_ylim(0.5, None)
    
    return fig, ax

In [29]:
np.linalg.pinv?

In [30]:
f_est_naive = np.linalg.pinv(A) @ g_test / acceptance

plot_unfolding_result(f_est_naive)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

(<Figure size 640x480 with 1 Axes>, <AxesSubplot:xlabel='E'>)

Deutlich zu sehen sind die starken Oszillationen, die das Ergebnis unbrauchbar machen. 

## Die Likelihood der Entfaltung

Die Bininhalte der Observablenbins sind Zählraten, somit können wir annehmen, dass diese einer Poisson-Statistik folgen:

$$f(g_j|\lambda_j) = \frac{\lambda_j^{g_j}}{g_j!} e^{-\lambda_j}$$

Der Erwartungswert $\lambda_j$ der einzelnen Observablen-Bininhalte lautet gemäß Entfaltungsgleichung

$$\lambda_j = \sum_i A_{ij} f_i = (\mathrm A \cdot \mathbf f)_j$$

Die Likelihood lautet entsprechend

$$\mathcal{L} = \prod_j f(g_j|\lambda_j) = \prod_j \frac{e^{-(\mathrm A \cdot \mathbf f)_j} (\mathrm A \cdot \mathbf f)_j^{g_j}}{g_j!}$$

Aus numerischen Gründen wird im Folgenden stets der negative Logarithmus der Likelihood verwendet:

$$-\log \mathcal{L} = \sum_j \left[(\mathrm A \cdot \mathbf f)_j - g_j\log(\mathrm A \cdot \mathbf f)_j\right]$$

Ebenfalls müssen wir verhindern, dass der Minimierer ungültige Funktionswerte erhält. Statt `nan` oder `inf` sollten immer sehr große, aber valide Werte zurückgegeben werden.

Insbesondere für den Fall das einzelne "Ausreißer" eine Wahrscheinlichkeit von "0" zugeordnet bekommen, verhindert dies vollständig die Minimierung, falls diese nicht durch eine sehr kleine, aber endliche Wahrscheinlichkeit ersetzt werden:

In [31]:
eps = 1e-30
np.log(0), np.log(eps)

  np.log(0), np.log(eps)


(-inf, -69.07755278982137)

In [32]:
def llh_poisson(f, A, g):
    
    # force positive f
    if np.any(f < 0):
        return np.finfo(np.float32).max
    
    lambda_ = A @ f
    
    eps = 1e-30 # to avoid log of 0
    return np.sum(lambda_ - g * np.log(lambda_ + eps))

Um eine solche Likelihood zu minimieren, kann man numerische Minimierer verwendet, so z.B. `scipy.optimize.minimize` oder wie zuletzt `iminuit`:

In [33]:
from iminuit import Minuit
from functools import partial

In [34]:
# use pinv unfolding as initial guess, replacing very small values
x0 = np.clip(np.linalg.pinv(A) @ g_test, 10, np.inf)


m = Minuit(
    partial(llh_poisson, A=A, g=g_test),
    x0,
    # generate names for our parameters
    name=[f"f_{i}" for i in range(n_bins_E + 2)]
)

m.errordef = m.LIKELIHOOD
m.limits = [(0, None) for _ in range(n_bins_E + 2)]

m.migrad()
m.hesse()
m.minos()

Migrad,Migrad.1,Migrad.2,Migrad.3,Migrad.4
FCN = -1.79e+04,FCN = -1.79e+04,Nfcn = 21436,Nfcn = 21436,Nfcn = 21436
EDM = 0.000171 (Goal: 0.0001),EDM = 0.000171 (Goal: 0.0001),,,
Valid Minimum,Valid Minimum,SOME Parameters at limit,SOME Parameters at limit,SOME Parameters at limit
Below EDM threshold (goal x 10),Below EDM threshold (goal x 10),Below call limit,Below call limit,Below call limit
Covariance,Hesse ok,Accurate,Pos. def.,Not forced

0,1,2,3,4,5,6,7,8
,Name,Value,Hesse Error,Minos Error-,Minos Error+,Limit-,Limit+,Fixed
0.0,f_0,200,60,-60,60,0,,
1.0,f_1,470,100,-100,100,0,,
2.0,f_2,390,90,-90,90,0,,
3.0,f_3,360,80,-80,80,0,,
4.0,f_4,270,70,-70,70,0,,
5.0,f_5,270,70,-70,70,0,,
6.0,f_6,240,70,-70,70,0,,
7.0,f_7,440,70,-70,70,0,,
8.0,f_8,700,60,-60,60,0,,

0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58
,f_0,f_0,f_1,f_1,f_2,f_2,f_3,f_3,f_4,f_4,f_5,f_5,f_6,f_6,f_7,f_7,f_8,f_8,f_9,f_9,f_10,f_10,f_11,f_11,f_12,f_12,f_13,f_13,f_14,f_14,f_15,f_15,f_16,f_16,f_17,f_17,f_18,f_18,f_19,f_19,f_20,f_20,f_21,f_21,f_22,f_22,f_23,f_23,f_24,f_24,f_25,f_25,f_26,f_26,f_27,f_27,f_28,f_28
Error,-60,60,-100,100,-90,90,-80,80,-70,70,-70,70,-70,70,-70,70,-60,60,-40,50,-33,34,-34,36,-31,32,-24,26,-25,27,-17,19,-3.3,17.6,-16,17,-13,15,-10,13,-1.1e-6,2493007.1e-6,-1.3e-6,3309223.2e-6,-10,10,-5,7,-6,8,-5,7,-1.0e-6,1584117.8e-6,-0.4,7.6,-5,5
Valid,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True,True
At Limit,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,True,False,False,False,False,False,False,False,True,False,True,False,False,False,False,False,False,False,True,False,True,False,True,False,False,False
Max FCN,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
New Min,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False

0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29
,f_0,f_1,f_2,f_3,f_4,f_5,f_6,f_7,f_8,f_9,f_10,f_11,f_12,f_13,f_14,f_15,f_16,f_17,f_18,f_19,f_20,f_21,f_22,f_23,f_24,f_25,f_26,f_27,f_28
f_0,3.6e+03,-4.74e+03 (-0.807),2.14e+03 (0.399),-1.05e+03 (-0.225),258 (0.064),-81.9 (-0.020),-1.24 (-0.000),19 (0.005),48.3 (0.013),0.0255 (0.000),14.8 (0.007),-13 (-0.006),9.99 (0.005),1.28 (0.001),0.88 (0.001),0.0755 (0.000),-1.3 (-0.001),-0.267 (-0.000),-0.285 (-0.000),-0.386 (-0.001),-4.31e-07,3.14e-07,0.0923 (0.000),0.0551 (0.000),-0.0244 (-0.000),0.0309 (0.000),1.71e-07,-0.00426 (-0.000),0.0196 (0.000)
f_1,-4.74e+03 (-0.807),9.59e+03,-6.13e+03 (-0.698),2.5e+03 (0.328),-796 (-0.121),172 (0.026),-88.8 (-0.013),46.2 (0.007),-126 (-0.020),56.8 (0.013),-35.7 (-0.011),23.1 (0.007),-5.17 (-0.002),-2.89 (-0.001),-0.65 (-0.000),2.17 (0.001),4.01 (0.002),-1.12 (-0.001),-0.554 (-0.000),0.415 (0.000),-7.59e-07,4.2e-08,-0.386 (-0.000),-0.075 (-0.000),-0.0824 (-0.000),0.00164 (0.000),-3.7e-08,0.0223 (0.000),-0.00832 (-0.000)
f_2,2.14e+03 (0.399),-6.13e+03 (-0.698),8.03e+03,-4.59e+03 (-0.657),1.29e+03 (0.214),-401 (-0.067),140 (0.023),-207 (-0.034),145 (0.025),-47.2 (-0.012),6.13 (0.002),8.8 (0.003),-7.85 (-0.003),4.52 (0.002),5.84 (0.002),-2.66 (-0.002),-2.45 (-0.002),1.99 (0.001),-0.17 (-0.000),-0.228 (-0.000),1.38e-07,1.41e-06,0.126 (0.000),-0.0803 (-0.000),0.108 (0.000),-0.19 (-0.000),1.75e-07,0.141 (0.000),-0.00379 (-0.000)
f_3,-1.05e+03 (-0.225),2.5e+03 (0.328),-4.59e+03 (-0.657),6.07e+03,-2.91e+03 (-0.555),674 (0.129),-272 (-0.051),65.5 (0.012),-89 (-0.018),-32.6 (-0.010),18 (0.007),-24 (-0.009),1.27 (0.001),2.93 (0.001),-22.1 (-0.011),11.1 (0.008),9.06 (0.007),0.861 (0.001),-1.02 (-0.001),0.0642 (0.000),6.76e-07,-2.67e-06,-1.64 (-0.002),0.103 (0.000),-0.334 (-0.001),0.123 (0.000),-5.37e-07,-0.00654 (-0.000),-0.00235 (-0.000)
f_4,258 (0.064),-796 (-0.121),1.29e+03 (0.214),-2.91e+03 (-0.555),4.54e+03,-2.35e+03 (-0.519),562 (0.123),-282 (-0.061),9.01 (0.002),-41.6 (-0.014),-2.89 (-0.001),-1.56 (-0.001),-11 (-0.005),0.223 (0.000),13.3 (0.008),-11.4 (-0.009),-5.73 (-0.005),6.59 (0.006),1.41 (0.001),1.43 (0.002),4.98e-07,1.44e-06,0.256 (0.000),-0.467 (-0.001),0.398 (0.001),-0.439 (-0.001),-4.18e-07,0.348 (0.001),-0.126 (-0.000)
f_5,-81.9 (-0.020),172 (0.026),-401 (-0.067),674 (0.129),-2.35e+03 (-0.519),4.49e+03,-2.5e+03 (-0.551),528 (0.115),-264 (-0.061),23.9 (0.008),-0.881 (-0.000),-27.7 (-0.012),26 (0.012),-15.6 (-0.009),-13.5 (-0.008),10 (0.008),-14.4 (-0.013),3.15 (0.003),5.33 (0.006),0.367 (0.000),1.35e-06,-5.85e-06,0.27 (0.000),0.245 (0.001),0.136 (0.000),0.38 (0.001),-1.43e-07,-0.387 (-0.001),-0.0402 (-0.000)
f_6,-1.24 (-0.000),-88.8 (-0.013),140 (0.023),-272 (-0.051),562 (0.123),-2.5e+03 (-0.551),4.58e+03,-2.3e+03 (-0.497),237 (0.055),-94.4 (-0.032),0.657 (0.000),-32.2 (-0.014),-0.017 (-0.000),-25.2 (-0.015),59.1 (0.033),-31 (-0.025),6.89 (0.006),-17.7 (-0.015),13.3 (0.014),-0.94 (-0.001),5.63e-06,6.8e-06,2.18 (0.003),-0.589 (-0.001),0.353 (0.001),-0.0702 (-0.000),4.12e-07,-0.0538 (-0.000),-0.393 (-0.001)
f_7,19 (0.005),46.2 (0.007),-207 (-0.034),65.5 (0.012),-282 (-0.061),528 (0.115),-2.3e+03 (-0.497),4.68e+03,-2.25e+03 (-0.513),228 (0.076),-63.5 (-0.028),0.714 (0.000),3.05 (0.001),-10.8 (-0.006),-21.8 (-0.012),8.57 (0.007),-0.53 (-0.000),5.13 (0.004),-13 (-0.013),6.22 (0.008),9.68e-07,-1.64e-05,3.34 (0.005),-0.32 (-0.001),-0.715 (-0.002),0.292 (0.001),-1.35e-06,-0.758 (-0.002),0.532 (0.001)
f_8,48.3 (0.013),-126 (-0.020),145 (0.025),-89 (-0.018),9.01 (0.002),-264 (-0.061),237 (0.055),-2.25e+03 (-0.513),4.11e+03,-1.22e+03 (-0.431),154 (0.072),-7.65 (-0.003),-70.6 (-0.035),42.1 (0.026),-35.8 (-0.021),15.1 (0.013),6.2 (0.006),-4.07 (-0.004),-3.4 (-0.004),-5.06 (-0.007),1.08e-05,6.97e-06,-1.04 (-0.002),1.47 (0.004),-0.235 (-0.001),0.304 (0.001),8.44e-07,-0.324 (-0.001),0.249 (0.001)


In [35]:
plot_unfolding_result(m.values / acceptance)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

(<Figure size 640x480 with 1 Axes>, <AxesSubplot:xlabel='E'>)

### Regularisierung

Zuletzt fügen wir die Annahme hinzu, dass unsere Lösung _glatt_ sein soll. Dazu definieren wir eine Matrix, die die numerische zweite Ableitung repräsentiert:

$$C = \begin{bmatrix}
1 & -1 & 0 & \dots \\
-1 &  2 & -1 & \dots \\
0 & -1 & \ddots & & \vdots & \vdots \\
\vdots & \vdots & & \ddots & -1 & 0 \\
& & \dots & -1 & 2 & -1\\
& & \dots & 0 & -1 & 1\\
\end{bmatrix}
$$

In [36]:
from functools import lru_cache

@lru_cache()
def C_matrix(n):
    I = np.eye(n)
    C = 2.0 * I - np.roll(I, 1) - np.roll(I, -1)
    return C

In [37]:
C_matrix(5)

array([[ 1., -1.,  0.,  0.,  0.],
       [-1.,  2., -1.,  0.,  0.],
       [ 0., -1.,  2., -1.,  0.],
       [ 0.,  0., -1.,  2., -1.],
       [ 0.,  0.,  0., -1.,  1.]])

In [38]:
%timeit C_matrix(5)

60.7 ns ± 5.39 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


Eine besonders glatte Kurve, so kann man annehmen, soll nun über eine kleine zweite Ableitung verfügen, d.h. wir addieren den Term

$$\mathcal{L}_\mathrm{tik} = \tau \sum_j |C_{ji} f_i|^2 = \tau \ \mathbf f^\top \mathrm C^\top \mathrm C \ \mathbf f$$
zur bestehenden Likelihood hinzu. Den offenen Parameter $\tau$ bezeichnen wir dabei als Regularisierungsstärke. Je größer er ist, desto stärker wird Nicht-Glattheit bestraft.

Da die erwartete Flusskurve hier einem Potenzgesetz folgt, kann die Bedingung, dass die zweite Ableitung möglichst klein werden muss besonders gut in der doppelt-logarithmischen Darstellung gerechtfertigt werden: Das Potenzgesetz wird hier zu einem linearen Zusammenhang:

$$\mathcal{L}_\mathrm{tik} = \tau \sum_j |C_{ji} f_i|^2 = \tau \log (\mathbf f)^\top \mathrm C^\top \mathrm C \log (\mathbf f)$$

In [None]:
def tikhonov_reg(f, tau, acceptance): 
    eps = 1e-30
    
    # we ignore under and overflow for the regularization
    C = C_matrix(len(f) - 2)
    
    # we regularize on the log of f with acceptance correction,
    # since only that is expected to be flat
    flat_f = np.log(f[1:-1] / acceptance[1:-1] + eps)
    return tau * np.sum((C @ flat_f) ** 2)


def llh_poisson_tikhonov(f, A, g, tau, acceptance):  
    if np.any(f < 0):
        return np.finfo(np.float32).max
        
    return llh_poisson(f, A, g) + tikhonov_reg(f, tau, acceptance)

In [None]:
tau_regularization = 0.1

In [None]:
# use pinv unfolding as initial guess
x0 = np.clip(np.linalg.pinv(A) @ g_test, 10, np.inf)

m = Minuit(
    partial(llh_poisson_tikhonov, A=A, g=g_test, tau=tau_regularization, acceptance=acceptance),
    x0,
    name=[f"f_{i}" for i in range(n_bins_E + 2)]
)

m.errordef = m.LIKELIHOOD
m.limits = [(0, None) for _ in range(n_bins_E + 2)]

m.migrad()
m.hesse()
m.minos()

In [None]:
plot_unfolding_result(m.values / acceptance)

Natürlich kann diese Regularisierung auch auf die SVD Entfaltung angewendet werden. Dabei ergibt sich der Lösungsvector

$f = (A^TA + \tau\, C^TC)^{-1} A^T \mathbf g$

und im Vergleich zu der naiv invertierten Lösung oszilliert das Ergebnis schon deutlich weniger.

In [None]:
A_inv = np.linalg.pinv(A.T @ A + tau_regularization * C_matrix(A.shape[1]).T @ C_matrix(A.shape[1])) @ A.T

plot_unfolding_result(A_inv @ g_test / acceptance)

## Variation des Regularisierungsparameters

Die Entfaltung enthält den Parameter $\tau$, über den zunächst nichts weiter bekannt ist. Man 
kann feststellen, dass der Parameter die Glattheit der Lösung der Entfaltung bestimmt. Der kleine Resonanz-Peak in den Test-Daten bspw. löst sich abhängig von $\tau$ verschieden gut auf:

In [None]:
def unfold(tau):
    m = Minuit(
        partial(llh_poisson_tikhonov, A=A, g=g_test, tau=tau, acceptance=acceptance),
        x0,
        name=[f"f_{i}" for i in range(n_bins_E + 2)]
    )

    m.errordef = m.LIKELIHOOD
    m.limits = [(0, None) for _ in range(n_bins_E + 2)]

    m.migrad()
    m.hesse()
    
    return m

In [None]:
plot_unfolding_result(unfold(0.5).values / acceptance)

### Minimum der globalen Korrelation

Eine Möglichkeit, einen "optimalen" Regularisierungsparameter zu bestimmen, ist die globale Korrelation des Ergebnisses zu minimieren.

`iminuit` liefert mithilfe der Hesse-Matrix die Covarianz-Matrix $\mathrm{Cov}(f)$ des Entfaltungsergebnisses.

Hieraus lässt sich die Globale Korrelation jedes Eintrags berechnen:

$$
\rho_j = \sqrt{1 - \mathrm{Cov}(f)_{jj} \cdot (\mathrm{Cov}(f)^{-1})_{jj}}
$$

Und der Mittelwert über alle Einträge wird minimiert durch einen "groben" Scan über verschiedene $\tau$

In [None]:
taus = np.geomspace(0.01, 10, 100)

def mean_global_correlation(cov):
    cov_inv = np.linalg.inv(cov)
    return np.mean(
        np.sqrt(1 - 1 / (np.diag(cov) * np.diag(cov_inv)))
    )


results = []
x0 = np.clip(np.linalg.pinv(A) @ g_test, 10, np.inf)

for tau in tqdm(taus):
    results.append(unfold(tau))
    
global_correlations = [mean_global_correlation(m.covariance) for m in results]

In [None]:
plt.figure(constrained_layout=True)
plt.plot(taus, global_correlations, 'o')

plt.xlabel(r'$\tau$')
plt.ylabel('Mean Correlation')
plt.xscale('log')

In [None]:
best_idx = np.argmin(global_correlations)
best_tau = taus[best_idx]
best_fit = results[best_idx]

fig, ax =plot_unfolding_result(best_fit.values / acceptance)
ax.set_title(rf'Unfolding with $\tau={best_tau:.2f}$')

# Abschätzung der Unsicherheiten

Wie immer in der Physik sind auch hier Messungen ohne Kenntnis über die Unsicherheiten von geringem Nutzen.

Oben haben wir bereits die Kovarianzmatrix der Fit-Parameter über die Hesse-Matrix aus imiuit bekommen.
Ebenso können wieder Likelihood-Scans mit der `minos` Methode durchgeführt werden.

Alternativ implementieren wir hier (hauptsächlich zur Wiederholung) einen MCMC-Ansatz.


Für das MCMC kann man eine simple Implementierung des Metropolis-Algorithmus verwenden. Als Resultat erhalten wir so eine Anzahl von Stichproben aus der Likelihood (die a-posteriori-Verteilung). Diese kann man nutzen um mittels eines Bayesianischen Ansatzes Aussagen über die Unsicherheit der Schätzung zu treffen.

In [None]:
emcee

In [None]:
def mcmc(x0, fun, step_size=1.5, n_steps=10000, print_acceptance=False):
    x = [x0]
    f = [fun(x0)]
    acc = 0
   
    for _ in tqdm(range(n_steps)):
        x_new = x[-1] + step_size * np.random.randn(len(x0))
        f_new = fun(x_new)
    
        prop_eval = -np.log(np.random.rand()) > (f_new - f[-1])
        
        if prop_eval:
            x.append(x_new)
            f.append(f_new)
            acc += 1
        else:
            x.append(x[-1])
            f.append(f[-1])
            
    if print_acceptance:
        print(f'{acc / n_steps:.2%} of proposed steps accepted.')
        
    return np.array(x), np.array(f)

In [None]:
from functools import partial

function = partial(llh_poisson_tikhonov, A=A, g=g_test, tau=0.43, acceptance=acceptance)

m = Minuit(
    function,
    x0,
    name=[f"f_{i}" for i in range(n_bins_E + 2)]
)

m.errordef = m.LIKELIHOOD
m.limits = [(0, None) for _ in range(n_bins_E + 2)]

m.migrad()
m.hesse()

    
x_sample, f_sample = mcmc(np.array(m.values), function, step_size=0.05 * f_test, n_steps=100000, print_acceptance=True)

Die Unsicherheit des Entfaltungsergebnisses kann nun bspw. durch die Angabe von Quantilen visualisiert werden.

(Dies ist nicht die einzige Möglichkeit, siehe Vorlesung)

In [None]:
from scipy.stats import norm

norm(0, 1).cdf(1)

In [None]:
plt.figure()

plt.fill_between(
    np.arange(n_bins_E + 1),
    (np.quantile(x_sample, norm.cdf(-1), axis=0) / acceptance)[1:],
    (np.quantile(x_sample, norm.cdf(1), axis=0) / acceptance)[1:],
    alpha=0.2,
    step='post'
)


plt.stairs(
    (np.median(x_sample, axis=0) / acceptance)[1:-1],
    label='Median'
)


plt.stairs((f_test / acceptance)[1:-1], label='Wahrheit')
plt.stairs((m.values / acceptance)[1:-1], label='Entfaltung')
plt.legend()
plt.yscale('log')

In [None]:
plt.figure()

bins_samples = np.geomspace(x_sample.min(), x_sample.max(), 101)

h = plt.hist2d(
    np.tile(np.arange(n_bins_E + 2), (len(x_sample), 1)).flatten(),
    x_sample.flatten(),
    bins=(np.arange(n_bins_E + 2), bins_samples),
    norm=LogNorm()
)

plt.stairs(f_test, label='Wahrheit')
plt.stairs(m.values, label='Entfaltung')

plt.yscale('log')
plt.colorbar(h[3])
plt.show()

In [None]:
bin_idx = 8

plt.figure()
plt.hist(x_sample[:, bin_idx], bins=np.geomspace(x_sample[:, bin_idx].min(), x_sample[:, bin_idx].max(), 100))
plt.axvline(f_test[bin_idx], color='C1')
plt.xscale('log')

In [None]:
bin1_idx = 9

plt.figure()
plt.scatter(
    x_sample[:, bin_idx],
    x_sample[:, bin_idx + 1],
    s=5, alpha=0.1, linewidth=0,
)
plt.xscale('log')
plt.yscale('log')


plt.matshow(np.corrcoef(x_sample.T), cmap='RdBu_r', vmin=-1, vmax=1)