# Labbuppgift: mäta Z-bosonens massa

## 1.1 Introduktion
   
Börja med att läsa igenom introduktionsmaterialet om ATLAS-experimentet och hur dess detektorer används för att mäta och rekonstruera vad som händer i proton-proton-kollisionerna som Large Hadron Collider skapar. Om inte [notebook 1a](1a-Introduction-information.ipynb) fungerar så finns informationen även som pdf [här](images/1-Introduction.pdf) (högerklicka och spara om den inte öppnas).
___________________________________________________________

## 1.2 Dataanalys med ROOT
Vi importerar C++-biblioteket [ROOT](https://root.cern.ch) som är en kraftfull verktygslåda för att effektivt analysera stora datamängder och visualisera resultaten. I övningarna som följer kommer ni att bekanta er med flertalet ROOT-klasser, och utförlig dokumentation finns i ROOT:s dokumentation som vi ofta länkar direkt till.

Obs! Då python är populärt har python-bindningar utvecklats för C++-klasserna, men dokumentationen hänvisar nästan uteslutande till C++-syntaxen.

Den första rutan nedan kommer att installera ROOT-biblioteken om denna notebook körs via Google Colab. Om du kör via docker så finns ROOT redan tillgängligt och rutan nedan gör ingenting.

In [None]:
# install the ROOT libraries if you're using Google Colab - this usually takes a minute or two
# if not we assume we're running in the docker container where it is already available
try:
    import google.colab
    IN_COLAB = True
except:
    IN_COLAB = False

if IN_COLAB:
    # Here we install the ROOT libraries and dependencies using a python wheel package
    # that is based on an already built version of ROOT
    !pip install ROOT -i https://root-experimental-python-wheels.web.cern.ch
else:
    print("Not running the notebook in Google Colab, so assuming ROOT is already available")

In [None]:
# import the ROOT module in python
import ROOT

### Vår första loop över kollisioner
Vi hämtar öppet tillgänglig mätdata (sk "open data") från ATLAS-experimentet från internet och laddar in det i ett [ROOT-träd](https://root.cern.ch/doc/master/classTTree.html). Vi börjar med simulerad data från så kallade Monte Carlo-program, där en datormodell har genererat proton-proton-kollisioner där $Z$-bosoner skapats och sönderfallit till ett elektron-positron-par. I det som följer används förkortningen "MC" används för simuleringar och "Data" betyder experimentell data tagen med ATLAS-detektorn vid riktiga experiment.

För att hämta datan använder vi oss av python paketet [atlasopenmagic](https://opendata.atlas.cern/docs/atlasopenmagic) och specificerar sedan att vi vill kolla på data från 2016 med en total kollisionsenergi på 8 TeV. Vi väljer sedan trädnamnet *mini* vilket laddar 7.5 miljoner separata proton-proton kollisioner.

In [None]:
!pip install atlasopenmagic

In [None]:
import atlasopenmagic as atom

# This version will load 2016-07-29/MC/mc_147770.Zee.root
# This is a MC data set with Z->ee events at 8 TeV.
atom.set_release('2016e-8tev')

file_urls = atom.get_urls('147770') # if you try 147771, what do you get?

print("Available file URLs:", file_urls)

file_url = file_urls[0]
f = ROOT.TFile.Open(file_url)
print("Opened file:", f.GetName())

# Load the mini tree containing 7500000 events 
tree_name = "mini"
tree = f.Get(tree_name)
print(f"The loaded tree '{tree_name}' contains {tree.GetEntries()} events")

#### Vad för typ av data finns tillgänglig för kollisionerna?
Innan vi kör vår loop över kollisionerna tittar vi på vilka variabler som finns tillgängliga för varje händelse (event). Nedan ser ni trädets olika variabler, lagrade som sk grenar (branches). För varje gren listas datatyp och en kort beskrivning. En variabel hämtas med `tree.<branch_name>`. 

I denna labb ska ni titta på elektroner och/eller myoner, som är leptoner, så variablerna med namn `lep_*` kommer att vara speciellt intressanta. I kollisionshändelserna finns det olika antal leptoner, och därför finns deras variabler sparade i vektorer för varje kollisionshändelse.

| Branch name                                  | Type            | Description     | 
| -------------------------------------------- | --------------- | --------------- |
 <b id="runNumber">runNumber</b>               | `int`           | run number |
 <b id="eventNumber">eventNumber</b>           | `int`           | event number |
 <b id="channelNumber">channelNumber</b>       | `int`           | channel number, relevant for MC ||
 <b id="mcWeight">mcWeight</b>                 | `float`         | weight of an MC event |
 <b id="pvxp_n">pvxp_n</b>                     | `int`           | number of reconstructed primary pp vertices |
 <b id="scaleFactor">scaleFactor</b>           | `float`         | overall scale factor for the preselected event |
 <b id="trigE">trigE</b>                       | `bool`          | indicates whether a standard trigger has fired in the egamma stream |
 <b id="trigM">trigM</b>                       | `bool`          | indicates whether a standard trigger has fired in the muon stream |
 <b id="passGRL">passGRL</b>                   | `bool`          | indicates whether event passes the GRL may be put in isGoodEvent |
 <b id="lep_n">lep_n</b>                       | `int`           | number of preselected leptons |
 <b id="lep_truthMatched">lep_truthMatched</b> | `vector<bool>`  | indicates whether the lepton is matched to a truth lepton |
 <b id="lep_trigMatched">lep_trigMatched</b>   | `vector<bool>`  | indicates whether the lepton is the one triggering the event |
 <b id="lep_pt">lep_pt</b>                    | `vector<float>` | transverse momentum of the lepton [MeV] |
 <b id="lep_eta">lep_eta</b>                  | `vector<float>` | pseudorapidity of the lepton |
 <b id="lep_phi">lep_phi</b>                  | `vector<float>` | azimuthal angle of the lepton |
 <b id="lep_E">lep_E</b>                      | `vector<float>` | energy of the lepton [MeV] |
 <b id="lep_z0">lep_z0</b>                    | `vector<float>` | z-coordinate of the track associated to the lepton wrt. the primary vertex [mm] |
 <b id="lep_charge">lep_charge</b>            | `vector<float>` | charge of the lepton (in unit charge) |
 <b id="lep_isTight">lep_isTight</b>          | `vector<bool>`  | boolean indicating whether the lepton is of tight quality |
 <b id="lep_flag">lep_flag</b>                | `vector<int>`   | bitmask implementing object cuts of the top group |
 <b id="lep_type">lep_type</b>                | `vector<int>`   | number signifying the lepton type (e = 11, mu = 13, tau = 15) of the lepton |
 <b id="lep_ptcone30">lep_ptcone30</b>        | `vector<float>` | ptcone30 isolation for the lepton |
 <b id="lep_etcone20">lep_etcone20</b>        | `vector<float>` | etcone20 isolation for the lepton |
 <b id="lep_trackd0pvunbiased">lep_trackd0pvunbiased</b> | `vector<float>`  | d0 of the track associated to the lepton at the point of closest approach (p.o.a.) [mm] |
 <b id="lep_tracksigd0pvunbiased">lep_tracksigd0pvunbiased</b> | `vector<float>`  | d0 signifcance of the track associated to the lepton at the p.o.a. |
 <b id="met_et">met_et                        | `float`         | transverse energy of the missing momentum vector [MeV] |
 <b id="met_phi">met_phi                      | `float`         | azimuthal angle of the missing momentum vector |
 <b id="jet_n">jet_n                          | `int`           | number of selected jets |
 <b id="jet_pt">jet_pt                        | `vector<float>` | transverse momentum of the jet [MeV] |
 <b id="jet_eta">jet_eta                      | `vector<float>` | pseudorapidity of the jet |
 <b id="jet_phi">jet_phi                      | `vector<float>` | azimuthal angle of the jet |
 <b id="jet_E">jet_E                          | `vector<float>` | energy of the jet [MeV] |
 <b id="jet_m">jet_m                          | `vector<float>` | invariant mass of the jet [MeV] |
 <b id="jet_jvf">jet_jvf                      | `vector<float>` | JetVertexFraction of the jet |
 <b id="jet_flag">jet_flag                    | `vector<int>`   | bitmask implementing object cuts of the top group |
 <b id="jet_trueflav">jet_trueflav            | `vector<int>`   | true flavor of the jet |
 <b id="jet_truthMatched">jet_truthMatched    | `vector<int>`   | information whether the jet matches a jet on truth level |
 <b id="jet_SV0">jet_SV0                      | `vector<float>` | SV0 weight of the jet (for tagging heavy-flavor hadrons) |
 <b id="jet_MV1">jet_MV1                      | `vector<float>` | MV1 weight of the jet (for tagging heavy-flavor hadrons)|
 <b id="scaleFactor_BTAG">scaleFactor_BTAG    | `float`         | scale factor for btagging |
 <b id="scaleFactor_ELE">scaleFactor_ELE      | `float`         | scale factor for electron efficiency |
 <b id="scaleFactor_JVFSF">scaleFactor_JVFSF  | `float`         | scale factor for jet vertex fraction |
 <b id="scaleFactor_MUON">scaleFactor_MUON    | `float`         | scale factor for muon efficiency |
 <b id="scaleFactor_PILEUP">scaleFactor_PILEUP   | `float`      | scale factor for pileup reweighting |
 <b id="scaleFactor_TRIGGER">scaleFactor_TRIGGER | `float`      | scale factor for trigger |
 <b id="scaleFactor_ZVERTEX">scaleFactor_ZVERTEX | `float`      | scale factor for z-vertex reweighting |

#### Iterera över de tre första kollisionerna (en liten "event loop")
Titta på koden nedan, kör den och se till att ni förstår vad den gör - ni kommer att behöva skriva liknande kod snart.

In [None]:
for ievt in range(3): # let's look closer at the first three events in the tree, indexed 0, 1 and 2
    tree.GetEntry(ievt) # load event with index ievt
    print("Event {}: Number of leptons = {}".format(ievt, tree.lep_n))   #"lep_n" is the number of leptons, by leptons we here mean electrons and muons
    for ilep in range(tree.lep_n): # loop over the leptons in the event
        print("         Lepton {} is of type {} and has a transverse momentum of {:.1f} GeV".format(
            ilep+1, 
            tree.lep_type[ilep], 
            tree.lep_pt[ilep]*1e-3) # the 1e-3 factor converts from MeV to GeV
        )
print("\nType==11: electron/positron, type==13: muon/anti-muon")

**Tips:** Ett annat sätt att loopa över händelser i ett träd är att skriva `for evt in tree: evt.branch...`. Nedan används detta sätt företrädesvis.

#### Nu testar vi att göra en distribution för de transversella rörelsemängderna uppmätta för elektroner i de första 1000 händelserna.

För mer info om hur histogram-klassen `TH1F` i ROOT fungerar, se [TH1-dokumentationen](https://root.cern.ch/doc/master/classTH1.html).

In [None]:
# create a histogram with 15 bins, ranging from 15 to 90 GeV
h_pt = ROOT.TH1F("h_pt", "Electron pT; Electron transverse momentum [GeV]; Number of electrons", 15, 15., 90.) 
nevents = 10000
ievt = 0
for evt in tree: # loop over the events
    ievt += 1
    if ievt >= nevents: break # terminate the loop after 1000 events
        
    for ilep in range(evt.lep_n):  # loop over leptons (lepton means electron or muon)
        if evt.lep_type[ilep] == 11: # consider only electrons (type 11)
            h_pt.Fill(evt.lep_pt[ilep]*1e-3) # fill histogram (file stores momentum in MeV)

In [None]:
from ROOT import TCanvas

if IN_COLAB:
    # jsroot must be turned off in Colab
    %jsroot off

canvas = ROOT.TCanvas()
h_pt.Draw()  # "e1" = histogram with error bars
canvas.Draw()

In [None]:
# You can also create a canvas where you sepcify the size and canvas name
# OBS: You can only have one canvas with the same name open at the same time
# If you try and rerun this more than once you will get an error
# And you will need to rerun the entire notebook!
canvas = ROOT.TCanvas("Canvas", "Title", 800, 600)
# draw the histogram
h_pt.Draw("e1") # draw option "e1" will draw error bars
# open the canvas
canvas.Draw()

<b> OBS! </b> Om du kör via docker är den uppritade figuren interaktiv: testa att klicka runt (använd högerklick) och scrolla. Ni kan ändra stil och färg på histogrammet, titel på axlarna etc. Figuren kan sparas i png-format genom att högerklicka mitt på canvasen, eller i vektorbaserat PDF-format via kodraden `canvas.SaveAs("figure.pdf")`
___________________________________________________

#### I nästa notebook lär vi oss om hur vi kan använda ROOT-biblioteket för att visualisera mätdatan och anpassa en matematisk modell till uppmätta distributioner för att bestämma modellens parametrar i sin modell! Vidare till [2-Fitting-with-ROOT](2-Fitting-with-ROOT.ipynb)!
________________________________________________________