# Calculando la masa invariante

En este ejemplo aprenderemos a calcular la __masa invariante__ con los datos de libre acceso de CMS. La masa invariante es un concepto importante para la física de partículas porque sirve para encontrar nuevas partículas. 

Los siguientes archivos CSV incluyen valores calculados para la masa inviariante:

    - dielectron.csv
    - DoubleMuRun2011A.csv
    - Jpsimumu_Run2011A.csv
    - Ymumu_Run2011A.csv
    

Por ejemplo con los archivos _Zmumu_\__Run2011A.csv_ y _Zee_\__Run2011A.csv_ es fácil calcular los valores de la masa invariante. Empecemos el cálculo importando los módulos de Python necesarios y obteniendo los datos. En este ejemplo utilizaremos el archivo _Zmumu_\__Run2011A.csv_ que incluye datos de eventos de colisión de la base de datos primaria [1] con criterios de selección específicos [2].

<br>
<br>
<br>
[1]  CMS collaboration (2016). DoubleMu primary dataset in AOD format from RunA of 2011 (/DoubleMu/Run2011A-12Oct2013-v1/AOD). CERN Open Data Portal. DOI: [10.7483/OPENDATA.CMS.RZ34.QR6N](http://doi.org/10.7483/OPENDATA.CMS.RZ34.QR6N).
<br>
[2] Thomas McCauley (2016). Zmumu. Jupyter Notebook file. https://github.com/tpmccauley/cmsopendata-jupyter/blob/hst-0.1/Zmumu.ipynb.

### Nombre de las variables: 

<table>
  <tr>
    <th>Variable</th>
    <th>Description</th>
  </tr>
  <tr>
    <td>Run</td>
    <td>The run number of the event</td>
  </tr>
  <tr>
    <td>Event</td>
    <td>The event number.</td>
  </tr>
  <tr>
    <td>E,px,py,pz</td>
    <td>For a lepton, either a muon or an electron, the total energy and components of the momemtum (in GeV).</td>
  </tr>
  <tr>
    <td>pt</td>
    <td>Helen Bennett</td>
  </tr>
  <tr>
    <td>eta</td>
    <td>The pseudorapidity of the lepton, either a muon or an electron</td>
  </tr>
  <tr>
    <td>phi</td>
    <td>The phi angle (in radians) of the lepton, either a muon or an electron</td>
  </tr>
   <tr>
    <td>Q</td>
    <td>The charge of the lepton, either a muon or an electron.</td>
  </tr>
 <tr>
    <td>M</td>
    <td>The invariant mass (in GeV) of either two muons or two electrons.</td>
  </tr>
 <tr>
    <td>chiSq</td>
    <td>The chi-squared per degree-of-freedom of the lepton, either a muon or an electron.</td>
  </tr>
 <tr>
    <td>dxy</td>
    <td>The impact parameter in the transverse plane with respect to the vertex of the muon or electron.</td>
  </tr>
 <tr>
    <td>iso</td>
    <td>The combined isolation (Itrack + Iecal + Ihcal) of the muon.</td>
  </tr>
 <tr>
    <td>MET</td>
    <td>The missing transverse momentum of the event (in units of GeV).</td>
  </tr>    
 <tr>
    <td>phiMET</td>
    <td>The phi angle (in radians) of the missing transverse momentum.</td>
  </tr>
 <tr>
    <td>type</td>
    <td>For a muon, either T or G: whether the muon is a tracker or global muon.</td>
  </tr>
 <tr>
    <td>type</td>
    <td>For an electron, either EB or EE: whether the electron is in the barrel or in the endcap.</td>
  </tr>
 <tr>
    <td>type</td>
    <td>For an electron, either EB or EE: whether the electron is in the barrel or in the endcap.</td>
  </tr>    
 <tr>
    <td>delEta</td>
    <td>The difference in eta (in radians) between the electron track and the associated cluster in the ECAL.</td>
  </tr>   
 <tr>
    <td>delPhi</td>
    <td>The difference in phi (in radians) between the electron track and the associated cluster in the ECAL.</td>
  </tr>  
 <tr>
    <td>sigmaEtaEta</td>
    <td>The weighted cluster rms along eta for an electron.</td>
  </tr>      
 <tr>
    <td>HoverE</td>
    <td>The energy of the electron in the HCAL divided by the energy of the electron in the ECAL.</td>
  </tr>
 <tr>
    <td>isoTrack</td>
    <td>The isolation variable for the electron in the tracker.</td>
  </tr>
 <tr>
    <td>isoEcal</td>
    <td>The isolation variable for the electron in the ECAL.</td>
  </tr>
 <tr>
    <td>isoHcal</td>
    <td>The isolation variable for the electron in the HCAL.</td>
  </tr>    
 <tr>
    <td>HoverE</td>
    <td>The energy of the electron in the HCAL divided by the energy of the electron in the ECAL.</td>
  </tr>   
</table>

### Obteniendo los datos

In [5]:
# Importar los módulos necesarios. Pandas es para el análisis de datos y numpy para cálculos científicos.
# Nombrar estas "pd" y "np".
import pandas as pd
import numpy as np

# Crear un nuevo marco de datos desde el archivo "Zmumu_Run2011A.csv". Nombrarlo "dataset".
dataset = pd.read_csv('../Datos/Zmumu_Run2011A.csv')

Podemos revisar el contenido que salvamos en la variable _dataset_ imprimiendo las primeras 4 líneas con el código siguiente:

In [6]:
dataset.head()

Unnamed: 0,Run,Event,pt1,eta1,phi1,Q1,dxy1,iso1,pt2,eta2,phi2,Q2,dxy2,iso2
0,165617,74969122,54.7055,-0.432396,2.57421,1,-0.074544,0.499921,34.2464,-0.98848,-0.498704,-1,0.071222,3.42214
1,165617,75138253,24.5872,-2.0522,2.86657,-1,-0.055437,0.0,28.5389,0.385163,-1.99117,1,0.051477,0.0
2,165617,75887636,31.7386,-2.25945,-1.33229,-1,0.087917,0.0,30.2344,-0.468419,1.88331,1,-0.087639,0.0
3,165617,75779415,39.7394,-0.712338,-0.312266,1,0.058481,0.0,48.279,-0.195625,2.97032,-1,-0.049201,0.0
4,165617,75098104,41.2998,-0.157055,-3.04077,1,-0.030463,1.22804,43.4508,0.590958,-0.042756,-1,0.044175,0.0


### Realizando el cálculo

Utilizaremos la siguiente expresión para el cálculo de la masa invariante $M$:

$$M = \sqrt{2p_{T1}p_{T2}(\cosh(\eta_1-\eta_2)-\cos(\phi_1-\phi_2))}.$$

En la expresión $p_T$ es la componente del momento que es perpendicular al eje del haz, $\eta$ es la pseudo-rapidez (ángulo) y $\phi$ es el ángulo azimutal. 

En el cálculo abajo utilizaremos el módulo _numpy_ que fue nombrado como _np_ en la primer casilla del código. Con _numpy_ es posible utilizar comandos matemáticos como _sqrt_ y _cosh_ llamando el primer módulo (_np_) y luego el comando separado por un punto. Por ejemplo la raiz cuadrada puede ser llamada escribiendo _np.sqrt( )_.

_pt1_, _pt2_, _eta1_, _eta2_, _phi1_ y _phi2_ se refieren a las columnas de datos. En el código tiene que especificarse de donde se obtendrán estos nombres. Asi que por ejemplo, si queremos obtener la columna _pt1_, hay que escribir _dataset.pt1_ en el código. 

Ahora estamos listos para calcular los valores de la masa invariante para distintos eventos. _Numpy_ calculará automáticamente los valores para todos los eventos cuando le pasamos el cálculo de la siguiente forma. Así que la ecuación dada es calculada para todas las líneas. 

In [7]:
masa_invariante = np.sqrt(2*dataset.pt1*dataset.pt2*(np.cosh(dataset.eta1-dataset.eta2) - np.cos(dataset.phi1-dataset.phi2)))

Después del cálculo podemos revisar que valores fueron salvados en la variable _masa_\__invariante_ imprimiendo el contenido de la variable:

In [8]:
print(masa_invariante)

0        89.885744
1        88.810987
2        88.472502
3        90.332620
4        90.514507
           ...    
10578    90.610799
10579    89.744873
10580    90.714366
10581    91.945212
10582    87.838121
Length: 10583, dtype: float64
