# 1.2 Función de probabilidad

## Variables aleatorias 


1. Un experimento estadístico es cualquier proceso que proporciona datos. 
2. Estos datos tienen que convertirse en descripciones numéricas del resultado.
3. Estas descripciones numéricas son observaciones aleatorias. 
4. A las observaciones aleatorias se les considera como la expresión en cada caso concreto de una variable aleatoria que toma valores en los resultados del experimento.

**Variable aleatoria** es una variable matemática cuyos posibles valores son las descripciones numéricas de todos los resultados posibles de un experimento
estadístico.

Se pueden distinguir distintos tipos de variables aleatorias:

1. _Variables cuantitativas_: son las que resultan de experimentos cuyos resultados son directamente numéricos.

2. _Variables cualitativas_: son las que proceden de experimentos cuyos resultados expresan una cualidad no numérica que necesita ser cuantificada.

3. _Variables discretas_: son aquellas que se define sobre un espacio muestral numerable, finito o infinito. 

4. _Variables continuas_: son aquellas que se definen sobre un espacio asimilable al conjunto de los números reales, es decir, un espacio no numerable

## Variables aleatorias discretas


Una variable aleatoria discreta toma cada uno de sus valores con una determinada probabilidad.

**Función de probabilidad**: es una función tal que, al sustituir x por un valor de la variable, el valor que toma la función es la probabilidad de que la variable X asuma el valor x.

La función de probabilidad se representa como: 

$f(x)=P(X=x)$

Las funciones de probabilidad sólo se definen para los valores de la variable aleatoria y deben cumplir tres propiedades:

1. $\forall  x \in R, f(x) \geq 0$
2. $\sum_{x} f(x) = 1$
3. $P(X=x)=f(x)$

In [None]:
TCanvas *c1 = new TCanvas("c1","A Simple Graph Example",400,10,650,400);
gStyle->SetOptStat(false);
gStyle->SetOptTitle(0);
gStyle->SetPalette(1);
c1->SetRightMargin(0.0465116);
c1->SetTopMargin(0.39916);
c1->SetFillColor(0);

TPad *pt_1 = new TPad("pt_1", "pt_1",0.0,0.0,0.98,0.98);
pt_1->Draw();
pt_1->cd();
pt_1->Range(-20.6795,-0.0133333,105.496,0.062549);
pt_1->SetFillColor(0);
pt_1->SetBorderSize(2);
pt_1->SetLeftMargin(0.2);
pt_1->SetRightMargin(0.05);
pt_1->SetTopMargin(0.1);
pt_1->SetBottomMargin(0.15);
pt_1->SetFrameLineWidth(2);

TF1 f1("gauss", "[0] / sqrt(2.0 * TMath::Pi()) / [2] * exp(-(x-[1])*(x-[1])/2./[2]/[2])", 1, 100);
f1.SetParameters(1.,50.,10.);
f1.GetXaxis()->SetTitle("x ");
f1.GetXaxis()->CenterTitle(true);
f1.GetXaxis()->SetTitleSize(0.05);
f1.GetXaxis()->SetLabelSize(0.045);
f1.GetXaxis()->SetTitleOffset(1.3);
f1.GetYaxis()->SetTitle("f(x)");
f1.GetYaxis()->CenterTitle(true);
f1.GetYaxis()->SetTitleSize(0.05);
f1.GetYaxis()->SetLabelSize(0.045);
f1.GetYaxis()->SetTitleOffset(1.5);
//c1->Draw();
//f1.Draw("bar");


In [None]:
c1->Draw();
f1.Draw("bar");

**Función de distribución** La función de distribución se define para todos los números reales, no sólo para los valores de la variable. Su máximo es siempre 1 pues cuando el valor que se sustituye es mayor o igual que el valor máximo de la variable, la probabilidad de que ésta tome valores menores o iguales que el sustituido es la
probabilidad del espacio muestral.

## Variables aleatorias continuas


**Función de densidad** Una variable aleatoria continua tiene la característica de tomar cada uno de sus valores con
probabilidad infinitesimal. 

Puede calcularse la probabilidad de que la variable tome valores en determinados intervalos.

$P(a \leq X \leq b) = P(X = a) + P(a < X < b) + P(X = b) = P(a < X < b)$

La función de densidad debe cumplir tres condiciones análogas a las de la función de probabilidad:

1. $\forall  x \in R f(x) \geq  0$
2. $\int_{-\infty}^{\infty} f(x) dx = 1$
3. $P(a \leq X \leq b)=\int_{a}^{b}f(x) dx$

**Función de densidad** es una función continua tal que su integral entre los extremos de un intervalo nos da el valor de la probabilidad de que X tome valores en ese intervalo.

$P(a \leq X \leq b) = \int_{a}^{b} f(x) dx$


In [None]:
c1->Draw();
f1.Draw();

## Distribución conjunta de dos variables

Cuando tenemos dos variables aleatorias X y Y, si queremos estudiarlas conjuntamente debemos establecer una relación que ligue los valores de una con los de la otra.

Para variables discretas, se puede establecer una función de probabilidad para las posibles parejas de valores de ambas variables; a esta función se le llama **función de probabilidad conjunta, f(x,y).**

$P[(X=x)\cap(Y=y)]= f(x,y)$

Que puede ser discreta o continua y que cumple las condiciones de la función de probabilida o función de densiadad


1. $\forall  x,y \in R f(x,y) \geq  0$
2. $\int_{-\infty}^{\infty}\int_{-\infty}^{\infty} f(x,y) dx dy = 1$
3. $P[(x,y)\in A]=\int\int_A f(x,y) dx dy$

In [None]:
Double_t Gaus2D(Double_t *x, Double_t *par)
{
if(par[2] > 0 && par[4] > 0)
 {
 double rx=(x[0]-par[1])/par[2];
 double ry=(x[1]-par[3])/par[4];
 return par[0]*TMath::Exp(-(rx*rx+ry*ry)/2.);
 }
else
 {
 return 0.;
 }
}


In [None]:
TF2 *g2D=new TF2("g2d",Gaus2D,0,100,0,100,100);
g2D->SetParNames("Const","X_{0}","#sigma_{x}","Y_{0}","#sigma_{y}");
g2D->SetParameters(1,50,10,50,10);
g2D->GetXaxis()->SetTitle("x ");
g2D->GetXaxis()->CenterTitle(true);
g2D->GetXaxis()->SetTitleSize(0.05);
g2D->GetXaxis()->SetLabelSize(0.045);
g2D->GetXaxis()->SetTitleOffset(1.3);
g2D->GetYaxis()->SetTitle("y");
g2D->GetYaxis()->CenterTitle(true);
g2D->GetYaxis()->SetTitleSize(0.05);
g2D->GetYaxis()->SetLabelSize(0.045);
g2D->GetYaxis()->SetTitleOffset(1.5);
g2D->GetZaxis()->SetTitle("f(x,y)");
g2D->GetZaxis()->CenterTitle(true);
g2D->GetZaxis()->SetTitleSize(0.05);
g2D->GetZaxis()->SetLabelSize(0.045);
g2D->GetZaxis()->SetTitleOffset(1.5);
g2D->Draw("surf2");
c1->Draw();

## Valor esperado de una variable

**Variables aleatorias independientes**: dos variables aleatorias X y Y, discretas o continuas cuyas funciones de probabilidad o densidad son $g(x)$ y $h(y)$, respectivamente, con función de probabilidad o densidad conjunta $f(x,y)$, son estadísticamente independientes si y sólo si $f(x,y)=g(x)\cdot f(x)$

Supongamos que hemos realizado n veces un experimento aleatorio que genera una variable X. El valor medio del experimento en estas n repeticiones es la suma de los productos de los valores de la variable por su frecuencia relativa. Cuando n sea igual a infinito, el valor medio del experimento se llama valor esperado o esperanza matemática:

$\mathbb{E}[X]=x_1p(X=x_1)+\ldots+x_ip(X=x_i)=\sum_i^nx_ip(x_i)$

Para una variable aleatoria continua, la esperanza se calcula mediante la integral de todos los valores y la función de densidad:

$\mathbb{E}[X]=\int_{-\infty}^\infty x f(x) dx$.

La esperanza también se suele simbolizar con $\mathbb{E}[X]=\mu$

**Propiedades**

1. Si X es siempre positiva, entonces siempre lo es $\mathbb{E}[X]$.
2. La esperanza matemática de una constante es igual a esa misma constante, es decir, $\mathbb {E}[c]=c$.
3. Si X está delimitada por dos números reales, a y b, tal que: $a \leq X \leq b$, entonces también lo está su media: $a \leq \mathbb{E}[X] \leq b$
4. Linealidad. Si existe $\mathbb{E}[X]$ y se considera $Y=a+bX$, entonces $\mathbb{E}[Y]=\mathbb{E}[a+bX]=a+b\mathbb{E}[X]$

además la esperanza es un operador **lineal**.




## Momentos de una variable

Dada una variable aleatoria X con función de probabilidad o densidad f(x) podemos definir una función de X que sea igual a la diferencia entre la variable y su media elevada a un exponente entero no negativo:

$z(x)=(x-\mu)^k$ siendo  $k\in Z, k\geq 0$

El valor esperado de $z(x)$ es el k-ésimo momento de la variable X respecto a su origen:

$\mu_k=\mathbb{E}[(x-\mu )^k]= \left \{ \begin{matrix} \sum_x (x-\mu)^k f(x) & \mbox{si }X\mbox{ es discreta} \\ \int_{-\infty}^{\infty} (x-\mu)^k f(x) dx & \mbox{si }X\mbox{ es continua}\end{matrix}\right.$

$k=0, \mu_0=1$;

$k=1, \mu_1=\mathbb{E}[(x-\mu)^1]=
\mathbb{E}[(x-\mu)]=\mathbb{E}[X]-\mu=0$

$k=2, \mu_2=\mathbb{E}[(x-\mu )^2]=\sigma^2$ 

### Varianza

La varianza de una variable mide la dispersión de sus valores respecto al valor central $\mu$

$\mu_2=\mathbb{E}[(x-\mu )^2]= \mathbb{E}[X^{2}]-\mu^{2}=\mathbb{E}[X^{2}]-\mathbb{E}[X]^{2}= \left \{ \begin{matrix} \sum_x (x-\mu)^2 f(x) & \mbox{si }X\mbox{ es discreta} \\ \int_{-\infty}^{\infty} (x-\mu)^2 f(x) dx & \mbox{si }X\mbox{ es continua}\end{matrix}\right.$


Es decir, la varianza de una variable es igual a la media de los cuadrados menos el cuadrado
de la media.

La varianza se expresa en unidades cuadráticas que no siempre tienen una interpretación clara. 

**Desviación estandar $\sigma$:** Medida de la
dispersión que que se calcula como la raíz cuadrada positiva de la varianza. La desviación estandar se mide en las mismas unidades que la
variable

$\sigma_x =+\sqrt{\sigma^2_x}$

La desviación estandar no resuelve todos los problemas que se pueden plantear, por ejemplo la comparación de situaciones en las que la unidad de medida sea diferente. Para resolver esta cuestión se define una medida adimensional de
la variabilidad que es el coeficiente de variación, $C_V$, que se calcula como el cociente entre la desviación típica y la media.

$C_V=\frac{\sigma}{\mu}$

o porcentual

$C_V=100 \cdot\frac{\sigma}{\mu}$

### Varianza de variables asociadas

Supongamos que tenemos dos variables aleatorias X y Y, discretas o continuas, con función
de probabilidad o densidad conjunta f(x,y) y definimos una función z(x,y):

$z(x,y)=(x-\mu_x)(y-\mu_y)$

Al valor esperado de z(x,y) se le llama **covarianza $\sigma_{xy}$** o **cov(x,y)** de las variables X y Y.

$\mu_{xy}=\mathbb{E}[(x-\mu_{x})][(y-\mu_{y})]=$
$\left\{\begin{matrix} 
\sum_x\sum_y (x-\mu_x)(y-\mu_y) f(x,y) &
\mbox{si }\mbox{X y Y}\mbox{ son discreta} \\ 
\int_{-\infty}^{\infty}\int_{-\infty}^{\infty} (x-\mu_x)(y-\mu_y) f(x,y) dx & \mbox{si }\mbox{X y y}\mbox{ son continua}\end{matrix}\right.$

La covarianza es una medida de la variación común a dos variables y, por tanto, una medida
del grado y tipo de su relación.
1. $\sigma_{xy}$ es positiva si los valores más grandes de X están asociados a los valores más grandes de Y y viceversa.
2. $\sigma_{xy}$ es negativa si los más bajos de X están asociados a los valores más bajos de Y y
viceversa.
3. Si X y Y son variables aleatorias independientes cov(x,y) = 0 (la independencia es condición suficiente pero no necesaria para que la cov(x,y) sea nula.)

La covarianza de dos variables se puede calcular como:

$\sigma_{xy}=\mathbb{E}[(x-\mu_x)(y-\mu_y)]=\mathbb{E}[X\cdot Y]-\mu_x \mu_y=\mathbb{E}[X\cdot Y]-\mathbb{E}[X]\cdot\mathbb{E}[Y]$

La covarianza se expresa en términos del producto de las unidades de medida de
ambas variables, lo cual no siempre es fácilmente interpretable. Por otra parte también es difícil comparar situaciones diferentes entre sí. Ambos problemas se solucionan mediante la definición del coeficiente de correlación.

**Coeficiente de correlación $\rho$:** Es el cociente entre la covarianza y el producto de las desviaciones estandar de las dos variables.

$\rho=\frac{\sigma_{xy}}{\sigma_x\sigma_y}$

1. La correlación toma valores entre -1 y 1, siendo su signo igual al de la covarianza.
2. Correlaciones con valor absoluto 1 implican que existe una asociación matemática lineal perfecta, positiva o negativa, entre las dos variables.
3. Correlaciones iguales a 0 implican ausencia de asociación (las variables independientes tienen correlación 0, pero la independencia es condición suficiente pero no necesaria.)
4. Correlaciones con valores absolutos intermedios indican cierto grado de asociación entre los valores de las variables.

$k=2, \mu_2=\mathbb{E}[(x-\mu )^2]=\sigma^2$ 

### Asimetría

El tercer momento respecto de la media, mide la asimetría de la distribución, es decir, si
existen o no observaciones muy extremas en algún sentido con frecuencias razonablemente altas.

$k=3, \mu_3=\mathbb{E}[(x-\mu)^3]$ 


1. Si la asimetría es negativa, la variable toma valores muy bajos con mayor frecuencia que valores muy altos y (asimétrica hacia la izquierda). 

2. Si la asimetría es positiva, la variable toma valores muy altos con mayor frecuencia que valores muy bajos (asimétrica hacia la derecha). 

3. Si la asimetría es cero, los valores bajos y altos de la variable tienen probabilidades iguales (por ejemplo la distribución normal)

La asimetría tiene el mismo problema que la varianza y la covarianza en cuanto a sus
unidades de medida y, por ello, normalmente se utiliza una medida adimensional de la asimetría
que es el coeficiente de asimetría, $g_1$ , que se calcula como el cociente entre el tercer momento y el cubo de la desviación estandar.

$g_1=\frac{\mu_3}{\sigma_3}$

### Curtosis

El cuarto momento respecto de la media, mide la forma de la distribución de probabilidad o **curtosis**.

$k=4, \mu_4=\mathbb{E}[(x-\mu)^4]$ 

1. Curtosis pequeña (platicúrticas): curvas o histogramas con colas cortas y aspecto aplanado o en meseta.

2. Curtosis grande (leptocúrtica): gráfica alta y estilizada, con colas largas y pesadas.

La curtosis de una variable siempre es positiva y se mide en la unidades de la variable
elevadas a potencia 4. Por tanto, tiene los mismos problemas relacionados con las
unidades de medida y las escalas que los momentos menores.

**Coefeiciente de curtosis** $g_2$: Medida adimensional de la curtosis, se calcula como el
cociente entre el cuarto momento y el cuadrado de la varianza, al que se le resta 3 unidades. Esta corrección se debe a que, sin ella, las variables normales tendrían coeficiente de curtosis igual a 3; al restar 3 conseguimos que el coeficiente de curtosis de la variable normal sea 0 y que las variables platicúrticas tengan coeficiente de curtosis negativo y la leptocúrticas positivo.

$g_2=\frac{\mu_4}{\sigma_4}-3$

In [None]:
auto cnt_r_h=new TH1F("count_rate",
 "Count Rate;N_{Counts};# occurencies",
 100, // Number of Bins
 -0.5, // Lower X Boundary
 15.5); // Upper X Boundary

 auto mean_count=3.6f;
 TRandom3 rndgen;
    /*TRandom           34   ns/call     (BAD Generator)
    TRandom1          242  ns/call
    TRandom2          37   ns/call
    TRandom3          45   ns/call
     */
 // simulate the measurements
 for (int imeas=0;imeas<4000;imeas++)
 cnt_r_h->Fill(rndgen.Poisson(mean_count));
/*Exp(tau)
  Integer(imax)
  Gaus(mean,sigma)
  Rndm()
  Uniform(x1)
  Landau(mpv,sigma)
  Poisson(mean)
  Binomial(ntot,prob)
*/
auto c= new TCanvas();
 cnt_r_h->Draw();

 auto c_norm= new TCanvas();
 cnt_r_h->DrawNormalized();

 // Print summary
 cout << "Moments of Distribution:\n"
 << " - Mean = " << cnt_r_h->GetMean() << " +- "
 << cnt_r_h->GetMeanError() << "\n"
 << " - Std Dev = " << cnt_r_h->GetStdDev() << " +- "
 << cnt_r_h->GetStdDevError() << "\n"
 << " - Skewness = " << cnt_r_h->GetSkewness() << "\n"
 << " - Kurtosis = " << cnt_r_h->GetKurtosis() << "\n";
c->Draw();
c_norm->Draw();