# *Capitulo 3 - Variables aleatorias discretas y distribuciones de probabilidad*

## 3.1 Variables aleatorias

**Definicion:** Para un espacio muestral $S$ de algun experimento, una **variable aleatoria** es cualquier regla que asocia un numero con cada resultado en $S$. En lenguaje matematico, una variable aleatoria es una funcion cuyo dominio es el espacio muestral y cuyo rango es el conjunto de los numeros reales.

![Image 1](resources/imgs_cap3/img_cap3_01.png)

$$\text{Una variable aleatoria}$$

**Definicion:** Cualquier variable aleatoria cuyos unicos valores posibles son 0 y 1 se llama **variable aleatoria de Bernoulli.**

### Dos tipos de variables aleatorias

**Definicion:** Una variable aleatoria **discreta** es una variable aleatoria cuyos valores posibles constituyen un conjunto finito o bien pueden ser puestos en lista en una secuencia infinita en la cual existe un primer elemento, un segundo elemento, y asi sucesivamente ("contablemente" infinita).  
Una variable aleatoria es **continua** si *ambas* de las siguientes condiciones se cumplen:  
1. Su conjunto de valores posibles se compone de todos los numeros que hay en un solo intervalo sobre la linea de numeracion (posiblemente de extension infinita, es decir, desde $-\infty$ hasta $\infty$) o todos los numeros en una union disjunta de dichos intervalos (por ejemplo, $[0, 10] \cup [20, 30]$).
2. Ningun valor posible de la variable tiene probabilidad positiva, esto es, $P(X = c) = 0$ con cualquier valor posible de $c$.

## 3.2 Distribuciones de probabilidad para variables aleatorias discretas

**Definicion:** La **distribucion de probabilidad** o **funcion de masa de probabilidad** (fmp) de una variable discreta se define para cada numero $x$ como $p(x) = P(X = x) = P$ (todas las $s \in S:X(s) = x$).

### Parametro de una distribucion de probabilidad

**Definicion:** Supongase que $p(x)$ depende de la cantidad que puede ser asignada a cualquiera de un numero de valores posibles, y cada valor determina una distribucion de probabilidad diferente. Tal cantidad se llama **parametro** de distribucion. El conjunto de todas las distribuciones de probabilidad para diferentes valores del parametro se llama **familia** de distribuciones de probabilidad.

### Funcion de distribucion acumulativa

**Defininicion:** La **funcion de distribucion acumulativa** (fda) $F(x)$ de una variable aleatoria discreta $X$ con funcion de masa de probabilidad $p(x)$ se define para cada numero $x$ como  

$$F(x) = P(X \le x) = \sum_{y:y \le x}p(y)$$

Para cualquier numero $x, F(x)$ es la probabilidad de que el valor observado de $X$ sera cuando mucho $x$.

Sea

\begin{equation}
    F(y) =
    \begin{cases}
        0 & y < 1 \\
        .05 & 1 \le y < 2 \\
        .15 & 2 \le y < 4 \\
        .50 & 4 \le y < 8 \\
        .90 & 8 \le y < 16 \\
        1 & 16 \le y
    \end{cases}
\end{equation}

La siguiente figura muestra una grafica de esta fda.

![Image 2](resources/imgs_cap3/img_cap3_02.png)
$$\text{Grafica de la funcion de distribucion acumulativa.}$$

**Proposicion:** Para dos numeros cualesquiera $a$ y $b$ con $a \le b$,
$$P(a \le X \le b) = F(b) - F(a-)$$
donde "a-" representa el valor posible de $X$ mas grande que es estrictamente menor que $a$. En particular, si los unicos valores posibles son enteros, y si $a$ y $b$ son enteros, entonces  

\begin{align*}
    P(a \le X \le b) &= P(X = a\ o\ a + 1\ o \ldots o\ b) \\
    &= F(b) - F(a-1)
\end{align*}  

Con $a = b$ se obtiene $P(X = a) = F(a) - F(a - 1)$ en este caso.

## 3.3 Valores esperados

### Valor esperado de $X$

**Definicion:** Sea $X$ una variable aleatoria discreta con un conjunto de valores posibles $D$ y una funcion de masa de probabilidad $p(x)$. El **valor esperado** o **valor medio** de $X$, denotado por $E(X)$ o $\mu_{X}$ o solo $\mu$, es

$$E(X) = \mu_{X} = \sum_{x \in D} x \cdot p(x)$$

### Valor esperado de una funcion

A menudo interesara poner atencion al valor esperado de alguna funcion $h(X)$ en lugar de solo en $E(X)$.

**Proposicion:** Si la variable aleatoria $X$ tiene un conjunta de posibles valores $D$ y una funcion de masa de probabilidad $p(x)$, entonces el valor esperado de cualquier funcion $h(X)$, denotada por $E[h(X)]$ o $\mu_{h(X)}$, se calcula con

$$E[h(X)] = \sum_{D} h(x) \cdot p(x)$$

### Reglas de valor esperado

**Proposicion:**  

$$E(aX + b) = a \cdot E(X) + b$$

(O, con notacion alternativa, $\mu_{aX+b} = a \cdot \mu_X + b$)

---
Dos casos especiales de proposicion producen dos reglas importantes de valor esperado.  
1. Con cualquier constante $a, E(aX) = a \cdot E(X)$ (considerese $b = 0$).
2. Con cualquier constante $b, E(X + b) = E(X) + b$ (considerese $a = 1$).

### Varianza de $X$

![Image 3](resources/imgs_cap3/img_cap3_03.png)

$$\text{Dos diferentes distribuciones de probabilidad con $\mu = 4$}$$

Aunque ambas distribuciones ilustradas en la figura tienen el mismo centro $\mu$, la distribucion de la figura de la derecha tiene una mayor dispersion o variabilidad que la figura de la izquierda. Se utilizara la varianza de $X$ para evaluar la cantidad de variabilidad en (la distribucion de) $X$, del mismo modo que se utilizo $s^{2}$ en el capitulo 1 para medir la variablidad en una muestra.

**Definicion:** Sea $p(x)$ la funcion de masa de probabilidad de $X$ y $\mu$ su valor esperado. En ese caso la **varianza** de $X$, denotada por $V(X)$ o $\sigma_{X}^{2}$, o simplemente $\sigma^{2}$, es

$$ V(X) = \sum_{D} (x - \mu)^{2} \cdot p(x) = E[(X - \mu)^{2}]$$

La **desviacion estandar** (DE) de $X$ es
$$ \sigma_{X} = \sqrt{\sigma_{x}^{2}}$$

### Formula abreviada para $\sigma^{2}$

**Proposicion:**
$$ V(X) = \sigma^{2} = \left[\sum_{D} x^{2} \cdot p(x)\right] - \mu^{2} = E(X^{2}) - [E(X)]^{2} $$

**Demostracion:** Desarrollandose $(x - \mu)^{2}$ en la definicion de $\sigma^{2}$ para obtener $x^{2} - 2 \mu x + \mu^{2}$, y luego lleve $\sum$ a cada uno de los tres terminos:

\begin{align*}
    \sigma^{2} &= \sum_{D} x^{2} \cdot p(x) - 2 \mu \cdot \sum_{D}x \cdot p(x) + \mu^{2} \sum_{D} p(x) \\
    &= E(X^{2}) - 2 \mu \cdot \mu + \mu^{2} = E(X^{2}) - \mu^{2}
\end{align*}

### Reglas de varianza

**Proposicion:**
$$ V(aX + b) = \sigma_{aX+b}^{2} = a^{2} \cdot \sigma_{X}^{2}\ \ \text{y}\ \ \sigma_{aX+b} = |a| \cdot \sigma_{X}$$

En particular,
$$ \sigma_{aX} = |a| \cdot \sigma_{X},\ \sigma_{X+b} = \sigma_{X}$$

## 3.4 Distribucion de probabilidad binomial

Existen muchos experimentos que se ajustan exacta o aproximadamente a a la siguiente lista de requerimientos.  

1. El experimento consta de una secuencia de $n$ experimentos mas pequenos llamados *ensayos*, donde $n$ se fija antes del experimento.
2. Cada ensayo puede dar por resultado uno de los mismos dos resultados posibles (ensayos dicotomicas), los cuales se denotan como exito (S) y falla (F).
3. Los ensayos son independientes, de modo que el resultado en cualquier ensayo particular no influye en el resultado de cualquier otro ensayo.
4. La probabilidad de exito $P(S)$ es constante de un ensayo a otro; esta probabilidad se denota por $p$.

**Definicion:** Un experimento para el que se satisfacen las condiciones 1-4 se llama **experimento binomial.**

---
Se utilizara la siguiente regla empirica para decidir si un experimento "sin reemplazo" puede ser tratado como un experimento binomial.  

**Regla:** Considerese muestreo sin reemplazo de una poblacion dicotomica de tamano $N$. Si el tamano de la muestra (numero de ensayos) $n$ es cuando mucho 5% del tamano de la poblacion, el experimento puede ser analizado como si fuera exactamente un experimento binomial.

### Variable y distribucion aleatoria binomial

**Definicion:** La **variable aleatoria binomial $X$** asociada con un experimento binomial que consiste en $n$ ensayos se define como  

$$X = \text{el numero de los S entre los n ensayos}$$

**Notacion:** Como la funcion de masa de probabilidad de una variable aleatoria binomial $X$ depende de los dos parametros $n$ y $p$, la funcion de masa de probabilidad se denota por $b(x;\ n,\ p)$.

**Teorema:**  

\begin{align*}
    b(x;\ n,\ p) =
    \begin{cases}
        {n \choose x} p^{x}(1 - p)^{n-x} & x = 0,\ 1,\ 2,\ldots,\ n \\
        0 & \text{de lo contrario}
    \end{cases}
\end{align*}

### La media y varianza de $X$

**Proposicion:** Si $X \sim Bin(n,\ p)$, entonces

$$E(X) = np, V(X) = np(1 - p) = npq$$
y
$$\sigma_{X} = \sqrt{npq}\ \ \text{(donde $q = 1 - p$).}$$