# Variables aleatorias continuas

En la vida diaria nos encontramos con variables que no son discretas, como por ejemplo: la cantidad diaria de lluvia caida en cierta region, el tiempo de vida de cierto tipo de componentes electronicos, la profundidad en un lago para puntos aleatoriamente elegidos, etc.

En todos estos ejemplos los valores posibles no es un conjunto finito ni infinito numerables, son intervalos o semirectas.

### Definicion:

Sea *X* una variablee aleatoria sobre un modelo probabilistico $(S, A, P)$, se dice que *X* es una **variable aleatoria continua** si

\begin{align}
    P(X = x) &= 0 & \forall x \in \mathbb{R}
\end{align}

Sea *X* una variable aleatoria sobre un modelo probabilistico $(S, A, P)$ recordemos la definicion de funcion de distribucion acumulada (f.d.a.) de una variable aleatoria *X* es:

\begin{align}
    F(x) &= P(X \le x) & \forall x \in \mathbb{R}
\end{align}

Entonces de la definicion de una variable aleatoria continua resulta que:
1.  

\begin{align}
    P(a < X \le b) &= P(a \le X \le b) \\
    &= P(a \le X < b) \\
    &= P(a < X < b) \\
    &= F(b) - F(a)
\end{align}
$$\forall a < b \text{ numeros reales.}$$  

2.  
$$P(X \ge a) = P(X > a) = 1 - F(a)\ \ \forall a \in \mathbb{R}$$

**Observacion:** Algunas de estas igualdades podrian no ser verdaderas si la variable aleatoria es discreta!!!

Daremos una proposicion que sera muy ultil para probar las propiedades de la f.d.a. (F).

### Proposicion:

Sea $(S, A, P)$ un modelo probabilistico entonces  
**a)**  
Si $A_{1} \subseteq A_{2} \subseteq A_{3} \subseteq \cdots$ es una sucesion de eventos encajados entonces
$$ P(\cup_{i=1}^{\infty} A_{i}) = \lim\limits_{n \to \infty} P(A_{n}). $$  
**b)**  
Si $B_{1} \supseteq B_{2} \supseteq B_{3} \supseteq \cdots$ es una sucesion de eventos encajados entonces  
$$ P(\cap_{i=1}^{\infty} B_{i}) = \lim\limits_{n \to \infty} P(B_{n}). $$

## Propiedades de la f.d.a. (F) de una variable aleatoria.

Si $(S, A, P)$ un modelo probabilistico y *X* una variable aleatoria con f.d.a. *F*, entonces  
**a)** F es monotona creciente, o sea si $x_{1} \le x_{2} \Rightarrow F(x_{1}) \le F(x_{2}).$  
**b)** $\lim\limits_{x \to \infty} F(x) = 1$ y $\lim\limits_{x \to -\infty} F(x) = 0.$  
**c)** $\forall \ a \in \mathbb{R}$ entonces $\lim\limits_{x \to a^{+}} F(x) = F(a)$  
**d)** Si *X* es una variable aleatoria continua entonces  
$$\lim\limits_{x \to a^{-}} F(x) = \lim\limits_{x \to a^{+}} F(x) = F(a)\ \ \ \forall a \in \mathbb{R}$$  
Luego F es continua en $\mathbb{R}$

En general las f.d.a. (F) de variables aleatorias continuas definidas en termino de funciones que llamaremos funcion densidad de probabilidad.

### Definicion:

Se llama **funcion densidad de probabilidad** (f.d.p.) a toda funcion
$$ f:\mathbb{R} \rightarrow \mathbb{R} \text{ no negativa tal que } \int_{-\infty}^{\infty} f(t)\ dt = 1. $$

### Definicion:

Sea *X* una variable aleatoria continua con f.d.a. *F* y f.d.p. *f*. Entonces si  
\begin{align}
    F(x) &= \int_{-\infty}^{x} f(t)\ dt & \forall x \in \mathbb{R}
\end{align}
se dice que *X* es una **variable aleatoria absolutamente continua.**

Luego si *X* es una v.a. absolutamente continua entonces $\forall a < b$

\begin{align}
    P(a \le X \le b) = F(b) - F(a) = \int_{a}^{b} f(t) dt
\end{align}

![Image 1](resources/imgs_chapter_iv/img_1.png)

### Proposicion:

Si *X* es una v.a. con f.d.a. F tal que tenga derivada continua, salvo en un conjunto finito de valores, entonces *X* es absolutamente continua y su f.d.p. esta dado por

\begin{equation}
  f(x) =
    \begin{cases}
      F'(x), & \forall x \text{ donde exista} \\
      0 & \text{en caso contrario}
    \end{cases}       
\end{equation}

En este curso nos concentraremos en trabajar con v.a. absolutamente continuas.

### Definicion:

Sea $p \in (0;\ 1)$ y *X* una variable aleatoria continua sobre (S, A, P) y con f.d.a. F entonces se llama **percentil (p 100) o cuantil p de X** al valor **$\eta(p)$** tal que
$$ p = F(\eta(p)) $$

Si la grafica de la f.d.p. de *X* es

![Image 2](resources/imgs_chapter_iv/img_2.png)

### Proposicion:

Sea *X* una variable aleatoria continua con f.d.a. $F_{X}$ y $\eta_{X}(q)$, con $q \in [0;\ 1]$. Si $Y = aX + b$ con $a \ne 0$ y $b \in \mathbb{R}$ y $p \in [0;\ 1]$ entonces
\begin{equation}
    \eta_{Y}(p) =
    \begin{cases}
        a \eta_{X} (p) + b & \text{si } a > 0 \\
        a \eta_{X} (1 - p) + b & \text{si } a < 0
    \end{cases}
\end{equation}

## Esperanza y Varianza de una variable aleatoria continua

### Definicion:

Sea *X* una variable aleatoria continua sobre $(S, A, P)$ y con funcion de densidad de probabilidad $f$ entonces se define el **valor esperado o valor media o esperanza de X** a  
$\int_{-\infty}^{\infty} x f(x)dx$ siempre que $\int_{-\infty}^{\infty} |x| f(x) dx < \infty$

**Notacion:** $E(X) = \mu$

Como calcular la esperanza de una funcion de una variable aleatoria continua X? sin necesidad de hallar su f.d.p.

### Proposicion:

Sea *X* una variable aleatoria continua $(S, A, P)$ y con f.d.p. $f$. Si $h(X)$ es una variable aleatoria continua entonces

\begin{align}
    E(h(X)) = \int_{-\infty}^{\infty} h(x) f(x) dx
\end{align}

siempre que $\int_{-\infty}^{\infty} |h(x)| f(x) dx < \infty.$

### Definicion:

Sea *X* una variable aleatoria continua con f.d.p. $f$ entonces se define la **varianza de X** como $E((X - \mu)^{2}) = \int_{-\infty}^{\infty} (x - \mu)^{2} f(x) dx$ siempre que $E(X^{2}) < \infty$ y donde $\mu = E(X)$.  
y se llama **desviacion estandar de X** a la raiz cuadrada de la varianza.

**Notacion:** Para la varianza $V(X) = \sigma^{2}$ y para el desvio estandar $\sigma$.

### Proposicion:

Sea *X* una variable aleatoria continua $f$ f.d.p. y $E(X^{2}) < \infty$ entonces

a) $0 \le V(X) = E(X^{2}) - \mu^{2}$ donde $\mu = E(X).$  
b) \begin{align}
    E(aX + b) &= aE(X) + b & \text{ y} \\
    V(aX + b) &= a^{2} V(X);\ \forall a,\ b \in \mathbb{R}
\end{align}

## Distribucion Uniforme

### Definicion:

Sea *X* una variable aleatoria continua entonces diremos que tiene **distribucion Uniforme en el intervalo [a, b]** si su funcion densidad de probabilidad es
\begin{equation}
    f(x) =
    \begin{cases}
        \frac{1}{(b-a)}, & si\ x \in [a, b] \\
        0, & caso\ contrario.
    \end{cases}
\end{equation}

**Notacion:** $X \sim U[a, b].$

Caso particular es cuando $a = 0$ y $b = 1$, la que es muy util para estudios de simulacion.

### Proposicion:

Si $X \sim U[0, 1]$ entonces:  
a) Sea $p \in (0, 1)$ entonces $\eta_{X}(p) = p.$  
b) $E(X) = \frac{1}{2}$ y $V(X) = \frac{1}{12}.$  
c) Para cualquier $a < b$ numeros reales y sea la v.a. $Y = (b-a)X + a$ entonces  
i)  
\begin{align}
    Y \sim U[a, b]
\end{align}
ii)  
\begin{align}
    \eta_{Y}(p) = (b - a)p + a \text{ para cualquier p } \in (0, 1).
\end{align}
iii)
\begin{align}
    E(Y) = \frac{a + b}{2} \text{ y } V(Y) = \frac{(b-a)^{2}}{12}.
\end{align}

### Ejemplo:

El tiempo (en minutos) que tarda un camion en realizar un viaje (ida y vuelta), para transportar concreto hacia una obra en construccion, tiene distribucion uniforme en el intervalo [50, 70].  

a) Cual es la probabilidad que la duracion del viaje de un camion sea menor de 65 minutos?  

b) Cual es la probabilidad que la duracion del viaje de un camion sea mayor de 65 minutos dado que se sabe que fue mayor a 55 minutos?  

c) Dar el valor medio y desviacion estandar del tiempo que tarda un camion en realizar un viaje (ida y vuelta), para transportar concreto hacia esta obra en construccion.  

d) Suponga que los tiempose que tardan cada uno de tres camiones en realizar un viaje (ida y vuelta), para transportar concreto hacia esta obra en construccion, son independientes entre si. Cual es la probabilidad que por lo menos uno de ellos tarde mas de 65 minutos?

## Distribucion normal o gaussiana

Esta distribucion es una de las mas importantes dentro de la Teoria de la Probabilidad y Estadistica. Muchas variables pueden ser aproximadas por esta distribucion, como ser: errores de medicion en experimentos cientificos, calificaciones en diversas pruebas, mediciones antropometricas, tiempo de reaccion en experimentos sicologicos, etc.

### Definicion:

Sea *X* una variable aleatoria continua entonces diremos que tiene **distribucion Normal de parametros $\mu$ y $\sigma^{2}$** si su funcion de densidad de probabilidad es
$$ f(x, \mu, \sigma^{2}) = \frac{1}{\sqrt{2\pi\sigma^{2}}} e^{-(x-\mu)^{2}/(2\sigma^{2})} \forall x \in \mathbb{R}.$$
donde $\mu \in \mathbb{R}$ y $\sigma > 0.$

**Notacion:** $X \sim N(\mu, \sigma^{2}).$

### Propiedades de la f.d.p. de una $N(\mu, \sigma^{2})$

a) $f(x,\mu,\sigma^{2}) \ge 0 \forall x \in \mathbb{R}$ y $\int_{-\infty}^{\infty} f(x, \mu, \sigma^{2}) dx = 1. $  

b) Simetrica respecto de $\mu$, o sea si
$$ f(\mu-x, \mu, \sigma^{2}) = f(\mu + x, \mu, \sigma^{2}) \forall x \in \mathbb{R}$$  

c) Tiene un punto de macimo en $\mu$ y puntos de inflexion en $(\mu \pm \sigma).$  

d) $$\lim\limits_{x \to -\infty} f(x, \mu, \sigma^{2}) = \lim\limits_{x \to +\infty} f(x, \mu, \sigma^{2}) = 0 $$  

e) La grafica tiene forma de campana.

![Image 3](resources/imgs_chapter_iv/img_3.png)

![Image 4](resources/imgs_chapter_iv/img_4.png)

Dentro de esta familia de distribuciones un caso particular es cuando $\mu = 0$ y $\sigma = 1$, que recibe el nombre de **normal estandar** y se simboliza la v.a. con $Z \sim N(0, 1).$

La f.d.a. de *Z* se la denota como
$$ \Phi(z) = \int_{-\infty}^{z} \frac{1}{\sqrt{2\pi}} e^{-\frac{x^{2}}{2}} dx;\ \ \forall z \in \mathbb{R}. $$

### Proposicion:

Si $Z \sim N(0, 1)$ entonces $E(Z) = 0$ y $V(Z) = 1$.

Para el calculo de probabilidades de una normal estandar hay tablas, generadas por metodos de integracion numerica.  

En la tabla que usaremos se encuentra tabulado el area sombreada, $\Phi(z) = P(Z \le z)$, para valores $z \in \mathbb{R}$.

![Image 5](resources/imgs_chapter_iv/img_5.png)

## Ejercicios para el manejo de la tabla N(0, 1)

I) Calcular las siguientes probabilidades:  

a) $P(Z \le 0)$  

b) $P(0 \le Z \le 2.57)$  

c) $P(-2.57 \le Z \le 2.57) = P(|Z| \le 2.57)$  

d) $P(Z \ge -1.75)$  

e) $P(Z \ge 2.57)$

II) Determinar el valor de la constante *c* tal que:  

a) $\phi(c) = 0.9838$  

b) $P(0 \le Z \le c) = 0.291)$  

c) $P(|Z| \le c) = 0.668$

III) Determinar los percentiles 25; 50 y 75.

### Proposicion:

Si $X \sim N(\mu, \sigma^{2})$ entonces  

a) $Z = \frac{X - \mu}{\sigma} \sim N(0, 1)$ (Estandarizacion de *X*).  

b) $E(X) = \mu = \tilde{\mu}$ y $V(X) = \sigma^{2}$

**Observacion:** Si $X \sim N(\mu, \sigma^{2})$ entonces para calcular $P(a \le X \le b)$ primero se debe estandarizar la v.a. *X* y despues usar la tabla de la $N(0, 1)$.
$$P(a \le X \le b) = \phi\left(\frac{b - \mu}{\sigma}\right) - \phi\left(\frac{a - \mu}{\sigma}\right)$$
para todo $a < b$ numeros reales, donde $\phi$ es la f.d.a. de una v.a. $N(0, 1)$.

### Ejemplo:

En una empresa hay dos maquinas disponibles A y B que cortan corchos, para ser usados en botellas de vino, tal que el 40% son cortados con la maquina A y el resto con la B. Se sabe que la maquina A corta corchos con diametro que estan normalmente distribuido con una media de 3cm y una desviacion estandar de 0.1cm y la maquina B corta corchos con diametro que estan normalmente distribuido con una media de 3.04cm y una desviacion estandar de 0.02cm.  

Para que un corcho sea aceptable, para su uso, debe cumplir que su diametro este comprendido entre 2.9 y 3.1cm.  

**a)** Cual de las dos maquinas producen mayor porcentaje de corchos aceptables?  

**b)** Se selecciona al azar un corcho de la produccion, cual es la probabilidad que el corcho sea aceptable?  

**c)** Para la maquina que produce mayor porcentaje de corchos aceptables:  
- **i)** Cual es la probabilidad que el diametro este comprendido entre 2.99 y 3.05 cm?  
- **ii)** Si se seleccionan al azar 10 corchos de la produccion, cual es la probabilidad que el diametro este comprendido entre 2.99 y 3.05cm en por lo menos dos de los 10?  
- **iii)** Hallar los percentiles 30 y 70 para la variable diametro del corcho cortado con la maquina elegida.

## Distribucion Gamma

No todas las variables aleatorias continuas tienen una funcion de densidad de probabilidad (f.d.p.) simetrica un ejemplo son la familia de distribuciones Gamma, que son sesgadas a derecha y definidas positiva.  

Antes de dar la definicion de la f.d.p. gamma definiremos la funcion gamma, muy importante en muchas ramas de la matematica.

### Definicion:

Para $\alpha > 0$, la **funcion gamma** evaluada en $\alpha$ esta definida como $$\Gamma(\alpha) = \int_{0}^{\infty} x^{\alpha - 1} e^{-x} dx.$$

### Propiedades de la funcion gamma

a) $\Gamma(\alpha) = (\alpha - 1) \Gamma(\alpha - 1)$ para cualquier $\alpha > 1$.  
b) $\Gamma(n) = (n-1)! \forall n \in \mathbb{N}$.  
c) $\Gamma(1/2) = \sqrt{\pi}$.

### Distribucion gamma

### Definicion:

Se dice que una variable aleatoria *X* tiene **distribucion gamma con parametros $\alpha$ y $\beta$** si la f.d.p. es
\begin{equation}
    f(x, \alpha, \beta) = 
    \begin{cases}
        \frac{1}{\beta^{\alpha} \Gamma(\alpha)} x^{\alpha - 1} e^{-\frac{x}{\beta}} & x \ge 0 \\
        0 & caso\ contrario
    \end{cases}
\end{equation}
para $\alpha$ y $\beta$ numeros positivos.

**Notacion:** $X \sim \Gamma(\alpha, \beta)$

### Proposicion:

Sea *X* una v.a. con distribucion $\Gamma(\alpha, \beta)$ entonces:
$$ E(X) = \mu = \alpha\beta \text{ y } V(X) = \sigma^{2} = \alpha \beta^{2}. $$

Dentro de esta familia cabe mencionar dos distribuciones una de ellas tiene multiples aplicaciones y la otra es usada en inferencia estadistica, ellas son la distribucion exponencial y la Ji-cuadrado o Chi-cuadrado.

## Distribucion exponencial

### Definicion:

Se dice que una variable aleatoria *X* tiene **distribucion exponencial de parametro $\lambda$** si la f.d.p. es

\begin{equation}
    f(x, \lambda) =
    \begin{cases}
        \lambda e^{-\lambda x} & x \ge 0 \\
        0 & en\ caso\ contrario
    \end{cases}
\end{equation}

para $\lambda > 0$.  
**Notacion:** $X \sim exp(\lambda) = \Gamma(1, 1/\lambda)$

![Image 6](resources/imgs_chapter_iv/img_6.png)

### Consecuencias:

Si $X \sim exp(\lambda)$ entonces  

a) $E(X) = \mu = \frac{1}{\lambda}$ y $V(X) = \sigma^{2} = \frac{1}{\lambda^{2}}.$  

b)
\begin{equation}
    F(x, \lambda) =
    \begin{cases}
        0 & si\ x < 0 \\
        1 - e^{-\lambda x} & si\ x \ge 0
    \end{cases}
\end{equation}  

c) Si $t_{0} > 0$ entonces  
\begin{align}
    P(X \ge t + t_{0} | X \ge t_{0}) = P(X \ge t) \ \ \forall t > 0
\end{align}

Esta distribucion es muy utilizada para modelar por ejemplo el tiempo de vida o duracion de componentes electronicos, con lo cual por la propiedad enunciada en el item c (conocida como **"carencia de memoria"**) significa que no se tiene en cuenta el efecto desgaste producido por el paso del tiempo y por lo tanto puede ocurrir en algunas situaciones problemas que esta no sea adecuada. Ahora existen otras distribuciones alternativas como la Weilbull y la lognormal.

## Distribucion Ji-cuadrado

### Definicion:

Se dice que una variable aleatoria *X* tiene **distribucion Ji-cuadrado de parametro *k*** si la f.d.p. es

\begin{equation}
    f(x, k) =
    \begin{cases}
        \frac{1}{2^{k/2} \Gamma(k/2)} x^{(k/2)-1} e^{-\frac{x}{2}} & x \ge 0 \\
        0 & caso\ contrario
    \end{cases}
\end{equation}

para $k > 0$.

**Notacion:** $X \sim \chi^{2}(k) = \Gamma(k/2, 2).$

![Image 7](resources/imgs_chapter_iv/img_7.png)

### Consecuencias:

Si $X \sim \chi^{2}(k)$ entonces
$$E(X) = \mu = k \text{ y } V(X) = \sigma^{2} = 2k$$

Esta distribucion es muy importante en procedimientos estadisticos (Intervalos de confianza y pruebas de hipotesis para la varianza poblacional).

### Proposicion:

Si $Z \sim N(0, 1)$ entonces $Z^{2} \sim \chi^{2}(1).$