# Probabilidad


## Definiciones básicas

En experimentos aleatorios, la lista de todos los posibles resultados se denomia **espacio muestral**, denotado por $S$
<img src="figuras/im1.jpg" width="800"> 

- La lista consiste de **resultados indiviuduales** o **elementos**. El esapcio muestral puede ser finito o infinito y puede ser discreto o continuo. Estos elementos tienen las propiedades de que son *mutuamente excluyentes* y de que son *exhaustivos*.

- Un evento es un subconjunto de un espacio muestral $S$: estos generalmente se denotan con letras mayúsculas, $A, B,$ etc. Denotamos por $P(A)$ la probabilidad de que el evento $A$ ocurra en cada repetición del experimento aleatorio.

*Ejercicios*
- Considere el experimento de lanzar un dado. Escriba el espacio muestral si nos interesara el número que aparece en la cara superior
- Considere el experimento de lanzar un dado. Escriba el espacio muestral si nos interesara si es par o impar
- Escriba el espacio muestral de las figuras anteriores.
- Denote el conjunto de ciudades con mas de un millon de habitantes
- Denote el conjunto de todos los puntos $(x,y)$ que se encuentran dentro de un circulos de diametro 4 con centro en el origen
- Dado el espacio muestral $S = \lbrace t \vert t \geq 0 \rbrace $ , donde $t$ es la vida en años de cierto componen te electrónico. Denote el evento $A$ de que el componente falle antes de que finalice el quinto año 




## Conjuntos
Es conveniente utilizar la notación de **conjuntos** al derivar probabilidades de eventos. Esto lleva a que el espacio muestral $S$ se denomine *conjunto universal*, el conjunto de todos los resultados: un evento $A$ es un *subconjunto* de $S$. Estos nos permite denotar operaciones con conjuntos.

<img src="figuras/im2.jpg" width="600"> 

- Union $A \cup B = \lbrace x\vert x \in A \text{ o } x \in B  \text{ o ambos }\rbrace$

- Intersección $A \cap B = \lbrace x\vert x \in A \text{ y } x \in B  \rbrace$

- Complement $A^{c}= \lbrace x \vert x \notin A \rbrace$

¿Los siguientes diagramas que operaciones representan?
<img src="figuras/im3.jpg" width="600"> 

- El **conjunto vacio** se denonta como $\phi$ este conjunto no tiene elementos. Dos ejemplos de conjuntos vacios $S^{c}=\phi$ y si $A$ y $B$ **son conjuntos mutamente excluyentes** es decir que no tiene elementos en común, entonces $A \cap B= \phi$, se dice que son conjuntos disjuntos. 



*Ejercicios*
- Sean $V = \lbrace a , e, i, o, u \rbrace y C = \lbrace l, r, s, t\rbrace$; encuentre $V   \cap C$
- Sean $A =  \lbrace a, b, c \rbrace $ y $B =  \lbrace b, c, d, e\rbrace $; encuentre $A  \cap B$ 
- Si $M = \lbrace x \vert 3 < x < 9 \rbrace y N = \lbrace y \vert 5 < y < 12\rbrace$, encuentre $M  \cup N$  
- Del siguiente diagrama encuentre las regiones en (a)$A \cup C$, (b)$B´ \cap C$, (c)$A\cap B \cap C$, (d) $(A \cup B) \cap C'$

<img src="figuras/imeje1.png" width="400"> 


## Estimación de probabilidad de un evento
Conteo del número de puntos. 

Si una operación se puede llevar a cabo en $n_{1}$ formas, y si para cada una de éstas se
puede realizar una segunda operación en $n_{2}$ formas, entonces las dos operaciones se pueden ejecutar juntas de $n_{1}n_{2}$ formas.


Existen dos forma para estimar la probabilidad de un evento $A$, la primera es la frecuencia relativa:

$$ \frac{\text{la cantidad de veces que ocurre un evento particular } A}{\text{número total de ensayos}}$$

La otra es que si se tiene un conjunto finito y los resultados son equiprobables, como el lanzamiento de un dado, entonces la probabilidad es estimado por 

$$ P(A)= \frac{\text{número de elementos de $S$ cuando $A$ ocurre}}{\text{número de elementos en $S$}}$$


## Probabilidad de eventos y conjuntos
La probabilidad de cualquier evento debe satisfacer los siguientes tres axiomas

- Axioma 1: $0 \leq P(A) \leq 1$ para cada evento $A$
- Axioma 2: $P(S)=1 $
- Axioma 3: $P(A\cup B)=P(A)+P(B)$ si y sólo si $A$ y $B$ son mutamente excluyentes ($A\cap B=\phi$) 
- Axioma 4: $P(\phi)=0$

Estos cuatro axiomas se pueden extender a más de eventos mutamente excluyentes:

En $S$ donde $A_{i} \cap A_{j} = \phi \text{  } \forall \text{  } i\neq j$. Esto es conocido como partición de $S$ si 

- $A_{i} \cap A_{j} = \phi \text{  } \forall \text{  } i\neq j$.
- $\bigcup\limits_{i=1}^{k} A_{i}= A_{1} \cup A_{2} \cup \ldots \cup A_{3}= S$. $A_{1},A_{2}, \ldots ,A_{k}$ es una **lista exhaustiva** tal que one de los eventos debe ocurrir
- $P(A_{i})>0$

### Teoremas 
- $P(S) = P(A_{1}\cup A_{2} \cup \cdots \cup  A_{k})= \displaystyle \sum_{i=1}^{k}{P(A_{i})}=1$

- $P(A^{c})=1-P(A)$


- $P(A\cup B)= P(A)+P(B)-P(A\cap B)$


- $P(S)=P(A \cup A^{c})= P(A)+P(A^{c})=1$


- Para cualquier conjunto $A$ y $B$  
$A\cup B= A\cup (B\cap A^{c})$, 
$B=(A\cap B)\cup (B\cap A^{c})$

en donde $A$ y $B \cap A^{c}$ son conjuntos disjuntos y  $A\cap B$ and $B\cap A^{c}$  son conjuntos disjuntos. Por lo tanto

- $P(A\cup B)=P(A)+P(B\cap A^{c}) $
- $P(B)=P(A\cup B)+P(B\cap A^{c}) $

Estas dos expresiones nos llevan a 
- $P(A\cup B)=P(A)+P(B)-P(A\cup B)$ 

*Ejemplos*

- Una moneda se lanza dos veces. ¿Cuál es la probabilidad de que ocurra al menos una cara (H)?

- Se tiran dos dados honestos distinguibles a y b y se anotan los valores de las caras superiores. ¿Cuáles son los elementos del espacio muestral? ¿Cuál es la probabilidad de que la suma de los valores de los dos dados sea 7? ¿Cuál es la probabilidad de que aparezca al menos un 5?

- Se carga un dado de forma que exista el doble de probabilidades de que salga un número par que uno impar. Si E es el evento de que ocurra un número menor que 4 en un solo lanzamiento del dado, calcule $P(E)$.

- Del ejemplo anterior sea $A$ el evento de que resulte un número par y sea $B$ el evento de que resulte un número divisible entre 3. Calcule $P(A \cup B)$ y $P(A \cap B)$.

- De un mazo bien mezclado de 52 naipes, se saca una sola carta al azar. Calcula la probabilidad de que sea un corazón o un as.

- Suponga tres eventos $A, B$ y $C$, que no son excluyentes encuentre $P(A \cup B \cup C)$



## Probabilidad condicional e independencia 

Si la ocurrencia de un evento $B$ se ve afectada por la ocurrencia de otro evento $A$, entonces
decimos que $A$ y $B$ son eventos dependientes. Cuando se realiza el experimento, se sabe que ha ocurrido el evento $A$. ¿Afecta esto la probabilidad de $B$? Sí lo hace se convierte en una probabilidad condicional de $B$ dada $A$, escrita como $P (B \vert A)$. Por lo general, esto será distinto de la probabilidad $P (B)$. La probabilidad condicional de B está restringida a la parte del espacio muestral donde $A$ ocurrió. Esta probabilidad condicional se define como

$$
P(B\vert A)= \frac{P(A\cap B)}{ P(A)} \text{,        } \quad P(A)>0
$$

o su equivalente 

$$
P(A\cap B)= P(A) P(B\vert A)  \text{,        } \quad P(A)>0
$$

En términos de conteo, suponga que un experimento se repite $N$ veces, de las cuales $A$ ocurre $N (A)$ veces, y $A$ dado por $B$ ocurre $N (B ∩ A)$ veces. La proporción de veces que ocurre $B$ es


$$
\frac{N(A\cap B)}{N(A)}= \frac{N(A\cap B)}{N}\frac{ N}{N(A)}
$$

Si la probabilidad de $B$ no es afectada por la ocurrencia de $A$, entonces son *eventos independientes* 
$$
P(B\vert A)=P(B)
$$

lo que implica que 
$$
P(A\cap B)=P(A)P(B)
$$

### *Ejemplos*

*Ejercicios*
- suponga que tenemos un espacio muestral S constituido por la población de adultos de una pequeña ciudad

| |  Empleado | Desempleado | Total |
| :-: | :-: | :-: |:-: |
| Hombre | 460 | 40 | 500
| Mujer | 140 | 260 | 400
| Total | 600| 300 | 900

Se seleccionará al azar a uno de estos individuos ¿Cuál es la probabilidad de que sea hombre dado que tiene empleo?


- Suponga que tenemos una caja de fusibles que contiene 20 unidades, de las cuales 5 están defectuosas. Si se seleccionan 2 fusibles al azar y se retiran de la caja, uno después del otro, sin reemplazar el primero, ¿cuál es la probabilidad de que ambos fusibles estén defectuosos?

- Considere el evento $B$ de obtener un cuadrado perfecto cuando se lanza un dado. El dado se construye de modo que los números pares tengan el doble de probabilidad de ocurrencia que los números nones. Con base en el espacio muestral S = {1, 2, 3, 4, 5, 6}, ¿Cuál es la probabilidad de que ocurra $B$?  Suponga ahora que se sabe que el lanzamiento del dado tiene como resultado un número mayor que 3. ¿cuál es el nuevo espacio muestra?¿Cuál la probabilidad de $P(B\vert A)$?


- Un candado de seguridad se puede abrir ingresando 2 dígitos (cada uno de $1, 2,\ldots, 9$) que tendrá $10^{2} = 100$ códigos posibles. Un viajero ha olvidado el código e intenta encontrar el código eligiendo 2 dígitos al azar. Si el código no abre el candado, el viajero intenta con otro código de los pares. ¿Cuál es la probabilidad de que el nuevo código abre el caso, o cualquier intento posterior?


- Sea $A$ y $B$ eventos independientes con $P(A)=1/4$ y $P(B)=2/3$. Calcule las siguientes probabilidades: (a) $P(A\cap B)$, (b)$P(A\cap B^{c})$, (c)$P(A^{c}\cap B^{c})$, (d) $P(A^{c}\cap B)$, (e) $P((A\cap B)^{c})$ 
- Para tres eventos $A$, $B$ y $C$ de muestre que 

$$
P(A\cap B \vert C)= P(A\vert B \cap C)P(B\vert C)
$$

donde $P(C)>0$


## Ley de probabilidad total o teorema de partición

Supongamos que  $A_{1},A_{2},\ldots, A_{k}$ representa una partición de S en k conjuntos mutamente exculyentes. Cuando se lleva a cabo un experimento aleatorio, solo uno de los eventos puede tener lugar.

<img src="figuras/im4.png" width="400"> 

Suponga que $B$ es otro evento asociado con el mismo experimento aleatorio. Entonces $B$ debe estar formado por la suma de las intersecciones de $B$ con eventos en la partición. Algunos de estos estarán vacíos, pero esto no importa. Podemos decir eso $B$ es la unión de las intersecciones de B con cada $A_{i}$. Así

$$
B=\bigcup\limits_{i=1}^{k}B \cap A_{i}
$$

el punto significativo es que cualquier par de estos eventos es mutuamente excluyente. Esto resulta en 

$$
P(B)=\displaystyle \sum\limits_{i=1}^{k}P(B \cap A_{i})
$$

Entonces la ecuación 

$$
P(B\cap A_{i})= P(B\vert A_{i}) P(A_{i})
$$

Entonces también puede expresarse como 

$$
P(B)=\displaystyle \sum\limits_{i=1}^{k}P(B\vert A_{i}) P(A_{i})
$$

La cual es la ley de probabilidad total o teorema de partición


**Regla de Bayes**

Regresemos al ejemplo de la tabla, en el que se selecciona un individuo al azar de entre los adultos de una pequeña ciudad. Suponga que ahora se nos da la información adicional de que 36 de los empleados y 12 de los desempleados son miembros de un Club . Deseamos encontrar la probabilidad del evento $A$ de que el individuo
seleccionado sea miembro del Club. Podemos remitirnos a la figura y escribir $A$ como la unión de los dos eventos mutuamente excluyentes $E \cap A$ y $E' \cap A$. Por lo tanto, $A = (E \cap A) \cup (E' \cap A)$, y mediante el los teoremas anteriores, podemos escribir



$$
P(A) = P [(E \cap A) \cup (E' \cap A)] = P(E \cap A) + P(E' \cap A) = P(E)P(A\vert E) + P(E')P(A\vert E').
$$
$$
P(A) = P(E)P(A\vert E) + P(E')P(A\vert E')
$$

<img src="figuras/im6.png" width="300"> 


 con los datos adicionales antes dados para el conjunto $A$, nos permiten calcular

$$
P (E) = 600/900= 2/3 \quad P (A \vert E ) =36/600= 3/50
$$


$$
P (E') = 1/3 \quad P (A \vert E' ) =12/300= 1/25
$$


con esta información se puede generar un diagrama de árbol 


<img src="figuras/im8.png" width="300"> 

Si mostramos estas probabilidades mediante el diagrama de árbol, donde la primera rama da la probabilidad $P(E)P(A\vert E)$ y la segunda rama da la probabilidad P(E')P(A|E'), deducimos que


$$
P(A)= \frac{2}{3}\frac{3}{50}+ \frac{1}{3} \frac{1}{25}= \frac{4}{75}
$$


**Regla general de Bayes**

Si los enventos $B_{1},B_{2},\ldots,B_{k}$ constituyen una partición del espacio muestral S, donde $P(B_{i}) \neq 0$ para $i=1,2,\ldots, k$ entonces, para cualquier evento A en S, tal que $P(A)\neq 0$,

$$
    P(B_{r}\vert A)= \frac{P(B_{r}\cap A)}{\displaystyle \sum\limits_{i=1}^{k} P(B_{i}\cap A)}= \frac{P(B_{r})P(A\vert B_{r})}{ \displaystyle \sum\limits_{i=1}^{k}P(B_{i})P(A\vert B_{i})}
$$

<blockquote>
*Ejercicios*

- Tres máquinas de cierta planta de ensamble, $B_{1} , B_{2}$ y $B_{3}$ , montan 30%, 45% y 25% de los productos, respectivamente. Se sabe por experiencia que 2%, 3% y 2% de los productos ensamblados por cada máquina, respectivamente, tienen defectos. Ahora bien, suponga que se selecciona de forma aleatoria un producto terminado. ¿Cuál es la probabilidad de que esté defectuoso?

- Con referencia al ejemplo anterior, si se elige al azar un producto y se encuentra que está defectuoso, ¿cuál es la probabilidad de que haya sido ensamblado con la máquina B 3 ?

- Una empresa de manufactura emplea tres planos analíticos para el diseño y desarrollo de un producto específi co. Por razones de costos los tres se utilizan en momentos diferentes. De hecho, los planos 1, 2 y 3 se utilizan para 30%, 20% y 50% de los productos, respectivamente. La tasa de defectos difi ere en los tres procedimientos de la siguiente manera,
$$
P(D\vert P_{1} ) = 0.01, P(D\vert P_{2} ) = 0.03, P(D \vert P_{3} ) = 0.02,
$$
en donde $P(D\vert P_{j} )$ es la probabilidad de que un producto esté defectuoso, dado el plano $j$. Si se observa un producto al azar y se descubre que está defectuoso, ¿cuál de los planos tiene más probabilidades de haberse utilizado y, por lo tanto, de ser el responsable?
    
 </blockquote>

## Variables aleatorias discretas

Una **variable aleatoria** es una función que asocia un número real con cada elemento del espacio muestral. Utilizaremos una letra mayúscula, digamos $X$, para denotar una variable aleatoria, y su
correspondiente letra minúscula, $x$ en este caso, para uno de sus valores.

Ejemplo. cuando se prueban tres componentes electrónicos, el espacio muestral que ofrece una descripción detallada de cada posible resultado se escribe como

$$
S = \lbrace NNN, NND, NDN, DNN, NDD, DND, DDN, DDD\rbrace,
$$

donde $N$ denota “no defectuoso”, y $D$, “defectuoso”. Es evidente que nos interesa el número de componentes defectuosos que se presenten. De esta forma, a cada punto en el espacio muestral se le asignará un valor numérico de 0, 1, 2 o 3. 

<blockquote>
*Ejericios* 

- De una urna que contiene 4 bolas rojas y 3 negras se sacan 2 bolas de manera sucesiva, sin reemplazo. ¿Cuáles son Los posibles resultados y los valores y de la variable aleatoria $Y$?  si $Y$ es el número de bolas rojas.



- El empleado de un almacén regresa tres cascos de seguridad al azar a tres obreros de un taller siderúrgico que ya los habían probado. Si Smith, Jones y Brown, en ese orden, reciben uno de los tres cascos, liste los puntos muestrales para los posibles órdenes en que el empleado del almacén regresa los cascos, después calcule el valor m de la variable aleatoria M que representa el número de emparejamientos correctos.
</blockquote>


Cada variables aleatorias tiene, a su vez, espacios muestrales cuyos elementos generalmente se denotan con letras minúsculas como $x_{1}, x_{2}, x_{3},\ldots$ para la variable aleatoria $X$. Ahora estamos interesados en asignar probabilidades a eventos como $P (X = x_{1})$, la probabilidad de que la variable aleatoria $X$ sea $x_{1}$, o $P (X \leq x_{2})$, la probabilidad de que la variable aleatoria variable es menor o igual que $x_{2}$

Si el espacio muestral es finito o contablemente infinito en los números enteros (es decir, los elementos  $x_{1}, x_{2}, x_{3},\ldots$ o pueden contarse con números enteros, digamos $0, 1, 2,\ldots$) entonces **la variable aleatoria es discreta**. Técnicamente, el conjunto $\lbrace x_{i}\rbrace$ será un subconjunto contable $V$, digamos, de los números reales $R$. Podemos representar el $\lbrace x_{i}\rbrace$  genéricamente por la variable $x$ con $x \in V$. Por ejemplo, $V$ podría ser el conjunto

$$
\lbrace 0, 1/2 , 1, 3/2 , 2, 5/2 , 3, \ldots \rbrace 
$$


En muchos casos $V$ consiste simplemente de enteros o un subconjunto de enteros, tales 


$$
V = \lbrace0, 1 \rbrace \text{  o  } V = \lbrace 0, 1, 2, 3, \ldots \rbrace  \text{ incluso } V = \lbrace \ldots − 3, −2, −1, 0, 1, 2, 3, \ldots \rbrace
$$

La probabilidad se denota por 
$$
p(x_{i} ) = P(X = x_{i} )
$$







## Distribución de probabilidad
Una variable aleatoria discreta toma cada uno de sus valores con cierta probabilidad. Por ejemplo, si los pesos son iguales para los eventos del ejemplo de los cascos, la probabilidad de que el obrero no reciba el casco
correcto M toma  m valores posibles y  sus probabilidades son

| m |  0 | 1| 3 | 
| :-: | :-: | :-: |:-: |
| P( M = m)| 1/3| 1/2|1/6


Con frecuencia es conveniente representar todas las probabilidades de una variable aleatoria $X$ usando una fórmula, la cual necesariamente sería una función de los valores numéricos $x$ que denotaremos con $p (x)$, $f(x)$, $g (x)$ y así sucesivamente. Por lo tanto, escribimos $p(x_{i}) = P(X = x_{i});$ es decir, $p (3) = P(X = 3)$. Al conjunto de pares ordenados $(x_{i},p (x_{i}))$ se le llama **función de probabilidad, función de masa de probabilidad o distribución de probabilidad de la variable aleatoria discreta $X$**. Ya que los valores $x$ son mutamente excluyentes y exhaustivos entonces cumplen 

$$
0 \leq p (x_{i}) \leq 1 \quad \forall i,
$$

$$
\sum\limits_{i=1}^{\infty} p (x_{i}) =1   
$$

$$
P(X \leq x_{k})= \sum\limits_{i=1}^{k} p (x_{i}) \text{ para  } k=0,1,2,\ldots   
$$


*Ejemplos*

- Un embarque de 20 computadoras portátiles similares para una tienda minorista contiene 3 que están defectuosas. Si una escuela compra al azar 2 de estas computadoras, calcule la distribución de probabilidad para el número de computadoras defectuosas.

Respuesta: sea X una variable aleatoria cuyos valores x son los números posibles de computadoras defectuosas compradas por la escuela. Entonces x sólo puede asumir los números 0, 1 y 2. Así,

$$
f(0)=P(X=0)= \frac{\binom{3}{0} \binom{17}{2} }{\binom{20}{2}}=\frac{68}{95}
$$

$$
f(1)=P(X=1)= \frac{\binom{3}{1} \binom{17}{1} }{\binom{20}{2}}=\frac{51}{190}
$$


$$
f(2)=P(X=2)= \frac{\binom{3}{2} \binom{17}{0} }{\binom{20}{2}}=\frac{3}{190}
$$

por consiguiente 

| $x$ |  0 | 1| 2 | 
| :-: | :-: | :-: |:-: |
| $f(x)$| $\frac{68}{95}$| $\frac{51}{190}$| $\frac{3}{190}$

- Se lanza un dado justo hasta que el primer 6 aparezcan boca arriba. Encuentre la probabilidad de que el primer 6 aparezcan en el n-ésimo lanzamiento.

Respuesta: Sea la variable aleatoria $N$ el número de lanzamientos hasta que el primer 6 aparezcan boca arriba. Este es un ejemplo de una variable aleatoria discreta $N$ con un número infinito de posibles resultados

$$
\lbrace 1, 2, 3, \ldots \rbrace 
$$

La probabilidad de que aparezca un $6$ para cualquier lanzamiento es $1/6$ y de que aparezca cualquier otro número es $5/6$. Por lo tanto, la probabilidad de que aparezcan $n - 1$ números distintos del $6$ seguido de un 6 es

$$
P(N=n)= \binom{5}{6}^{n-1} \binom{1}{6}= \frac{5^{n-1}}{6^{n}}
$$

que es la función de masa de probabilidad para esta variable aleatoria.

En este ejemplo, la distribución tiene la probabilidad

$$
P(N \leq k) = \frac{1}{6}+ \frac{1}{6}\frac{5}{6} + \cdots \frac{1}{6}\left(\frac{5}{6}\right)^{k-1} = \frac{1}{6} \displaystyle \sum_{i=1}^{k}{\left(\frac{5}{6}\right)}^{i-1}= 1- \left(\frac{5}{6}\right)^{k}
$$

para $k = 1, 2, \ldots 6$ after summing the geometric series.


<blockquote>

*Ejercicio*
- Si una agencia automotriz vende 50% de su inventario de cierto vehículo extranjero equipado con bolsas de aire laterales, calcule una fórmula para la distribución de proba bilidad del número de automóviles con bolsas de aire laterales entre los siguientes 4 vehículos que venda la agencia.
</blockquote>



## Función de la distribución acumulativa
Existen muchos problemas en los que desearíamos calcular la probabilidad de que el valor observado de una variable aleatoria $X$ sea menor o igual que algún número real $x$. Al escribir $F(x) = P(X \leq x)$ para cualquier número real $x$, definimos $F(x)$ como la función de la distribución acumulativa de la variable aleatoria $X$.

La función de la distribución acumulativa $F(x)$ de una variable aleatoria discreta $X$ con distribución de probabilidad $f(x)$ es

$$
F(x ) = P (X\leq x ) = \sum_{t\leq x} f (t), \text{  para  } -\infty < x < \infty.
$$

<blockquote>
*Ejercicio*
    
Realice un tabla de distribución acumulativa del ejemplo de emparejamiento de los cascos. 
</blockquote>

## Variables y  distribuciones de probabilidad continua


En muchas aplicaciones, la variable aleatoria discreta es inapropiada para problemas en los que puede tomar cualquier valor real en un intervalo. Por ejemplo, la variable aleatoria $T$ podría ser el tiempo medido desde el momento $t = 0$ hasta que falla una bombilla. Este podría ser cualquier valor $t \geq 0$. En este caso, $T$ se denomina variable aleatoria continua. Generalmente, si X es una variable aleatoria continua, existen dificultades matemáticas para definir el evento X = x: la probabilidad generalmente se define como cero. Las probabilidades de las variables aleatorias continuas solo se pueden definir en intervalos de valores como, por ejemplo, en $P (x_{1} <X <x_{2})$.

Definimos una función de densidad de probabilidad (fdp o pdf) $f(x$) en el internbalo $-\infty < x < \infty$  la cual tiene las siguientes propiedades 


<blockquote>
    <p>$f(x)\geq 0, \quad (-\infty < x < \infty)$</p>
    <p>$P(x_{1}\leq X \leq x_{2} ) = \int_{x_{1}}^{x_{2}}f(x)dx , \quad \text{tal que} \quad -\infty < x_{1}< x_{2}< \infty$</p>
    <p>$\int_{-\infty}^{\infty}f(x)dx=1$</p>
</blockquote>

Posible grafica de función de densidad $f(x)$ se muestra a continuación 


<img src="figuras/im9.png" width="400"> 

La función de distribución acumulada (CDF) F(x) de que $X$ sea igual o menor a $x$ es 

$$
F(x)= P(X\leq x)= \int_{-\infty}^{x} f(u)du
$$
y 

$$
P(x_{1}\leq x \leq x_{2})= \int_{x_{1}}^{x_{2}} f(u)du= F(x_{2})-F(x_{1})
$$

Ejemplo de un función CDF 
<img src="figuras/im10.png" width="400"> 

<blockquote>
*Ejercicios*

- Suponga que el error en la temperatura de reacción, en °C, en un experimento de laboratorio controlado, es una variable aleatoria continua X que tiene la función de densidad de probabilidad


\begin{equation}
     \label{eq:aqui}
     f(x) = \left\{
	       \begin{array}{ll}
             \frac{x^2}{3}    & \mathrm{si\ } -1 \le x \le 2 \\
             0 & \mathrm{\text{otro caso}  } 
	       \end{array}
	     \right.
   \end{equation}

a) Verifique que $f (x)$ es una función de densidad.

b) Calcule $P(0 < X \leq 1)$.


- Calcule la acumulada $F(x)$ para la función de densidad del ejercicio anterior y utilice el resultado para evaluar $P(0 < X \leq 1)$.


- Demuestre que 

\begin{equation}
     \label{eq:aqui-le-mostramos-como-hacerle-la-llave-grande}
     f(x) = \left\{
	       \begin{array}{ll}
             1/(b-a)     & \mathrm{si\ } a \leq x \le b \\
             0 & \mathrm{\text{otro caso}  } 
	       \end{array}
	     \right.
   \end{equation}

es una posible función de densidad de probabilidad. Encuentre su función acumulada.


</blockquote>



## Esperanza matemática

El valor promedio se le conoce como media de la variable aleatoria $X$ o media de la distribución de probabilidad de $X$, y se le denota como $ \mu_{x} $ o simplemente como $\mu$ cuando es evidente a qué variable aleatoria se está haciendo referencia. También es común entre los estadísticos referirse a esta media como la esperanza matemática o el valor esperado de la variable aleatoria $X$ y y denotarla como $E(x)$





<blockquote>
<p>$ \mu=E(X)= \sum_{i=0}^{\infty}{x_{i}p(x_{i})} \quad \text{Variable aleatoria discreta}$</p>

<p>$\mu=E(X)= \int_{-\infty}^{\infty}{xf(x)dx} \quad \text{Variable aleatoria continua}$
</blockquote>

donde $f(x)$ es la función de densidad de probabilidad. Puede interpretarse como el promedio ponderado de los valores de $X$ en su espacio muestral, donde los pesos son la función de probabilidad o la función de densidad.



## Varianza de variables aleatorias

Una medida que se usa, además de la media, es la **varianza** de $X$ denotada por $V(X)$ o $\sigma^{2}$. Esto da una medida de variación o dispersión de la distribución de probabilidad de $X$, y se define por


$$
\sigma^{2}=V(x)= E[(X-E(X))^2]= E[(X-\mu)^2]
$$

\begin{equation}
     \label{eq:aqui2}
     \sigma^{2}= \left\{
	       \begin{array}{ll}
             \displaystyle \sum_{i=0}^{\infty}{(x_{i}-\mu)^2 p(x_{i})}    &  \text{si es discreta}\\
           \int_{-\infty}^{\infty}{(x-\mu)^2 p(x)dx}   & \text{si es continua} 
    \end{array}
	     \right.
 \end{equation}
 |
 
 
 Una función de una variable aleatoria es en sí misma una variable aleatoria. Si $h (X)$ es una función de la variable aleatoria $X$, entonces se puede demostrar que la expectativa de $h (X)$ está dada
por

 \begin{equation}
     \label{eq:aqui3}
     E[h(X)]= \left\{
	       \begin{array}{ll}
             \displaystyle \sum_{i=0}^{\infty}{h(x_{i}) p(x_{i})}    &  \text{si es discreta}\\
           \int_{-\infty}^{\infty}{ h(x)p(x)dx}   & \text{si es continua} 
	       \end{array}
	     \right.
 \end{equation}
 

Es relativamente sencillo derivar los siguientes resultados para la expectativa y la varianza de una función lineal de X:
$$
E(aX + b) = aE(X) + b = a\mu + b,
$$
$$
V(aX + b) = E[(aX + b − a\mu − b)^2 ]
= E[(aX − a\mu)^2 ] = a^2 E[(X − \mu)^2 ] = a^2 V(X)
$$

donde $a$ y $b$ son constantes. Tenga en cuenta que la traslación de la variable aleatoria no afecta la varianza. También
$$
V(X) = E[(X − \mu)^2 ] = E(X^2 ) − 2\mu E(X) +\mu^2 = E(X^2 ) − \mu^2 
$$

la cual se conoce como la fórmula computacional para la varianza.

Para las expectativas, se puede demostrar de manera más general que
$$
E\left[  \displaystyle \sum_{i=0}^{k}{a_{i}h_{i}(X)}
 \right]=  \displaystyle \sum_{i=0}^{k}{a_{i}E[h_{i}(X)]}
$$

donde $a_{i}, i = 1, 2, \ldots$ , $k$ son constantes y $h_{i} (X), i = 1, 2, \ldots$, $k$ son funciones de la variable aletoria $X$.


<blockquote>

*Ejercicios*
- Un inspector de calidad obtiene una muestra de un lote que contiene 7 componentes; el lote contiene 4 componentes buenos y 3 defectuosos. El inspector toma una muestra de 3 componentes. Calcule el valor esperado del número de componentes buenos en esta muestra.

- Cierto día un vendedor de una empresa de aparatos médicos tiene dos citas. Considera que en la primera cita tiene 70 por ciento de probabilidades de cerrar una venta, por la cual podría obtener una comisión de 1000. Por otro lado, cree que en la segunda cita sólo tiene 40 por ciento de probabilidades de cerrar el trato, del cual obtendría 1500 de comisión. ¿Cuál es su comisión esperada con base en dichas probabilidades? Suponga que los resultados de las citas son independientes.

- Sea $X$ la variable aleatoria que denota la vida en horas de cierto dispositivo electrónico. La función de densidad de probabilidad es

 \begin{equation}
     \label{eq:aqui4}
     f(x)= \left\{
	       \begin{array}{ll}
             \frac{20000}{x^3}  &  x >100 \\
           0   & \text{en otro caso} 
	       \end{array}
	     \right.
 \end{equation}
 calcule la vida esperada para esta clase de dispositivo.
 </blockquote>
 


# Algunas distribuciones de probabilidad discreta 

A menudo las observaciones que se generan mediante diferentes experimentos estadísticos tienen el mismo tipo general de comportamiento. En consecuencia, las variables aleatorias discretas asociadas con estos experimentos se pueden describir esencialmente con la misma distribución de probabilidad y, por lo tanto, es posible representarlas usando una sola fórmula. De hecho, se necesitan sólo unas cuantas distribuciones de probabilidad importantes. 


## Distribuciones binomial y multinomial
Con frecuencia un experimento consta de pruebas repetidas, cada una con dos resultados posibles que se pueden denominar éxito o fracaso. El proceso se conoce como proceso de Bernoulli y cada ensayo se denomina experimento de Bernoulli.


*El proceso de Bernoulli*

Solo hay dos resultados: un "éxito" $(X = 1)$ con probabilidad $p$ o un "fracaso" $(X = 0)$ con probabilidad $q = 1 - p$. El valor de la variable aleatoria $X$ se utiliza como indicador del resultado. Por ejemplo, en un solo lanzamiento de moneda, X = 1 está asociado con la aparición, o la presencia de la característica, de una cara, y X = 0 con una cruz, o la ausencia de una cara.

La función de probabilidad de esta variable aleatoria se puede expresar como

$$
p_{1} = P(X = 1) = p, p_{0} = P(X = 0) = q,
$$

El valor esperado de $X$ es 

$$
\mu = E(x)= (0)(q)+ (1)(p)=p,
$$

Y la varianza 
                                                         $$                                                        \sigma^2 = V(X) = E(X^2 ) − \mu^2 = (0^2)(q) + (1^2)(p) − p^2 = pq.                                               $$
                                                         
Supongamos ahora que estamos interesados en variables aleatorias asociadas con repeticiones independientes de experimentos de Bernoulli, cada una con una probabilidad de éxito, $p$. Considere primero la distribución de probabilidad de una variable aleatoria $X$ que es el número de éxitos en un número fijo de ensayos independientes, $n$. Si hay $k$ éxitos y $n - k$ fracasos en $n$ ensayos, entonces cada secuencia de $1$ y $0$ tiene la probabilidad $P (X = k) = p^k q^{n − k}$. El número de formas en que se pueden organizar $x$ éxitos en $n$ ensayos es la expresión binomial 

$$
\frac{n!}{k!(n-k)!} \quad \text{también se expresa con} \quad \binom{n}{k}
$$

Dado que cada una de estas secuencias mutuamente excluyentes ocurre con probabilidad $p^k q^{n − k}$, la función de probabilidad de esta variable aleatoria viene dada por


$$
b(k; n, p) = p_{k}=\binom{n}{k}p^k q^{n − k} \quad k=0,1,2,\ldots,n
$$


Se le conoce como binomial porque el término $(n+1)$ tiene correspondencia con la expansión del binomio $(p+q)^2$

$$
\displaystyle \sum_{k=0}^{n}{p_{k}}= \sum_{k=0}^{n} \binom{n}{k}p^k q^{n − k}= (p+q)^n=1 
$$

La media y la varianza son $np$ y $npq$ respectivamente, la cual es n veces la de Bernoulli.

Con frecuencia nos interesamos en problemas donde se necesita obtener $P(X < r) \text{ o } P(a \leq X \leq b)$. Estas se obtienen con sumatorias binomiales

$$
P(X < r)= B (r; n, p) =\displaystyle \sum_{x=0}^{r} b(x; n, p)
$$

*Ejercicios*
<blockquote>
    
1. Considere el conjunto de experimentos de Bernoulli en el que se seleccionan tres artículos al azar de un proceso de producción, luego se inspeccionan y se clasifican como defectuosos o no defectuosos. Un artículo defectuoso se designa como un éxito. El número de éxitos es una variable aleatoria $X$ que toma valores integrales de cero a 3. Considere que la probabilidad de defecto es 0.25. Encuentre los ocho resultados posibles, los valores correspondientes de X, tabule la función de distribución y calcule la probabilidad de que sean exactamente dos defectuosos usando la función de distribución.  
    
2. La probabilidad de que cierta clase de componente sobreviva a una prueba de choque es de 3/4. Calcule la probabilidad de que sobrevivan exactamente 2 de los siguientes 4 componentes que se prueben.
    
3. La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es de 0.4. Si se sabe que 15 personas contrajeron la enfermedad, ¿cuál es la probabilidad de que a) sobrevivan al menos 10, b) sobrevivan de 3 a 8, y c) sobrevivan exactamente 5?
    
4. Una cadena grande de tiendas al detalle le compra cierto tipo de dispositivo electrónico a un fabricante, el cual le indica que la tasa de dispositivos defectuosos es de 3%. 
    a) El inspector de la cadena elige 20 artículos al azar de un cargamento. ¿Cuál es la probabilidad de que haya al menos un artículo defectuoso entre estos 20?
    b) Suponga que el detallista recibe 10 cargamentos en un mes y que el inspector prueba aleatoriamente 20 dispositivos por cargamento. ¿Cuál es la probabilidad de que haya exactamente tres cargamentos que contengan al menos un dispositivo defectuoso de entre los 20 seleccionados y probados?
5. Se conjetura que hay impurezas en 30% del total de pozos de agua potable de cierta co-
munidad rural. Para obtener información sobre la verdadera magnitud del problema se
determina que debe realizarse algún tipo de prueba. Como es muy costoso probar todos
los pozos del área, se eligen 10 al azar para someterlos a la prueba.
    a) Si se utiliza la distribución binomial, ¿cuál es la probabilidad de que exactamente 3
pozos tengan impurezas, considerando que la conjetura es correcta?
    b) ¿Cuál es la probabilidad de que más de 3 pozos tengan impurezas?
    
6. Calcule la media y la varianza de la variable aleatoria binomial del ejemplo 3
</blockquote>

In [29]:









# A Python program to print all  
# combinations of given length 
from itertools import combinations 
import numpy as np  
from math import comb
# Get all combinations of [1, 2, 3] 
# and length 2 
combi = combinations([0,1, 2, 3,4,5,6], 3) 
r=0;
# Print the obtained combinations 
# for i in list(combi): 
#     print (i)
#     r=r+1;
# print(r)
# l=[10,2,8,9,1,8,6,5,7]
# print(np.mean(l))
# n=len(l)
# print(n*np.mean(l))
# print(np.sum(l))

#comb(10,2)*(0.3)**2*(0.7)**8
print(comb(10,0)*(0.3)**0*(0.7)**10)
print(comb(10,1)*(0.3)**1*(0.7)**9)
print(comb(10,2)*(0.3)**2*(0.7)**8)
print(comb(10,3)*(0.3)**3*(0.7)**7)

#print(1-0.2334-0.02824-0.121-0.26682)
print(15*0.4*0.6)

0.028247524899999984
0.12106082099999993
0.23347444049999988
0.2668279319999998
3.5999999999999996
