# Probabilidad
Tipos de experimentos:
- Determinísticos
- Aleatorios

#### Experimentos aleatorios
- ¿Justos, honestos?
- ¿Simétricos, independientes?

In [2]:
options(repr.plot.width=4, repr.plot.height=4) #esta línea sólo se ejecuta para jupyterlab con R

In [19]:
library(combinat)
library(prob)


Attaching package: ‘combinat’

The following object is masked from ‘package:utils’:

    combn

Loading required package: fAsianOptions
Loading required package: timeDate
Loading required package: timeSeries
Loading required package: fBasics
Loading required package: fOptions

Attaching package: ‘prob’

The following objects are masked from ‘package:base’:

    intersect, setdiff, union



### Tipos de experimentos
Se tienen dos tipos: **determinísticos y aleatorios.** Un experimento determinístico es aquel cuyo resultado puede ser predicho con seguridad antes de realizarlo, por ejemplo: combinar hidrógeno y oxígeno o sumar $2+3$. Un experimento aleatorio es aquel cuyo resultado está determinado por el azar, por esto no es posible predecir su resultado antes de realizarlo. Ejemplos de experimentos aleatorios se encuentran lanzar una moneda, lanzar un dado, lanzar un dardo a un tiro al blanco, número de semáforos de color rojo que te encontrarás al ir a casa, cuántas hormigas caminan por la acera de peatones en un tiempo.

El aleatorio le interesa a la probalidad estudiar porque no se puede predicir su *outcome*.


Dado un experimento, el conjunto de resultados posibles se le conoce como **ESPACIO DE RESULTADOS o ESPACIO MUESTRAL**

Experimento 1: lanzar una moneda
$$
S_2 = \{ A, S \}
$$

Experimento 2: lanzar dos monedas
$$
S_1 = \{ AA, AS, SA, SS \}
$$

En el caso de lanzar una moneda, no pueden salir simultáneamnete aguila y sol, por lo tanto son *mutuamente exclutentes*

---
### Ejemplo
1. Experimento: lanzar un oso de peluche al aire. Entonces el espacio muestral es:

In [5]:
S = data.frame(cae=c('panza abajo', 'panza arriba', 'sentado', 'de cabeza'))
S

cae
<fct>
panza abajo
panza arriba
sentado
de cabeza


---
### Ejemplo
2. Experimento: sacar canicas de una urna.

Supóngase que se tiene una urna con tres canicas con etiquetas $1, 2, 3$ respectivamente. Se sacarán $2$ canicas.

¿Cómo realizar el experimento en R?
En el paquete prob se tiene la función urnsamples la cual tiene argumentos $x, size, replace, ordered$. El argumento $x$ representa la urna de la cual se realizará el muestreo, $size$ representa el tamaño de la muestra, $replace$ y $ordered$ son argumentos lógicos y especifican cómo se debe realizar el muestreo.

Con reemplazo y orden
Como el experimento es con reemplazo se pueden sacar cualquiera de las canicas $1, 2, 3$ en cualquier extracción, además como es con orden se llevará un registro del orden de las extracciones que se realizan.

In [13]:
print(urnsamples(1:3, size=2, replace=T, ordered=T))

  X1 X2
1  1  1
2  2  1
3  3  1
4  1  2
5  2  2
6  3  2
7  1  3
8  2  3
9  3  3


In [14]:
print(urnsamples(1:3, size=2, replace=F, ordered=T))

  X1 X2
1  1  2
2  2  1
3  1  3
4  3  1
5  2  3
6  3  2


In [15]:
print(urnsamples(1:3, size=2, replace=F, ordered=F))

  X1 X2
1  1  2
2  1  3
3  2  3


---
$E$ es un evento
- Colección de resultados del experimento
- E es un subconjunto del espacio muetral $S$ (espacio de resultados)

Para el experimento de lanzar una moneda...
$$
S = \{ A, S \}
$$
$$
E_1 = \{ A \}
$$
$$
E_2 = \{ S \}
$$
$$
E_3 = \{ A, S \}
$$
$$
E_4 = \{ \phi \}
$$

> Un evento es mutuamento excluyente del otro si no ocurren simultáneamente
---
### Ejemplo
1) Lanzamiento de dos monedas

In [16]:
S <- tosscoin(2, makespace = TRUE) #lanzamiento de dos monedas
print(S[1:3, ]) #tres eventos

  toss1 toss2 probs
1     H     H  0.25
2     T     H  0.25
3     H     T  0.25


### A diferencia de Python, los índices en R comienzan en 1
---

In [17]:
S <- cards()

In [20]:
print(subset(S, suit == 'Heart'))

   rank  suit
27    2 Heart
28    3 Heart
29    4 Heart
30    5 Heart
31    6 Heart
32    7 Heart
33    8 Heart
34    9 Heart
35   10 Heart
36    J Heart
37    Q Heart
38    K Heart
39    A Heart


In [22]:
print(subset(S, rank %in% 7:9)) #la función %in% checa si cada elemento de un vector
                                #está contenido en algún lugar de otro, en este caso 
                                #se checa para cada renglón de la columna rank de S
                                #que se encuentre en el vector c(7,8,9)

   rank    suit
6     7    Club
7     8    Club
8     9    Club
19    7 Diamond
20    8 Diamond
21    9 Diamond
32    7   Heart
33    8   Heart
34    9   Heart
45    7   Spade
46    8   Spade
47    9   Spade


**3) Lanzamiento de tres dados**

In [24]:
print(subset(rolldie(3), X1+X2+X3 > 17)) #también son aceptadas expresiones matemáticas

    X1 X2 X3
216  6  6  6


---
## Modelos de probabilidad
### ¿Cómo definir una probabilida de ocurrencia de los eventos?
**4 propuestas**
1. Modelo de la teoría de la medida
    - Se defina una medida de probabilidad. Se le llama **medida** porque mide qué tan grande es un conjunto, la cual es una función matemática que satisface ciertos axiomas y propiedades.
2. Modelo frecuentista
    - Se caracteriza porque va a definar la proabilidad de ocurrencia de un evento en un experimento a partir de realizar repetidamente el experimento bajo las mismas condiciones.
    - Hace uso de la **ley fuerte de los grandes números**: si $n \rightarrow \infty$ entonces $\frac{n_E}{n} \rightarrow P(E)$.
3. Modelo subjetivo
    - Considera la probabilidad como un "grado de creencia" que ocurrirá el evento de acuerdo a la persona que realizará el experimento.
    - Está basada en el conocimiento individual en un punto en el tiempo y al adquirir más conocimiento, la estimación de la probabilidad se actualiza. Esta actualización se hace con la regla de Bayes.
4. Modelo equiprobable
    - Otorga igual probabilidad a todos los resultados del experimento.
    - Este modelo es posible utilizar si se pueden enumerar todos los resultados del experimento
    
---
# Ejercicios
### 1) Durante 5 años el profesor X ha impartido el mismo curso. En total ha tenido 500 alumnos, de los cuales 80 se han dado de baja, 200 han reprobado y 220 han aprobado. Nos encontramos a uno de estos exalumnos. ¿Cuál es la probabilidad de que éste se haya dado de baja en el curso?
---
### Manos de poker posibles en una baraja

In [6]:
dim(combn(52,5))[2]

In [7]:
comb = function(n, x) {
  factorial(n) / factorial(n-x) / factorial(x)
}

In [8]:
comb(52,5)

In [11]:
dim(combn(12,3))[2]

In [12]:
dim(combn(4,4))[2]

In [13]:
dim(combn(12,1))[2]

In [14]:
dim(combn(12,3))

In [15]:
choose(12,3)


2) Experimento: elección de artistas, pinturas y luz...

11 artistas enviarán sus portafolios con contenido de 7 pinturas cada uno para competir en una exhibición de arte. La directora de la galería sólo tiene espacio para acomodar 12 pinturas de los tres primeros lugares a lo largo de una fila en tres paredes que se encuentran una al lado de otra. La directora le dará a cada persona ganadora una pared para exhibir sus pinturas y cada artista las acomodará de acuerdo al orden que elija (al artista le importa el orden). Además en las paredes se puede proyectar un color de los 31 distintos colores de luz para la exhibición. ¿Cuántos diferentes arreglos entre artistas que ganan los tres primeros lugares, elección de sus pinturas y colores se pueden tener en la exhibición de la galería?

Se tiene el siguiente análisis del problema:

Se eligen 3 artistas de los 11 que ganan los 3 primeros lugares, esta es una elección sin reemplazo y con orden: $_{11}P_3$.

Cada artista elige 4 pinturas de sus 7 pinturas de su portafolio y sí le interesa el orden de exhibición de sus pinturas, esta es una elección sin reemplazo y con orden: $_7P_4$.

Cada artista elige la luz de su preferencia, esta es una elección con reemplazo y con orden: $31*31*31$.

Entonces:

In [17]:
c(1,2)

In [20]:
L <- cards() #Es un dataframe
M <- urnsamples(L, size = 2, replace=F, ordered = F) #extraer dos canicas
                                                     #sin reemplazo y sin orden
N <- probspace(M) #modelo equiprobable