**Notas para contenedor de docker:**

Comando de docker para ejecución de la nota de forma local:

nota: cambiar `dir_montar` por la ruta de directorio que se desea mapear a `/datos` dentro del contenedor de docker.

```
dir_montar=<ruta completa de mi máquina a mi directorio>#aquí colocar la ruta al directorio a montar, por ejemplo: 
#dir_montar=/Users/erick/midirectorio.
```

Ejecutar:

```
VERSION=<versión imagen de docker>
docker run --rm -v $dir_montar:/datos --name jupyterlab_prope_r_kernel_tidyverse -p 8888:8888 -d palmoreck/jupyterlab_prope_r_kernel_tidyverse:$VERSION

```

Ir a `localhost:8888` y escribir el password para jupyterlab: `qwerty`


Detener el contenedor de docker:

```
docker stop jupyterlab_prope_r_kernel_tidyverse
```

Documentación de la imagen de docker `palmoreck/jupyterlab_prope_r_kernel_tidyverse:<versión imagen de docker>` en [liga](https://github.com/palmoreck/dockerfiles/tree/master/jupyterlab/prope_r_kernel_tidyverse)




---

Para ejecución de la nota usar:

[docker](https://www.docker.com/) (instalación de forma **local** con [Get docker](https://docs.docker.com/install/)) y ejecutar comandos que están al inicio de la nota de forma **local**. 

O bien dar click en alguno de los botones siguientes:

[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/palmoreck/dockerfiles-for-binder/jupyterlab_prope_r_kernel_tidyverse?urlpath=lab/tree/Propedeutico/R/clases/2_probabilidad/1_elementos_de_probabilidad.ipynb) esta opción crea una máquina individual en un servidor de Google, clona el repositorio y permite la ejecución de los notebooks de jupyter.

[![Run on Repl.it](https://repl.it/badge/github/palmoreck/dummy)](https://repl.it/languages/Rlang) esta opción no clona el repositorio, no ejecuta los notebooks de jupyter pero permite ejecución de instrucciones de Python de forma colaborativa con [repl.it](https://repl.it/). Al dar click se crearán nuevos ***repl*** debajo de sus users de ***repl.it***.


### Lo siguiente está basado los libros:

### * B. Rumbos, Pensando Antes de Actuar: Fundamentos de Elección Racional, 2009.

### * G. J. Kerns, Introduction to Probability and Statistics Using R, 2014.

### El libro de G. J. Kerns tiene github: [jkerns/IPSUR](https://github.com/gjkerns/IPSUR)

**Notas:**

* Se utilizará el paquete [prob](https://cran.r-project.org/web/packages/prob/index.html) de *R* para los experimentos descritos en la nota y aunque con funciones nativas de *R* se pueden crear los experimentos, se le da preferencia a mostrar cómo en *R* se tienen paquetes para muchas aplicaciones.

* Cuidado al utilizar las funciones del paquete `prob` para construir espacios de probabilidad grandes como lanzar un dado 9 veces... (tal experimento tiene 10 millones de posibles resultados)

In [1]:
options(repr.plot.width=4, repr.plot.height=4) #esta línea sólo se ejecuta para jupyterlab con R

In [2]:
library(prob)

Loading required package: combinat


Attaching package: ‘combinat’


The following object is masked from ‘package:utils’:

    combn


Loading required package: fAsianOptions

Loading required package: timeDate

Loading required package: timeSeries

Loading required package: fBasics

Loading required package: fOptions


Attaching package: ‘prob’


The following objects are masked from ‘package:base’:

    intersect, setdiff, union




# Tipos de experimentos

Se tienen dos tipos: **determinísticos y aleatorios**. Un **experimento determinístico** es aquel cuyo resultado puede ser predicho con seguridad antes de realizarlo, por ejemplo: combinar hidrógeno y oxígeno o sumar $2+3$. Un **experimento aleatorio** es aquel cuyo resultado está determinado por el **azar**, por esto **no es posible predecir su resultado antes de realizarlo**. Ejemplos de experimentos aleatorios se encuentran lanzar una moneda, lanzar un dado, lanzar un dardo a un tiro al blanco, número de semáforos de color rojo que te encontrarás al ir a casa, cuántas hormigas caminan por la acera de peatones en un tiempo.

# Sesgo, independencia y justicia

Decimos que un juego de azar es **justo u honesto** si sus resultados no presentan asimetría (aparecen con la misma frecuencia) y son **independientes** si no presentan patrón alguno. Tirar una moneda, un dado o girar una ruleta son **juegos justos** siempre y cuando no estén alterados de alguna manera.

## Ejemplos

1) Supóngase que se lanza un oso de peluche al aire. El oso gira varias veces y cae al suelo de cuatro posibles maneras, panza abajo, panza arriba, sentado o de cabeza. Al lanzarlo 100 veces se obtiene el número de veces que cae de cada forma como se observa en la siguiente tabla:

|resultado|panza abajo|panza arriba|sentado |de cabeza
|:---------:|:-----------:|:------------:|:--------:|:---------:
|# de veces| 54|40|5|1

Claramente se trata de resultados **asimétricos** ya que el oso cae panza abajo más de la mitad de las veces y sólo cae de cabeza uno de cada cien lanzamientos. Los resultados, sin embargo, **son independientes** pues si el oso cae en alguna posición, esto es irrelevante para el siguiente lanzamiento.

2) Consideremos una urna con 25 canicas blancas, 25 rojas, 25 amarillas y 25 azules. Sacamos una canica de la urna y **observamos** que es amarilla. **Sin reemplazar** la canica amarilla en la urna tomamos otra canica (equivalente a haber sacado dos canicas). Claramente la urna ya no es la misma pues ahora contiene 25 canicas blancas, rojas y azules y 24 canicas amarillas. Nuestras expectativas para el color de la segunda canica **no son independientes** del resultado de haber tomado una canica amarilla inicialmente. Si la segunda canica es, por ejemplo roja, y **tampoco la reemplazamos**, entonces la urna contiene 25 canicas blancas y azules y 24 rojas y amarillas. Las expectativas para el color de la tercera canica cambian. En este ejemplo, los resultados de **sacar canicas de colores en sucesión y sin reemplazo no son independientes**.

3) Consideremos la misma urna del ejemplo anterior. Observemos que si cada vez que **sacamos una canica y anotamos su color la reemplazamos nuevamente en la urna**, entonces el sacar la segunda canica **es independiente** de lo que hayamos hecho antes. La razón es que tenemos, esencialmente, **la misma urna inicial**. Aún mas, si se repite el experimento de extraer y anotar su color (con o sin reemplazo), entonces se le llama **muestreo ordenado** y si no se anota su color se le llama **muestreo no ordenado**, no tenemos idea en qué orden se eligieron las canicas, sólo observamos una o más canicas y no importa el orden en que se sacaron de acuerdo a lo que observamos y esto es equivalente a haber extraído las canicas y colocarlas en una bolsa antes de observar qué sacamos.

---

**Observación** 

Este modelo de la urna con canicas es utilizado con frecuencia ya que es sumamente práctico para ciertas abstracciones de la realidad y es considerado dentro de la clase de **experimentos generales** pues contiene a experimentos aleatorios más comunes. Por ejemplo, lanzar una moneda dos veces es equivalente a sacar dos canicas de una urna que están etiquetadas con águila y sol. Lanzar un dado es equivalente a sacar una canica de una urna con seis canicas etiquetadas del 1 al 6.

---

4) En un casino observamos que los últimos cinco resultados de la ruleta han sido los siguientes: 10 negro, 17 negro, 4 negro, 15 negro y 22 negro. Al observar esto escuchamos el consejo de un experimentado apostador: “ponga todo su dinero en el rojo pues ya toca que salga rojo”. Sabiamente no le hacemos caso. La razón es simple: **la ruleta no es una urna sin reemplazo sino más bien es una urna con reemplazo**. En cada giro, **cada número tiene la misma probabilidad de aparecer** y se trata de la misma ruleta. Cada giro es **independiente** de los demás por lo que **no hay un patrón definido** y los resultados previos no modifican la habilidad para predecir el resultado del siguiente giro.

## Espacio de resultados o espacio muestral

Supongamos que una acción o experimento puede tener distintas consecuencias o resultados (*outcomes*) y sea $S = \{r_1, r_2, \dots, r_n\}$ el conjunto de resultados posibles. A este conjunto se le conoce como **espacio de resultados o espacio muestral**.

Por ejemplo, si lanzamos una moneda al aire el espacio muestral es *{águila, sol}* y al tirar un dado de seis caras el espacio muestral es $\{1,2,3,4,5,6\}$. Es importante notar que, en cada caso, los resultados son **mutuamente excluyentes**, es decir, **no pueden ocurrir simultáneamente**. Asimismo, **el espacio muestral comprende a todos los resultados posibles**.

## ¿Cómo representar el espacio de resultados o espacio muestral en R?

Nos podemos apoyar de la estructura *data frame* la cual es una colección rectangular de variables. Cada renglón del *data frame* corresponde a un resultado del experimento (pero se verá más adelante que el *data frame* sólo nos ayudará a describir ciertos espacios de resultados de experimentos).

### Experimento: lanzar un oso de peluche al aire. 

Entonces el espacio muestral es:

In [3]:
S = data.frame(cae=c("panza abajo", "panza arriba", "sentado", "de cabeza"))

In [4]:
S

cae
<chr>
panza abajo
panza arriba
sentado
de cabeza


### Experimento: sacar canicas de una urna.

Supóngase que se tiene una urna con tres canicas con etiquetas $1, 2, 3$ respectivamente. Se sacarán $2$ canicas.

### ¿Cómo realizar el experimento en R? 

En el paquete [prob](https://cran.r-project.org/web/packages/prob/index.html) se tiene la función [urnsamples](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/urnsamples) la cual tiene argumentos `x, size, replace, ordered`. El argumento `x` representa la urna de la cual se realizará el muestreo, `size` representa el tamaño de la muestra, `replace` y `ordered` son argumentos lógicos y especifican cómo se debe realizar el muestreo.

### Con reemplazo y orden

Como el experimento es con reemplazo se pueden sacar cualquiera de las canicas $1, 2, 3$ en cualquier extracción, además como es con orden **se llevará un registro del orden de las extracciones** que se realizan. 

In [5]:
print(urnsamples(1:3, size = 2, replace = TRUE, ordered = TRUE)) 

  X1 X2
1  1  1
2  2  1
3  3  1
4  1  2
5  2  2
6  3  2
7  1  3
8  2  3
9  3  3


La primer columna con etiqueta $X1$ representa la primera extracción y el primer renglón representa una realización del experimento.

---

**Observaciones** 

* Obsérvese que los renglones $2$ y $4$ son idénticos salvo el orden en el que se muestran los números.

* Este experimento **es equivalente a** lanzar dos veces un dado de tres lados. Lo anterior se realiza en $R$ con:


In [6]:
print(rolldie(2, nsides = 3))

  X1 X2
1  1  1
2  2  1
3  3  1
4  1  2
5  2  2
6  3  2
7  1  3
8  2  3
9  3  3


Ver [rolldie](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/rolldie).

---

### Sin reemplazo y orden

Como es sin reemplazo no observaremos en uno de los renglones $1, 1$ por ejemplo (mismo número en un renglón) y como es con orden se tendrán renglones de la forma $2, 1$ y $1, 2$ (pues se consideran distintos).

In [7]:
print(urnsamples(1:3, size=2, replace = F, order = T))

  X1 X2
1  1  2
2  2  1
3  1  3
4  3  1
5  2  3
6  3  2


---

**Observación** 

Obsérvese que hay menos renglones en este caso debido al procedimiento más restrictivo de muestreo. Si los números $1, 2, 3$ representaran "Alicia", "Ana" y "Paulina" respectivamente entonces este experimento sería **equivalente a** seleccionar dos personas de tres para que fueran la presidenta y vice-presidenta respectivamente de alguna compañía. El *data frame* anterior representa todas las posibilidades en que esto podría hacerse.

---

### Sin reemplazo y sin orden

Nuevamente no observaremos en uno de los renglones $1, 1$ por ejemplo (mismo número en un renglón) y como es sin orden tendremos menos renglones que el caso anterior pues al sacar las canicas no se tendrán duplicados de extracciones anteriores no importando el orden de los números.

In [8]:
print(urnsamples(1:3, size=2, replace = F, order = F))

  X1 X2
1  1  2
2  1  3
3  2  3


Este experimento es **equivalente a** ir a donde está la urna, mirar en ella y elegir un par de canicas. Este es el default de la función `urnsamples`:

In [9]:
print(urnsamples(1:3,2))

  X1 X2
1  1  2
2  1  3
3  2  3


### Con reemplazo y sin orden

Se reemplazan las canicas en cada extracción pero no se "recuerda" el orden en el que fueron extraídas.

In [10]:
print(urnsamples(1:3, size = 2, replace = T, order = F))

  X1 X2
1  1  1
2  1  2
3  1  3
4  2  2
5  2  3
6  3  3


Este experimento es **equivalente a**:
 * Tener una taza en el que agitamos dos dados de tres caras y nos acercamos a ver la taza.
 * Los resultados de distribuir dos pelotas idénticas de golf en tres cajas etiquetadas con 1, 2 y 3.

---

**Notas respecto a la función `urnsamples`** 

* La urna no necesita tener números, esto es, se podría haber definido un vector $x$ como `x = c('Roja', 'Azul', 'Amarilla')`.
* Los elementos que contiene la urna siempre son distinguibles para la función `urnsamples`. Entonces situaciones como `x = c('Roja', 'Roja', 'Azul')` no se sugieren ejecutar pues el resultado puede **no ser correcto** (por ejemplo, realizar un experimento en el que se tienen canicas no distinguibles resultan renglones del *data frame* como si se hubiera usado `ordered=T` aún si se eligió `ordered=F`. Enunciados similares aplican para el argumento `replace`).

---

## Eventos

Un evento $E$ es una colección de resultados del experimento, un subconjunto del espacio muestral 

---

**Observación** 

El conjunto vacío, $\emptyset$, es un evento pues es subconjunto de todo conjunto y en el contexto de eventos representa un evento sin espacio de resultados.

---

Bajo la notación de $S = \{r_1, r_2, \dots, r_n\}$ como el espacio muestral, todos los eventos posibles son: $\emptyset , \{r_1\}, \{r_2\}, \dots, \{r_1, r_2\}, \{r_1, r_3\}, \dots \{r_2, r_3\}, \dots \{r_{n-1}, r_n\}, \dots \{r_1, r_2, \dots , r_n\}$

## Ocurrencia de un evento

Decimos que el evento $E$ ocurrió si el resultado de un experimento pertenece a $E$.

Lo usual es que los eventos se refieran a resultados con alguna característica de interés, por ejemplo, si lanzamos dos dados podrían interesarnos todas las parejas de números cuya suma sea mayor a cinco. Si se trata de una población de individuos, podríamos querer saber algo acerca de todos los que tienen cierto nivel de ingreso, o los que adquieren cierto nivel educativo o los que tuvieron sarampion de niños, etcétera.

## Eventos mutuamente excluyentes

Decimos que los eventos $E_1, E_2, \dots$ son mutuamente excluyentes o ajenos si $E_i \cap E_j = \emptyset$ $\forall E_i \neq E_j$ (sólo ocurre exactamente uno de ellos).

---

**Observación** 

Como los eventos son subconjuntos es permitido realizar operaciones típicas de conjuntos, en la definición anterior se usó la intersección $\cap$ y $E_i \cap E_j$ consiste de todos los resultados comunes a $E_i$ y $E_j$.

---

Por ejemplo, en el caso del lanzamiento de una moneda, los eventos $E_1=\{\text{obtener águila}\}$ y $E_2 = \{\text{obtener sol}\}$ son mutuamente excluyentes y en el caso de $E_1 = \{\text{hoy día soleado}\}$, $E_2 = \{\text{hoy día nublado} \}$ no son mutuamente excluyentes pues tenemos días que son nublados y soleados.

### Ejemplo

**1) Lanzamiento de una moneda un número de veces definido (o lanzamiento de monedas distintas)**

In [11]:
S <- tosscoin(2, makespace = TRUE) #one coin, two tosses
                                   #equivalently tossing two distinct coins

In [12]:
S

toss1,toss2,probs
<fct>,<fct>,<dbl>
H,H,0.25
T,H,0.25
H,T,0.25
T,T,0.25


In [13]:
print(S[1:3, ]) #example of three events consisting each one of 
                #each row of S

  toss1 toss2 probs
1     H     H  0.25
2     T     H  0.25
3     H     T  0.25


In [14]:
print(S[c(2,4), ]) #example of two events consisting each one of
                   #each row of S

  toss1 toss2 probs
2     T     H  0.25
4     T     T  0.25


Ver [tosscoin](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/tosscoin).

**2) Baraja**

In [15]:
S<-cards()

In [16]:
head(S)

Unnamed: 0_level_0,rank,suit
Unnamed: 0_level_1,<fct>,<fct>
1,2,Club
2,3,Club
3,4,Club
4,5,Club
5,6,Club
6,7,Club


In [17]:
tail(S)

Unnamed: 0_level_0,rank,suit
Unnamed: 0_level_1,<fct>,<fct>
47,9,Spade
48,10,Spade
49,J,Spade
50,Q,Spade
51,K,Spade
52,A,Spade


A continuación se muestran eventos extraídos del espacio muestral que satisfacen una expresión lógica


In [18]:
print(subset(S, suit == 'Heart'))

   rank  suit
27    2 Heart
28    3 Heart
29    4 Heart
30    5 Heart
31    6 Heart
32    7 Heart
33    8 Heart
34    9 Heart
35   10 Heart
36    J Heart
37    Q Heart
38    K Heart
39    A Heart


Ver [cards](https://www.rdocumentation.org/packages/prob/versions/0.9-1/topics/cards).

La función %in% checa si cada elemento de un vector está contenido en algún lugar de otro, en el siguiente caso se checa para cada renglón de la columna rank de S que se encuentre en el vector `c(7,8,9)`

In [19]:
print(subset(S, rank %in% 7:9)) 

   rank    suit
6     7    Club
7     8    Club
8     9    Club
19    7 Diamond
20    8 Diamond
21    9 Diamond
32    7   Heart
33    8   Heart
34    9   Heart
45    7   Spade
46    8   Spade
47    9   Spade


**3) Lanzamiento de un dado tres veces (o lanzamiento de tres dados distintos)**

Obsérvese que para la función `rolldie` también son aceptadas expresiones matemáticas:

In [20]:
print(subset(rolldie(3), X1+X2+X3 > 16)) 

    X1 X2 X3
180  6  6  5
210  6  5  6
215  5  6  6
216  6  6  6


**4) Lanzamiento de un dado cuatro veces (o lanzamiento de cuatro dados distintos)**

La función [isin](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/isin) checa que todo el vector `c(2,2,6)` esté en cada renglón del data.frame `S`.

In [21]:
S <- rolldie(4)
print(subset(S, isin(S, c(2,2,6), ordered = TRUE))) 

     X1 X2 X3 X4
188   2  2  6  1
404   2  2  6  2
620   2  2  6  3
836   2  2  6  4
1052  2  2  6  5
1088  2  2  1  6
1118  2  1  2  6
1123  1  2  2  6
1124  2  2  2  6
1125  3  2  2  6
1126  4  2  2  6
1127  5  2  2  6
1128  6  2  2  6
1130  2  3  2  6
1136  2  4  2  6
1142  2  5  2  6
1148  2  6  2  6
1160  2  2  3  6
1196  2  2  4  6
1232  2  2  5  6
1268  2  2  6  6


---

**Nota** 

Otras funciones del paquete `prob` útiles para encontrar espacios muestrales son: [countrep](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/countrep) e [isrep](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/isrep).

---

**Observación** 

Obsérvese que `%in%` e `%isin%` no realizan lo mismo.

---

In [22]:
x <- 1:10
y <- c(3,3,7)

La siguiente línea checa que el 3 esté en x, que el 3 esté en x y que el 7 esté en x y devuelve el valor lógico de los tres chequeos, en este caso `all(c(T,T,T))`

In [23]:
all(y %in% x) 


La siguiente línea checa que `c(3,3,7)` esté en `x`:

In [24]:
isin(x,y) 

### Eventos a partir de operaciones entre conjuntos

### Union, Intersección y diferencia

Un evento es un subconjunto y como tal se realizan operaciones de conjuntos para obtener nuevos eventos. En `prob` se utilizan las funciones [union](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/union), [intersect](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/intersect) y [setdiff](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/setdiff) para tales operaciones. Por ejemplo:

In [25]:
S <- cards()
A <- subset(S, suit == "Heart")
B <- subset(S, rank %in% 7:9)

In [26]:
head(union(A,B)) #se utiliza head para obtener sólo algunos renglones de la operación

Unnamed: 0_level_0,rank,suit
Unnamed: 0_level_1,<fct>,<fct>
6,7,Club
7,8,Club
8,9,Club
19,7,Diamond
20,8,Diamond
21,9,Diamond


In [27]:
intersect(A,B)

Unnamed: 0_level_0,rank,suit
Unnamed: 0_level_1,<fct>,<fct>
32,7,Heart
33,8,Heart
34,9,Heart


In [28]:
setdiff(A,B)

Unnamed: 0_level_0,rank,suit
Unnamed: 0_level_1,<fct>,<fct>
27,2,Heart
28,3,Heart
29,4,Heart
30,5,Heart
31,6,Heart
35,10,Heart
36,J,Heart
37,Q,Heart
38,K,Heart
39,A,Heart


In [29]:
head(setdiff(B,A))

Unnamed: 0_level_0,rank,suit
Unnamed: 0_level_1,<fct>,<fct>
6,7,Club
7,8,Club
8,9,Club
19,7,Diamond
20,8,Diamond
21,9,Diamond


En la siguiente línea se calcula A^c (el complemento de A definido como S\A)

In [30]:
head(setdiff(S,A)) 

Unnamed: 0_level_0,rank,suit
Unnamed: 0_level_1,<fct>,<fct>
1,2,Club
2,3,Club
3,4,Club
4,5,Club
5,6,Club
6,7,Club


## Modelos de probabilidad

### Modelo de la teoría de la medida

Este modelo consiste en definir una medida de probabilidad en el espacio muestral. Tal medida es una función matemática que satisface ciertos axiomas y tienen ciertas propiedades matemáticas. Existen una amplia gama de medidas de probabilidad de las cuales se elegirá una sola basada en los experimentos y la persona en cuestión que los realizará.

Una vez elegida la medida de probabilidad, todas las asignaciones de probabilidad a eventos están hechas por la misma.

Este modelo se sugiere para experimentos que exhiban simetría, por ejemplo el lanzamiento de una moneda. Si no exhibe simetría o si se desea incorporar conocimiento subjetivo al modelo resulta más difícil la elección de la medida de probabilidad.

Andréi Nikoláyevich Kolmogórov revolucionó la teoría de la probabilidad con este modelo. 

### Modelo frecuentista

Este modelo enuncia que la forma de asignar probabilidades a eventos es por medio de la realización repetida del experimento bajo las mismas condiciones.

Por ejemplo, si se desea calcular la probabilidad del evento: $E=${obtener sol} entonces: $$P(E) \approx \frac{n_E}{n}$$ donde: $n_E$ representa el número observado de soles (ocurrencia del evento $E$) en $n$ experimentos.

Tal modelo utiliza la **ley fuerte de los grandes números** en la que se describe y asegura que bajo mismas condiciones de experimentos realizados e independientes, si $n \rightarrow \infty$ entonces $\frac{n_E}{n} \rightarrow P(E)$.

La probabilidad en este enfoque proporciona una medida cuantitativa de qué tan frecuentemente podemos esperar que ocurra un evento.

Este modelo es sugerido aún si los experimentos no son simétricos (caso del modelo anterior) pero el cálculo de la probabilidad está basado en una aproximación de la forma *in the long run* por lo que no se conoce de forma exacta la misma ni funciona en experimentos que no puedan repetirse indefinidamente, como la probabilidad del evento {el día $x$ lloverá} o {temblor en una zona $z$}.

Richard von Mises fue un personaje importante en el impulso de este modelo, además algunas de sus ideas fueron incorporadas en el modelo de teoría de la medida.

### Modelo subjetivo

Se interpreta a la probabilidad como un "grado de creencia" que ocurrirá el evento de acuerdo a la persona que realizará el experimento. La estimación de la probabilidad de un evento se basa en el conocimiento individual de la persona en un punto del tiempo, sin embargo, al ir adquiriendo o poseyendo mayor conocimiento, la estimación se modifica/actualiza de acuerdo a esto. El método típico por el que se actualiza la probabilidad es con la **regla o fórmula o teorema de Bayes**.

Por ejemplo, supóngase que al inicio del experimento del lanzamiento de una moneda y el evento {sol} la observadora asigna $P({\text{sol}}) = \frac{1}{2}$. Sin embargo, por alguna razón la observadora conoce información adicional acerca de la moneda o de la persona que lanzará la moneda por lo que **decide** modificar su asignación **inicial** de la probabilidad de obtener sol alejado del valor $\frac{1}{2}$.

Se define la probabilidad como el grado (personal) de creencia o certeza que se tiene de que el evento suceda.

Este modelo se sugiere en situaciones que no es posible repetir indefinidamente el experimento o carece de datos confiables o es prácticamente imposible. Sin embargo, cuando se trata de analizar situaciones para las cuales los datos son escasos, cuestionables o inexistentes, entonces las probabilidades subjetivas difieren enormemente. Un analista deportivo puede pensar que los Cavaliers ganarán el campeonato con un 60% de certeza, mientras que otro puede asegurar que los Lakers de Los Ángeles serán campeones con 95% de certeza.

Pierre Simone-Laplace, Frank Ramsey, Bruno De Finetti, Leonard Savage y John Keynes fueron de las personas que popularizaron este modelo.

---

**Nota** 

Cuando se trabaja con un gran número de datos, los modelos frecuentistas y subjetivos tienden a coincidir pero, cuando los datos son escasos o prácticamente inexistentes, las interpretaciones difieren. 

---

### Modelo equiprobable

Este modelo asigna igual probabilidad a todos los resultados de un experimento y lo podemos encontrar en los modelos anteriores:

* En el modelo de la teoría de la medida al tener un experimento que exhibe simetría de algún tipo, por ejemplo en el lanzamiento de una moneda o dados justos o de un dardo a un tiro al blanco con un mismo radio de circunferencia.

* En el modelo subjetivo si la persona que realiza el experimento tiene ignorancia o indiferencia respecto a su grado de creencia del resultado del experimento.

* En el modelo frecuentista al observar la proporción de veces que al lanzar una moneda se obtiene sol.

Obsérvese que este modelo es posible utilizar si se pueden ennumerar todos los resultados de un experimento.

## Espacio de probabilidad

Un espacio de probabilidad se compone por el espacio de resultados o espacio muestral, $S$, los eventos $E$ y la medida de los eventos o función de probabilidad que satisfacen los axiomas de Kolmogorov.

## ¿Cómo representar en R un espacio de probabilidad?

Una opción para responder esta pregunta es considerar un objeto, `S`, que represente los *outcomes* o resultados del experimento y un vector de probabilidades, `probs`, con entradas que correspondan a cada outcome en `S`.

Además en el paquete *prob* se tiene una función [probspace](https://www.rdocumentation.org/packages/prob/versions/1.0-1/topics/probspace) que tiene por argumentos `x` que es un espacio muestral de los outcomes y `probs` es un vector del mismo tamaño que el número de outcomes en $x$.

### Ejemplos

**1) Lanzamiento de un dado justo**

In [31]:
outcomes <- rolldie(1)
p <- rep(1/6, times = 6)
probspace(outcomes, probs = p)
#equivalently 
#probspace(1:6, probs = p) or probspace(1:6) or rolldie(1, makespace = TRUE)

X1,probs
<int>,<dbl>
1,0.1666667
2,0.1666667
3,0.1666667
4,0.1666667
5,0.1666667
6,0.1666667


**2) Lanzamiento de una moneda cargada**

Supóngase que $P(\{\text{sol}\}) = .7$ y $P(\{\text{águila}\}) = .3$ entonces:

In [32]:
probspace(tosscoin(1), probs = c(0.70, 0.30))

toss1,probs
<fct>,<dbl>
H,0.7
T,0.3


---

**(Tarea) Ejercicio** 

¿Cómo calcular la probabilidad anterior con la función `urnsamples`?

---