-
Notifications
You must be signed in to change notification settings - Fork 0
/
08_Primera Parte_Probabilidades.R
242 lines (162 loc) · 8.69 KB
/
08_Primera Parte_Probabilidades.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
########################################################
## TP en RStudio de Estadística para Economistas I #################
## Cátedra de Tamara Burdisso – FCE-UNLP ##################
## Este ejercicio fuer elaborado por Esteban Rodriguez ########
## para el curso de Estadística FCE-UBA de Tamara Burdisso ##########
##durante los años 2018 a 2022 ##################
########################################################
## Primera Parte - Ejercicio 8 #########################
########################################################
#'En este ejercicio, jugaremos con el lanzamiento de dados de 6 caras.
#'En particular, analizaremos qué tan probable es que salga un 1 o un 6.
#' #### Ejercicio 8.a)
#' Realizar 12 lanzamientos de un dado *equilibrado*. Llamamos dado equilibrado a aquel en
#' donde todos los números tienen la misma probabilidad de ocurrencia.
#' ¿Qué resultados obtuvo?
###### Ejecutar desde aqui #################################
library(tidyverse)
lanzamientos_12 <- sample(c(1:6), 12, replace = TRUE)
lanzamientos_12
###### Hasta aqui ##########################################
#' ¿Qué proporción de 1 y 6 obtuvo?
###### Ejecutar desde aqui #################################
cat("La proporción de 1 fue:",mean(lanzamientos_12==1))
cat("La proporción de 6 fue:",mean(lanzamientos_12==6))
###### Hasta aqui ##########################################
#' Representar los resultados en un gráfico
###### Ejecutar desde aqui #################################
lanzamientos_12 %>% as.data.frame() %>%
ggplot() +
geom_bar(aes(.), fill="cyan") +
theme_classic() +
ggtitle("12 lanzamientos de un dado equilibrado") +
ylab("Cantidad de lanzamientos") +
theme(panel.background = element_blank(),
panel.grid.major.y = element_line(linetype = "dotted"),
panel.ontop = TRUE)
###### Hasta aqui ##########################################
#' En base a los resultados, analice la pertinencia de la siguiente frase:
#' *Como el dado es equilibrado, en 12 lanzamientos cada número tiene que salir*
#' *exactamente 2 veces.*
#' #### Ejercicio 8.b)
#' Realizar 12 lanzamientos de un dado, donde la probabilidad de obtener un 6 es 0.20 y la de
#' obtener cada uno de los restantes números es 0.16. Es decir, el dado no es *equilibrado* sino que está cargado a favor del 6.
#' ¿Qué resultados obtuvo?
###### Ejecutar desde aqui #################################
lanzamientos_12b <- sample(c(1:6), 12, prob = c(0.16,0.16,0.16,0.16,0.16,0.20), replace = TRUE)
lanzamientos_12b
###### Hasta aqui ##########################################
#' ¿Qué proporción de 1 y 6 obtuvo?
###### Ejecutar desde aqui #################################
cat("La proporción de 1 fue:",mean(lanzamientos_12b==1))
cat("La proporción de 6 fue:",mean(lanzamientos_12b==6))
###### Hasta aqui ##########################################
#' Representar los resultados en un gráfico
###### Ejecutar desde aqui #################################
lanzamientos_12b %>% as.data.frame() %>%
ggplot() +
geom_bar(aes(.), fill="cyan") +
theme_classic() +
ggtitle("12 lanzamientos de un dado no equilibrado") +
ylab("Cantidad de lanzamientos") +
theme(panel.background = element_blank(),
panel.grid.major.y = element_line(linetype = "dotted"),
panel.ontop = TRUE)
###### Hasta aqui ##########################################
#' ¿Obtuvo resultados muy distintos respecto al ejercicio 8.a)?
#' En base a los resultados, analice la pertinencia de la siguiente frase:
#' *Como el dado estaba cargado a favor del 6, en 12 lanzamientos tiene que salir más*
#' *de dos veces el 6, mientras que los demás números tienen que salir una misma*
#' *cantidad de veces.*
#' ¿Qué tan probables considera los resultados obtenidos,
#' tanto para el dado equilibrado como para el dado cargado?
#' Los siguientes gráficos de la distribución binomial pueden ayudarle a responder.
# Distribución Binomial para la cantidad de 1 obtenidos
###### Ejecutar desde aqui #################################
data.frame(Cantidad_de_Unos=c(0:12), "dado_equilibrado"=dbinom((0:12),12,1/6), "dado_cargado"=dbinom((0:12),12,0.16)) %>%
gather(caso,Probabilidad,-Cantidad_de_Unos) %>%
ggplot(aes(x=Cantidad_de_Unos, y=Probabilidad)) +
geom_col(fill="cyan") +
ylab("Probabilidad") +
xlab("Cantidad de números 1 obtenidos") +
facet_wrap(.~caso) +
theme_classic() +
scale_x_continuous(breaks=c(0:12),labels=c(0:12)) +
theme(panel.background = element_blank(),
panel.grid.major.y = element_line(linetype = "dotted"),
panel.ontop = TRUE)
###### Hasta aqui ##########################################
# Distribución Binomial para la cantidad de 6 obtenidos
###### Ejecutar desde aqui #################################
data.frame(Cantidad_de_Seis=c(0:12), "dado_equilibrado"=dbinom((0:12),12,1/6), "dado_cargado"=dbinom((0:12),12,0.2)) %>%
gather(caso,Probabilidad,-Cantidad_de_Seis) %>%
ggplot(aes(x=Cantidad_de_Seis, y=Probabilidad)) +
geom_col(fill="cyan") +
ylab("Probabilidad") +
xlab("Cantidad de números 6 obtenidos") +
facet_wrap(.~caso) +
theme_classic() +
scale_x_continuous(breaks=c(0:12),labels=c(0:12)) +
theme(panel.background = element_blank(),
panel.grid.major.y = element_line(linetype = "dotted"),
panel.ontop = TRUE)
###### Hasta aqui ##########################################
#' #### Ejercicio 8.c)
#' Repetiremos el ejercicio 8.a), pero esta vez lanzando **1 millón** de veces el dado equilibrado
#' Muestre los primeros 10 resultados
###### Ejecutar desde aqui #################################
lanzamientos_1m <- sample(c(1:6), 1000000, replace = TRUE)
head(lanzamientos_1m,10)
###### Hasta aqui ##########################################
#' ¿Qué proporción de 1 y 6 obtuvo en el millón de lanzamientos?
###### Ejecutar desde aqui #################################
cat("La proporción de 1 fue:",mean(lanzamientos_1m==1))
cat("La proporción de 6 fue:",mean(lanzamientos_1m==6))
###### Hasta aqui ##########################################
#' Representar los resultados en un gráfico
###### Ejecutar desde aqui #################################
lanzamientos_1m %>% as.data.frame() %>%
ggplot() +
geom_bar(aes(.), fill="cyan") +
theme_classic() +
ggtitle("1 millón de lanzamientos de un dado equilibrado") +
ylab("Cantidad de lanzamientos") +
theme(panel.background = element_blank(),
panel.grid.major.y = element_line(linetype = "dotted"),
panel.ontop = TRUE)
###### Hasta aqui ##########################################
#' Viendo los resultados, ¿está en condiciones de afirmar que el dado es equilibrado?
#' Por el momento, puede dar una respuesta “a ojo”. En la segunda parte de la materia
#' haremos un “test de hipótesis para la diferencia de proporciones” para poder
#' argumentar de manera más rigurosa.
#' #### Ejercicio 8.d)
#' Repetiremos el ejercicio 8.b), pero esta vez lanzando 1 millón de veces el dado con
#' probabilidades levemente favorables para el 6.
#' Muestre los primeros 10 resultados
###### Ejecutar desde aqui #################################
lanzamientos_1mb <- sample(c(1:6), 1000000, prob = c(0.16,0.16,0.16,0.16,0.16,0.20), replace = TRUE)
head(lanzamientos_1mb,10)
###### Hasta aqui ##########################################
#' ¿Qué proporción de 1 y 6 obtuvo?
###### Ejecutar desde aqui #################################
cat("La proporción de 1 fue:",mean(lanzamientos_1mb==1))
cat("La proporción de 6 fue:",mean(lanzamientos_1mb==6))
###### Hasta aqui ##########################################
#' Representar los resultados en un gráfico
###### Ejecutar desde aqui #################################
lanzamientos_1mb %>% as.data.frame() %>%
ggplot() +
geom_bar(aes(.), fill="cyan") +
theme_classic() +
ggtitle("1 millón de lanzamientos de un dado no equilibrado") +
ylab("Cantidad") +
theme(panel.background = element_blank(),
panel.grid.major.y = element_line(linetype = "dotted"),
panel.ontop = TRUE)
###### Hasta aqui ##########################################
#' Viendo los resultados, ¿está en condiciones de afirmar que el dado no es equilibrado?
#' Por el momento, puede dar una respuesta “a ojo”. En la segunda parte de la materia
#' haremos un “test de hipótesis para la diferencia de proporciones” para poder
#' argumentar de manera más rigurosa.
#' ¿Qué diferencias nota en la simulación con 12 lanzamientos y la de 1 millón de lanzamientos?
#' ¿Cuál es más confiable para sacar conclusiones?