generated from Pakillo/quarto-course-website-template
-
Notifications
You must be signed in to change notification settings - Fork 0
/
clase2.qmd
165 lines (90 loc) · 7.4 KB
/
clase2.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
---
title: "Clase 2 - Modelos de datos"
---
## Objetivos de Aprendizaje
- Definir Ciencia de Datos, Minería de Datos, Aprendizaje Automático, Inteligencia Artificial y Big Data.
- Definir base de datos.
- Describir al menos tres problemas que tienen los archivos de textos que son resueltos por las bases de datos.
- Definir base de datos relacional.
- Definir Entidad, Relación, Atributo y Dominio.
- Identificar Entidades, Relaciones, Atributos y Dominios.
- Analizar y leer Modelos de Entidad Relación (MER).
- Generar Modelos de Entidad Relación.
## Slides
<iframe src="https://docs.google.com/presentation/d/1hK34H55hKRaG8tn9LJ-AEayV2t9n3FVU1FBiP210Du0/embed?start=false&loop=false&delayms=3000" frameborder="0" width="760" height="569" allowfullscreen="true" mozallowfullscreen="true" webkitallowfullscreen="true">
</iframe>
## Ejercicios
#### 1) Miren el video de esta empresa AgTech que utiliza Ciencia de Datos, discutan en grupo para contestar las siguientes preguntas:
**Duración:** \~8 minutos
**Video:** (2:00 minutos) [Conocé kilimo](https://youtu.be/4lwa-6Li6t8)
**Charlar en grupo para contestar estas preguntas** (8 minutos):
- ¿Cuál es el servicio que brindan?
- ¿Pueden identificar las 3 Vs del BigData en este servicio? mencione como está representada y porqué.
- ¿Les parece que el servicio es exitoso?, ¿Por qué?\
#### 2) Miren el video de esta municipalidad que utiliza Ciencia de Datos, discutan en grupo para contestar las siguientes preguntas:
**Duración:** \~8 minutos
**Video:** (2:30 minutos)[Manos en la Data](https://www.youtube.com/watch?v=_s7YOkX6C2Y)
**Charlar en grupo para contestar estas preguntas** (7:30 minutos)**:**
- ¿Sobre qué servicio trabajaron?
- ¿Qué tecnologías relacionadas con Ciencia de Datos se mencionan en el video?
- ¿Qué datos utilizan?, Identifiquen algunas de las dimensiones que vimos en la teoría.
- ¿Pueden identificar las 3 Vs del BigData en este servicio? mencione como está representada.
#### 3) Miren este videos sobre transacciones ACID en Base de Datos y contesten en grupo las preguntas:
**Duración:** \~15 minutos
**Video 1:** (5:11 minutos) [ACID Transactions: Fundamentos de bases de datos](https://www.youtube.com/watch?v=0tAqp3w_K2o)
**Para trabajar en grupos: definan con sus palabras que significan cada una de las letras de ACID** (5 minutos)
- A:
- C:
- I:
- D:
¿Cómo se relacionan estas cualidades con los problemas mencionados con los sistemas de archivos?
#### 4) A partir del análisis de este conjunto de datos, generen el diagrama de Entidad-Relación:
**Duración:** \~15 minutos
1. Miren el conjunto de datos que le corresponde a su grupo (Revisar: [Listado de bases de datos](#listado-de-base-de-datos)).
2. A partir del análisis de este conjunto de datos, dibujen el Diagrama Entidad-Relación correspondiente.
Pueden realizar este ejercicio de dos maneras:
- Una persona comparte la pantalla y dibuja el diagrama que se discute con el resto del grupo.
- Comparten el link entre todes para que puedan editar el diagrama en conjunto.
**Usen esta herramienta para dibujar el diagrama:** https://excalidraw.com
![Controles de Excalidraw](img/excalidraw.png){fig-alt="Pantalla de Excalidraw. Arriba a la izquierda se marca el ícono para compartir y poder editar en grupo el diagrama (es el quinto y último icono en el menú). También se marca el ícono para exportar el diagrama a una imagen (es el cuarto icono en el menú)"}
Luego coloquen el diagrama en este documento. Pueden exportarlo como imágen e insertarlo en el documento.
3\) Definir el dominio de cada atributo completando la siguiente tabla:
| | | |
|-----------------|-------|--------------------------|
| Nombre atributo | Tipo | Rango de valores válidos |
| | | |
| | | |
| | | |
| | | |
::: callout-tip
## Documento compartido de ejercicios
Esta es una [plantilla del documento compartido](https://docs.google.com/document/d/1rTH3FnmbZkwT_-coW5vAXWghGWSttn5KowWSYftVRUc/edit?usp=sharing) en google docs. Se debe generar un archivo por cada grupo. Se recomienda que los grupos tengan entre dos y cuatro personas.
:::
### Listado de base de datos {#listado-de-base-de-datos}
- **Grupo 1**
[Clima](https://drive.google.com/file/d/12s-769RMbqlYMJLT3jyiQJQQuElLhW81/view?usp=sharing): Datos meteorológicos horarios para las estaciones en aeropuertos: LGA, JFK y EWR.
- **Grupo 2**
[Vehículos](https://drive.google.com/file/d/1BeWbefWcOWQSjO4toHVoaGh0o_lGX1rr/view?usp=sharing): Datos de economía de combustible de la Agencia de Protección Medioambiental (EPA) de EE.UU., 1985-2015. Contiene una selección de variables y no considera vehículos con datos incompletos.
- **Grupo 3**
[Pinguinos](https://drive.google.com/file/d/1KKHJ2XBSWhxAyvupu19U283bYyx8LVCP/view?usp=sharing): Medidas de tamaño de pingüinos adultos en busca de comida cerca de la estación Palmer en la Antártica.
- **Grupo 4**
[Aeropuertos](https://drive.google.com/file/d/1lM0qcLfCqKZBs_4bLOF6D6hfSWEX88is/view?usp=sharing): Información general (nombre, localización, zona horaria) sobre aeropuertos.
- **Grupo 5**
[Bateadores](https://drive.google.com/file/d/1eHLF-SbEe-GsKZ1eWDACzjtE4WmXsG1a/view?usp=sharing): Estadísticas de bateadores de beisbol.
- **Grupo 6**
[Aviones](https://drive.google.com/file/d/1YEOfQARhCyS7LkkaXSrREDqyfHkXyG6B/view?usp=sharing): Datos de los aviones y sus códigos de cola en el registro de aviación de la FAA. American Airways (AA) y Envoy Air (MQ) reportan número de flota en lugar de número de cola, por lo que no es posible trazarlos.
- **Grupo 7**
[Personas](https://drive.google.com/file/d/1NZjpquj96Ay7gh9FSd6ML8cUJh3lU_mq/view?usp=sharing): Nombres de jugadores de beisbol, fecha de nacimiento e información bibliográfica.
- **Grupo 8**
[Encuesta](https://drive.google.com/file/d/1HUMHZX_WOOiP2k8QBgF9DA1m1o_jN--0/view?usp=sharing): Muestra de variables categóricas de la Encuesta Social General de EE.UU.
- **Grupo 9**
[Millas](https://drive.google.com/file/d/13QMhiIwWHSwJRGRF_OVC6BPEFqiEXAkH/view?usp=sharing): Este conjunto de datos contiene un subconjunto de los datos de economía de combustible que la Agencia de Protección Medioambiental (EPA) pone a disposición en http://fueleconomy.gov. Contiene solo modelos que tuvieron una nueva versión cada año entre 1999 y 2008, lo que fue utilizado como un proxy de la popularidad del modelo.
- **Grupo 10**
[Gapminder](https://drive.google.com/file/d/1TGP8NNYz6-tuaIhvv_QTYJ6eSEJyE2fr/view?usp=sharing): Extracto de datos de Gapminder sobre expectativa de vida, PIB per cápita y población, según país.
::: callout-tip
## Conjunto de datos
Este listado de conjunto de datos están disponibles con licencia de uso abierta en paquetes de R que luego se pueden utilizar en las clases de R.
Se puede generar un listado de conjuntos de datos con temas más cercanos a tus estudiantes y con variables y entidades en su idioma nativo.
:::
## Lecturas sugeridas
* Modulos 1 y 2 del libro [Bases de datos](https://www.uoc.edu/pdf/masters/oficiales/img/913.pdf). Rafael Camps Paré, Luis Alberto Casillas Santillán, Dolors Costal Costa, Marc Gibert Ginestà, Carme Martín Escofet, Oscar Pérez Mora. ISBN: 84-9788-269-5.