# Portada
Integrantes del grupo:
- Rubén Gómez Olivencia

# Índice

- [1. Introducción](#introduccion)
- [2. Obtención de los datos](#2)
  - [2.1. Descargar el dataset](#2.1)
  - [2.2. Definición del dataset](#2.2)
- [3. Diseño de la base de datos](#diseño)
  - [3.1. Diseño conceptual](#diseño_conceptual)
  - [3.2. Diseño físico](#diseño_fisico)
    - [3.2.1. Elección del modelo](#3.2.1.)
    - [3.2.2. Crear las colecciones](#3.2.2.)
- [7. Conclusiones](#conclusiones)


TODO: HACER EL INDICE!

# 1. Introducción <a class="anchor" id="introduccion"></a>

Queremos conocer los distintos tipos de restaurantes, asadores y sidrerías que existen en Euskadi para poder realizar actividades grupales para ir a comer a estos restaurantes. Es interesante diferenciarlos por el tipo de restaurantes que son, para así poder realizar un sorteo de a qué tipo de restaurante ir.

Dado que pueden existir personas que son **vegetarianas**, también resulta decisivo poder identificar los lugares en los que se ofertan menús de este tipo. 

Por último, también va a interesar qué locales permiten realizar **bodas** para de esta manera poder ofrecerlo a los clientes.

# 2. Obtención de los datos <a class="anchor" id="2"></a>

Para obtener los datos de los restaurantes, asadores y sidrerías que existen en Euskadi se ha utilizado la página web creada por el Gobierno Vasco llamada "Open Data Euskadi" cuya URL es la siguiente [https://www.opendata.euskadi.eus/inicio/](https://www.opendata.euskadi.eus/inicio/). Se ha utilizado este portal dado que es una fuente de datos oficial y que contiene datos fidedignos de información turística como la que nos interesa.

Dentro de este portal de transpanrencia existe mucha información como la que nos interesa, que concreatamente podemos visitar en el siguiente [enlace](https://www.opendata.euskadi.eus/catalogo/-/restaurantes-asadores-y-sidrerias-de-euskadi/). En esta web vamos a poder ver que podemos descargarnos los datos en distintos formatos, siendo el que nos interesa el formato JSON. Concrétamente, la URL del fichero JSON es la siguiente: "https://www.opendata.euskadi.eus/contenidos/ds_recursos_turisticos/restaurantes_asador_sidrerias/opendata/restaurantes.json", con el que obtenemos un fichero llamado **[restaurantes.json](https://www.opendata.euskadi.eus/contenidos/ds_recursos_turisticos/restaurantes_asador_sidrerias/opendata/restaurantes.json)**.



## 2.1. Descargar el dataset <a class="anchor" id="2.1"></a>

Ahora que sabemos la [URL](https://www.opendata.euskadi.eus/contenidos/ds_recursos_turisticos/restaurantes_asador_sidrerias/opendata/restaurantes.json) del fichero es momento de descargar el dataset original para poder hacer uso de él.

Lo primero que hay que hacer es cargar las librerías necesarias:

* **requests**: Librería HTTP para realizar peticiones.
* **json**: Librería para hacer uso de ficheros JSON.

In [6]:
# Se usa la librería requests, para hacer peticiones a webs
import requests as re
# Importar Librería json de Python porque se va a descargar fichero en formato JSON
import json

Creamos una variable con la URL original del fichero y realizamos la petición de descarga:

In [7]:
# Se indica la url del fichero de la página web
url = 'https://www.opendata.euskadi.eus/contenidos/ds_recursos_turisticos/restaurantes_asador_sidrerias/opendata/restaurantes.json'

# Se realiza la petición
respuesta = re.get(url)

Tras realizar la petición, es el momento de guardar los datos en un fichero:

In [10]:
# Guardar el fichero de la página web en local (en nuestro pc)
with open('./fichero_datos.json', 'wb') as fichero:     
    fichero.write(respuesta.content)
# No hace falta, pero por si acaso.
fichero.close() 

Con el dataset descargado, ya podemos proseguir al siguiente paso.

## 2.2. Definición del dataset <a class="anchor" id="2.2"></a>

Una vez descargado el fichero, podemos observar que el dataset obtenido contiene 58 campos para cada uno de los restaurantes que existen en la información obtenida de Open Data Euskadi. Tras realizar un análisis del fichero, vemos que muchos de los campos están vacios o que no nos interesan para nuestro objetivo (ya que es un dataset genérico reutilizado por varios apartados de Opendata), y por tanto nos vamos a quedar con el siguiente conjunto de datos del fichero original. Los campos que nos interesan son:

* **documentName**: Este es el nombre del campo que contiene el nombre del restaurante.
* **turismDescription**: Descripción del restaurante.
* **restorationType**: Tipo de local: si es restaurante, asador o sidrería.
* **phone**: Teléfono de contacto del establecimiento.
* **tourismEmail**: E-mail de contacto.
* **web**: Página web del restaurante.
* **address**: Dirección donde está situado.
* **postalCode**: Código postal
* **municipality**: Municipio en el que se sitúa el restaurante.
* **territory**: Territorio dentro de la Comunidad Autónoma del País Vasco.
* **capacity**: Capacidad permitida.
* **michelinStar**: Si el restaurante cuenta con alguna estrella Michelin.
* **latwgs84**: Latitud de la geoposición donde está situado.
* **lonwgs84**: Longitud de la geoposición donde está situado.


Con este conjunto de datos podremos obtener la información que nos interesa

# 3. Diseño de la base de datos  <a class="anchor" id="diseño"></a>

Tras analizar el fichero y determinar cuál es el conjunto de datos que nos interesa, vamos a realizar el diseño de la base de datos que utilizaremos posteriormente para usarlo en MongoDB.

## 3.1.Diseño conceptual <a class="anchor" id="diseño_conceptual"></a>

Con los datos que nos interesa, vamos a realizar el diseño conceptual de los mismos mediante el **lenguaje unificado de modelado** (UML).

Analizando los datos podemos observar que existen cuatro objetos:

* **Restaurante**: El objeto restaurante, con cierta información acerca del mismo.
* **Ubicación**: El objeto que indica una geo-posición.
* **Dirección**: El objeto de tipo dirección.
* **TipoRestaurante**: El objeto de los tipos de restaurante que existen.

Con estos cuatro objetos el diseño conceptual quedaría de la siguiente forma:

![modelo_datos.png](attachment:9f76de44-a1f2-499f-be4f-59ae1f6b468a.png)

Con esto ya tendríamos el modelado de datos creado y pasaremos al siguiente paso que es el diseño físico de los mismos.

## 3.2. Diseño físico <a class="anchor" id="diseño_fisico"></a>

Tras realizar el diseño conceptual, es el momento de realizar el diseño físico para posteriormente realizar el despliegue en la base de datos.

### 3.2.1 Elección del modelo <a class="anchor" id="3.2.1."></a>

A pesar del diseño conceptual creado previamente, en el que hemos diferenciado cuatro objetos separados, se ha decidido optar por un **modelo flexible** a la hora de realizar el diseño físico de la base de datos.

Este modelo flexible nos va a permitir tener todos los datos embebidos dentro de un mismo documento que a la hora de realizar la búsqueda de datos nos dará **mayor rendimiento**.

Por todo ello, se unificarán los cuatro objetos dentro de un mismo documento que contendrá los 14 campos que hemos ido analizando a lo largo de este documento

### 3.2.2. Crear las colecciones <a class="anchor" id="3.2.2."></a>

Teniendo en cuenta el paso anterior, en el que los datos de cada restaurante se contendrá en un único documento, se ha decidido crear una única colección en la que contener todos los documentos de todos los restaurantes.

Dicha colección se llamará **restaurante** que estará integrada dentro de la base de datos **actividad2**.

Para crear la colección tendremos que realizar los siguientes pasos:

```js
use actividad2
db.createCollection("restaurantes")
```

Estos mismos pasos están añadidos dentro del fichero **fisico.js** que va adjunto a este documento.

# 4. Despliegue de la base de datos <a class="anchor" id="despliegue"></a>

## 4.1. Conexión a servidores <a class="anchor" id="conexion"></a>

En este apartado se va a explicar cómo realizar la conexión a servidores MongoDB a través del lenguaje de programación Python. Antes de realizar la conexión es necesario
tener la librería pymongo instalada en nuestro sistema. Para ello realizaremos la instalación mediante el comando de sistema ```pip```.

In [1]:
# Para realizar la conexión necesitamos de la API de python.
!pip install pymongo

Defaulting to user installation because normal site-packages is not writeable
[0m

In [2]:
# importamos la librería para poder hacer uso de ella:
import pymongo

### 4.1.1. Conexión local <a class="anchor" id="conexion_local"></a>

En lugar de realizar una instalación al uso, se ha decidido realizar la instalación del servicio a través de un contenedor **[Docker](https://www.docker.com/)**, haciendo uso de **[docker-compose](https://docs.docker.com/compose/)** para levantar los servicios. Para ello se ha utilizado un fichero **compose.yaml** con el siguiente contenido de despliegue:

```yaml
services:

  mongo:
    image: mongo:5
    environment:
      MONGO_INITDB_ROOT_USERNAME: root
      MONGO_INITDB_ROOT_PASSWORD: example
    ports:
      - 27017:27017
    restart: always

  mongo-express:
    image: mongo-express
    ports:
      - 8081:8081
    environment:
      ME_CONFIG_MONGODB_ADMINUSERNAME: root
      ME_CONFIG_MONGODB_ADMINPASSWORD: example
      ME_CONFIG_MONGODB_URL: mongodb://root:example@mongo:27017/
    restart: always
```

Si nuestro sistema está correctamente configurado, al realizar ```docker-compose up``` levantará los servicios que hemos configurado:

* **MongoDB** versión 5 escuchando en el puerto 27017 del anfitrión.
* **Mongo Express**: interfaz web para administrar MongoDB escuchando en el puerto 8081 del anfitrión.


In [3]:
# formamos la URI de conexión al servidor local
uri_mongo = "mongodb://root:example@127.0.0.1/?retryWrites=true&w=majority" 

# Conectar al servicio MongoDB
con_local = pymongo.MongoClient(uri_mongo)

todas = con_local.list_database_names()

for db in todas:
    print(db)

pymongo.version

admin
config
local
prueba_bbdd


'4.1.1'

In [4]:
# pruebas
base_datos = con_local.prueba_bbdd
coleccion1 = base_datos.prueba_coleccion

documento1 = {"nombre" : "Prueba",
              "edad":   20}
# Insertar un documento
coleccion1.insert_one(documento1)

print(coleccion1.find())

<pymongo.cursor.Cursor object at 0x7ff47e392aa0>


In [5]:
#import datetime
fecha = datetime.datetime(2020, 5, 17)
dato = {"nombre":"ruben", "fecha":datetime.datetime(2020, 5, 17)}
coleccion2 = base_datos.prueba2
coleccion2.insert_one(dato)


NameError: name 'datetime' is not defined

In [None]:
print(coleccion2.find())

for d in coleccion2.find():
    print(d)

# 5. Consultas a base de datos  <a class="anchor" id="consultas"></a>

# 6. MongoDB Charts  <a class="anchor" id="charts"></a>

# 7. Conclusiones  <a class="anchor" id="conclusiones"></a>