# Actividad 2

#### Integrantes: **Alex Breedy, Santiago Albuja, Wilson Monge**

### ÍNDICE

1. Introducción
2. Obtención de los datos
3. Diseño de la base de datos
4. Despliegue
5. Consultas
6. Conclusiones

## 1. Introducción

*Descripción de la propuesta:* Se quiere desarrollar un portal de noticias web que presente artículos con las últimas noticias nacionales e internacionales. Las noticias incluyen distintas temáticas en las que se incluyen: variedades, política, deportes, etc. 
Además la aplicación deberá permitir la creación de cuentas para los usuarios y guardar las preferencias de cada uno de ellos, de igual manera, el número de visualizaciones de cada noticia. Lo que permitirá obtener información relevante con la que se puedan realizar recomendaciones personalizadas de noticias a cada usuario y así mejorar la experiencia


## 2. Obtención de los datos

- ¿Cómo se obtuvieron los datos?

Los datos serán sintéticos, generados manualmente. Se decidió este tipo de dataset para que cumpla con las condiciones que necesitamos para el desarrollo de este proyecto.


- Definición del dataset

Dataset abierto:

| campo | descripción | tipo de dato |
| --- | --- | --- |
| id_ | identificador de la noticia | bson |
| title | título del artículo | string |
| link | link a la página de la noticia | string |
| keywords | palabras clave de la noticia | string[] |
| creator | autores de la noticia | string[] |
| video_url | link al video (si lo hubiese) | string |
| description | descripción corta de la noticia | string |
| content | contenido de la noticia | string |
| pubDate | Fecha de publicación | timestamp |
| image_url | link a la imágen (si la hubiese) | string |
| source_id | fuente original de la noticia | string |
| categories | categorías que enmarca la noticia | string[] |

Datasets sintéticos:

| campo | descripción | tipo de dato |
| --- | --- | --- |
| id_ | identificador del usuario | bson|
| nombre | nombre del usuario | string |
| apellido | apellido del usuario | string |
| correo | correo electrónico del usuario | string |
| usuario | nombre del usuario | string |
| password | contraseña del usuario | string |

| campo | descripción | tipo de dato |
| --- | --- | --- |
| id_ | identificador de la visita | bson |
| id_noticia | identificador de la noticia | bson |
| id_usuario | identificador del usuario | bson |
| fecha_consulta | fecha en la que se abrió el artículo | timestamp[] |
| contador | número de veces que se revisó el artículo | integer |

## 3. Diseño de la base de datos

### 3.1 Diseñó conceptual y lógico

Debemos deficir el tipo de modelo de datos a diseñar: 

- Los archivos JSON: Noticia y Usuario están estructurados, no van a estar todos los datos en un solo documento, por eso no va a ser un diseño con flexibilidad. Vamos a usar un diseño con Documentos.
- El archivo JSON: Visitas va a contener las claves primarias generadas por MongoDB de las entidades relacionadas, es decir, vamos a usar un modelo por referencia.

Entonces, el modelo finalmente será: **Documento con referencias**.

![conceptual.png](attachment:conceptual.png)

## 3.2 Diseño Físico

#### 3.2.1 Crear las colecciones:  

db.createCollection("noticia")  
db.createCollection("usuario")  
db.createCollection("visitas")  

#### 3.2.2 Ejecutar las validaciones a las colecciones pertinentes: 

```
db.runCommand( {  
   collMod: "usuario",  
   validator: { $jsonSchema: {  
      bsonType: "object",  
      required: [ "nombre", "apellido", "correo", "usuario", "password" ],  
      properties: {  
         nombre: {  
            bsonType: "string",  
            description: "nombre debe ser de tipo string y requerido"  
         },  
         apellido: {  
            bsonType: "string",  
            description: "apellido debe ser de tipo string y requerido"  
         },  
         correo: {  
            bsonType: "string",  
            description: "correo debe ser de tipo string y requerido"  
         },  
         usuario: {  
            bsonType: "string",  
            description: "usuario debe ser de tipo string y requerido"  
         },  
         password: {  
            bsonType: "string",  
            description: "password debe ser de tipo string y requerido"  
         }  
      }  
   } },  
   validationLevel: "strict"  
   } )  
```

```
db.runCommand( {  
   collMod: "visitas",  
   validator: { $jsonSchema: {  
      bsonType: "object",  
      required: [ "id_noticia", "id_usuario", "fecha_consulta", "contador" ],  
      properties: {  
         id_noticia: {  
            bsonType: "bson",  
            description: "id_noticia debe ser de tipo bson y requerido"  
         },  
         id_usuario: {  
            bsonType: "bson",  
            description: "id_usuario debe ser de tipo bson y requerido"  
         },  
         fecha_consulta: {  
            bsonType: "timestamp",  
            description: "fecha_consulta debe ser de tipo timestamp y requerido"  
         },  
         contador: {  
            bsonType: "int",  
            description: "contador debe ser de tipo integer y requerido"  
         }
      }  
   } },  
   validationLevel: "strict"  
   } )  
```

## 4. Despliegue

### 4.1 Configuracion de la base de datos MongoDB

In [1]:
#instalar librería pymongo
!pip install pymongo
#importar la librería pymongo
import pymongo
#Conexión en local
host='localhost'
port='27017'
uri="mongodb://" + host + ":" + port + "/"
connection = pymongo.MongoClient(uri)
queryExample = connection.list_database_names()
for names in queryExample:
    print(names)
#--------------------------------------------------------
#mi base de datos para ejecutar estos procesos
testdatabase = connection.testdatabase
#consultar si existe la base de datos
queryExample = connection.list_database_names()
for names in queryExample:
    print(names)

admin
config
local
testdatabase
willdatabase
admin
config
local
testdatabase
willdatabase


### 4.2 Importar los datos de los datasets e insertarlos en la base de datos

In [9]:
#Libreria para interceptar request
import requests as re
#importo librería para json
import json
#RESETEO LAS COLECCIONES
testdatabase.noticia.drop();
testdatabase.usuario.drop();
testdatabase.visitas.drop();
#REFERENCIA A LAS COLECCIONES
noticia = testdatabase.noticia
usuario = testdatabase.usuario
visitas = testdatabase.visitas
#CARGO ARCHIVOS DE NOTICIAS
with open('noticias.json', 'r', encoding='utf8') as read_fichero: 
    lector = json.load(read_fichero)
    for linea in lector:
        title = linea['title']
        print("Inserto noticia: ", title)
        noticia.insert_one(linea)
#CARGO ARCHIVOS DE USUARIOS
with open('usuarios.json', 'r', encoding='utf8') as read_fichero: 
    lector = json.load(read_fichero)
    for linea in lector:
        nombre = linea['usuario']
        print("Inserto usuario: ", nombre)
        usuario.insert_one(linea)

Inserto noticia:  Crisis de alimentos en Argentina
Inserto noticia:  Estalla Guerra en Ucrania
Inserto noticia:  Mundial de Qatar arranca
Inserto noticia:  Bubblemix
Inserto noticia:  Browsezoom
Inserto noticia:  Gabvine
Inserto noticia:  Divanoodle
Inserto noticia:  Kazu
Inserto noticia:  Topiczoom
Inserto noticia:  Aimbu
Inserto noticia:  Twimbo
Inserto noticia:  Katz
Inserto noticia:  Devpoint
Inserto noticia:  Feedfire
Inserto noticia:  Twitterwire
Inserto noticia:  Dynazzy
Inserto noticia:  Gigazoom
Inserto noticia:  Yombu
Inserto noticia:  Gabvine
Inserto noticia:  LiveZ
Inserto noticia:  Yotz
Inserto noticia:  Tagpad
Inserto noticia:  Trudoo
Inserto noticia:  Oloo
Inserto noticia:  Eamia
Inserto noticia:  Fadeo
Inserto noticia:  Vipe
Inserto noticia:  Livepath
Inserto noticia:  Photobean
Inserto noticia:  Oyoba
Inserto noticia:  Jabbertype
Inserto noticia:  Brainbox
Inserto noticia:  Meevee
Inserto noticia:  Skivee
Inserto noticia:  Babbleblab
Inserto noticia:  Quatz
Inserto not

## 5. Consultas

- Input: Consulto las colecciones disponibles  
- Output: usuario, noticia y visitas (en caso de haber ejecutado el db.createCollection("visitas"))

In [3]:
print (testdatabase.list_collection_names())  


['usuario', 'visitas', 'noticia']


- Input: Consulto un documento de la colección usuario
- Output: datos de un usuario

In [4]:
print(usuario.find_one())

{'_id': ObjectId('638194bde351ed4c50e731ce'), 'nombre': 'Wilson', 'apellido': 'Monge', 'correo': 'wilson_monge@hotmail.com', 'usuario': 'wmonge', 'password': '123456.a'}


- Input: Inserts en las colecciones noticia, usuario  
- Output: Presentaré además los datos insertados

In [7]:
nuevas_noticias = [ { 
    "title": "Avatar 2 se estrenará en Diciembre 12",
    "link": "https://www.fotogramas.es/noticias-cine/a32469406/avatar-2-fecha-estreno-reparto-sinopsis-trailer/",
    "keywords": ["Estrenos", "James Cameron", "Avatar"],
    "creator": "Fotogramas",
    "video_url": "",
    "description": "La última produccion de James Cameron será estrenada este Diciembre",
    "content": "¡Se viene 'Avatar 2'! Parece mentira, pero ya han pasado más de diez años desde que estrenó 'Avatar', para muchos una de las mejores películas de la historia del cine y la apuesta de James Cameron para hacer avanzar el cine en una nueva dirección, y ya estamos esperando su secuela: 'Avatar 2', titulada originalmente 'Avatar: El sentido del agua', llegará a finales de 2022. Recopilamos toda la información que debes saber: fecha de estreno, sinopsis, tráiler, duración, imágenes oficiales y más, e incluso cuándo se estrena 'Avatar 2' en Disney+ para los más adelantados. ¡Bienvenidos de nuevo a Pandora!",
    "pubDate": "2022-10-26 08:40:36",
    "image_url": "https://lumiere-a.akamaihd.net/v1/images/poster_avatar_2_el_camino_del_agua_1d2e37ee.jpeg?region=0,0,752,1080",
    "source_id": "tuttojuve",
    "categories": ["Cine", "Entretenimiento"]},
    { 
    "title": "Arriba a México la delegación del Gobierno de Venezuela para reiniciar el diálogo con la oposición",
    "link": "https://actualidad.rt.com/actualidad/449525-arribar-mexico-delegacion-gobierno-venezuela",
    "keywords": ["México", "Oposición", "Venezuela"],
    "creator": "RT",
    "video_url": "",
    "description": "Este sábado comienza la ronda de conversaciones con la Plataforma Unitaria",
    "content": "Este viernes arribaron a México los integrantes del equipo del Gobierno venezolano que entablarán un diálogo con la opositora Plataforma Unitaria. La nueva ronda de negociación se celebrará este sábado en la capital mexicana y tendrá la intermediación de Noruega. ",
    "pubDate": "2022-12-26 18:03:11",
    "image_url": "https://mf.b37mrtl.ru/actualidad/public_images/2022.11/article/638165f559bf5b14ac5c716b.jpg",
    "source_id": "rtnoticias",
    "categories": ["Política", "Internacionales"]}
]
noticia.insert_many(nuevas_noticias)  

nuevo_usuario = {
  "nombre": "Juan",
  "apellido": "Perez",
  "correo": "juanito1990@hotmail.com",
  "usuario": "jperez",
  "password": "aaabbbccc"
}
usuario.insert_one(nuevo_usuario)  

print(noticia.find_one({"title": "Avatar 2 se estrenará en Diciembre 12"}))
print(usuario.find_one({"usuario": "jperez"}))

{'_id': ObjectId('63819abce351ed4c50e731d7'), 'title': 'Avatar 2 se estrenará en Diciembre 12', 'link': 'https://www.fotogramas.es/noticias-cine/a32469406/avatar-2-fecha-estreno-reparto-sinopsis-trailer/', 'keywords': ['Estrenos', 'James Cameron', 'Avatar'], 'creator': 'Fotogramas', 'video_url': '', 'description': 'La última produccion de James Cameron será estrenada este Diciembre', 'content': "¡Se viene 'Avatar 2'! Parece mentira, pero ya han pasado más de diez años desde que estrenó 'Avatar', para muchos una de las mejores películas de la historia del cine y la apuesta de James Cameron para hacer avanzar el cine en una nueva dirección, y ya estamos esperando su secuela: 'Avatar 2', titulada originalmente 'Avatar: El sentido del agua', llegará a finales de 2022. Recopilamos toda la información que debes saber: fecha de estreno, sinopsis, tráiler, duración, imágenes oficiales y más, e incluso cuándo se estrena 'Avatar 2' en Disney+ para los más adelantados. ¡Bienvenidos de nuevo a Pan

- Input: Consultar 1 noticia y 1 usuario, con esos códigos hacer un insert en la colección visitas  
- Output: Si la collección visitas no existe debería crearse, y mostar el nuevo dato insertado

In [6]:
id_noticia = noticia.find_one({"title": "Avatar 2 se estrenará en Diciembre 12"})
print(id_noticia['_id'])
id_usuario = usuario.find_one({"usuario": "jperez"})
print(id_usuario['_id'])
visita = {
    "id_noticia": id_noticia['_id'],
    "id_usuario": id_usuario['_id'],
    "fecha_consulta": [
        "2022-12-26 22:03:11"
    ],
    "contador":1
}
visitas.insert_one(visita) 
for x in visitas.find():
  print(x)

63819abce351ed4c50e731d7
63819abce351ed4c50e731d9
{'_id': ObjectId('63819abce351ed4c50e731d9'), 'nombre': 'Juan', 'apellido': 'Perez', 'correo': 'juanito1990@hotmail.com', 'usuario': 'jperez', 'password': 'aaabbbccc'}
{'_id': ObjectId('63819f62e351ed4c50e731da'), 'id_noticia': ObjectId('63819abce351ed4c50e731d7'), 'id_usuario': ObjectId('63819abce351ed4c50e731d9'), 'fecha_consulta': ['2022-12-26 22:03:11'], 'contador': 1}
{'_id': ObjectId('63819fa9e351ed4c50e731db'), 'id_noticia': ObjectId('63819abce351ed4c50e731d7'), 'id_usuario': ObjectId('63819abce351ed4c50e731d9'), 'fecha_consulta': ['2022-12-26 22:03:11'], 'contador': 1}
{'_id': ObjectId('63819fdbe351ed4c50e731dc'), 'id_noticia': ObjectId('63819abce351ed4c50e731d7'), 'id_usuario': ObjectId('63819abce351ed4c50e731d9'), 'fecha_consulta': ['2022-12-26 22:03:11'], 'contador': 1}
{'_id': ObjectId('63819ffae351ed4c50e731dd'), 'id_noticia': ObjectId('63819abce351ed4c50e731d7'), 'id_usuario': ObjectId('63819abce351ed4c50e731d9'), 'fecha_c

## 6. Conclusiones

El modelado de una base de datos no relacional difiere del de la relacional, específicamente en que el modelado se lo realiza de una manera mucho más manual. Antes de definir el tipo de estrategia seguir, primero se necesita disponer de un muestreo de los datos a ser modelados para poder tener una referencia clara. Por último, una vez terminado el modelado conceptual y físico, es  indispensable realizar pruebas de inserciones y consultas para tener una visión más amplia de lo que hemos modelado.