# CRUD y Consultas Básicas con PyMongo

<img src="../images/MongoDB-Logo-RGB.jpeg" alt="MongoDB Logo" style="width: 400px; PADDING-LEFT: 5px"/>

En este notebook vamos a profundizar en la teoría vista en clase, en concreto vamos a repasar:

* CRUD de documentos sobre colecciones de MongoDB
* Consultas sencillas:
    * find() findOne()
    * Count, Limit, Skip & Sort

El primer paso para utilizar el driver de Python para conectarnos y operar sobre MongoDB es importar la librería del driver.

In [None]:
#!pip install --upgrade pip
#!pip install pymongo

In [None]:
import pymongo
from pymongo import MongoClient

## 1. Conexión a la base de datos

Para conectarnos a la base de datos creamos una isntancia del objeto MogoClient que nos permitirá operar sobre la base de datos. 

Para indicarle a servidor conectarse le indicamos la url a la base de datos en formato JDBC:

{protocolo}://{usuario:contraseña}@{host}:{puerto}

Y para limpiar el entorno de anteriores ejecuciones, borramos la base de datos que se utiliza en este notebook.

In [None]:
client = MongoClient('mongodb://nosql:nosql@localhost:27017/')

client.drop_database("notebook_uno")

## 2. Creación de la base de datos del ejercicio

Para crear una base de datos en mongo basta con indicarle al cliente que la utilice. Guardaremos la referencia a la base de datos en una variable para trabajar con ella.

**Importante** MongoDB no crea la base de datos hasta que no se inserta un dato en ella.

In [None]:
db = client["notebook_uno"]

## 3. Crear e insertar datos en una colección 

Pra crear una colección en la base de datos seleccionada, utilizamos la referencia que guardamos al crear la base de datos y le indicamos a través del nombre que la utilice. Guardamos su referencia en una variable para utilizarla despues.

**Importante** MongoDB no crea la colección hasta que no se inserta un documento en ella. 

Para insertar un único documento utilizamos la función insert_one.

In [None]:
customers = db["customers"]

In [None]:
customers.insert_one({ "name": "John", "address": "Highway 37" })

Si al insertar no se indica el valor del campo '_id', MongoDB le asignará uno que genera de forma automática.

Pero podemos insertar in valor indicando nosotros su _id.

In [None]:
customers.insert_one({"_id": 1, "name": "Amy", "address": "Apple st 652" })

Pero si intentamos volver a insertar un documento con el mismo _id, obtendremos un error, ya que este campo identifica de forna única el documento y no por tanto tiene que ser único.

In [None]:
try:
    customers.insert_one({"_id": 1, "name": "Amy", "address": "Apple st 652" })
except:
    print("Error insertando el documento!")
    raise

Dedica unos minutos a entender la traza de la excepción: 
1. ¿Qué error devuelve la base de datos?
2. En que línea del código de la celda del notebook se producer el error?

También podemos insertar varios documentos de forma simultánea utilizando la función insert_many()

In [None]:
customer_list = [
  { "name": "Hannah", "address": "Mountain 21"},
  { "name": "Michael", "address": "Valley 345"},
  { "name": "Sandy", "address": "Ocean blvd 2"},
  { "name": "Betty", "address": "Green Grass 1"},
  { "name": "Richard", "address": "Sky st 331"},
  { "name": "Susan", "address": "One way 98"},
  { "name": "Vicky", "address": "Yellow Garden 2"},
  { "name": "Ben", "address": "Park Lane 38"},
  { "name": "William", "address": "Central st 954"},
  { "name": "Chuck", "address": "Main Road 989"},
  { "name": "Viola", "address": "Sideway 1633"}
]

customers.insert_many(customer_list)

También podemos insertar múltiples documentos indicando el campo _id

In [None]:
customer_list = [
  { "_id": 2, "name": "Peter", "address": "Lowstreet 27"},
  { "_id": 3, "name": "Amy", "address": "Apple st 652"},
  { "_id": 4, "name": "Hannah", "address": "Mountain 21"},
  { "_id": 5, "name": "Michael", "address": "Valley 345"},
  { "_id": 6, "name": "Sandy", "address": "Ocean blvd 2"},
  { "_id": 7, "name": "Betty", "address": "Green Grass 1"},
  { "_id": 8, "name": "Richard", "address": "Sky st 331"},
  { "_id": 9, "name": "Susan", "address": "One way 98"},
  { "_id": 10, "name": "Vicky", "address": "Yellow Garden 2"},
  { "_id": 11, "name": "Ben", "address": "Park Lane 38"},
  { "_id": 12, "name": "William", "address": "Central st 954"},
  { "_id": 13, "name": "Chuck", "address": "Main Road 989"},
  { "_id": 14, "name": "Viola", "address": "Sideway 1633"},
  { "_id": 15, "name": "John", "address": "Highway 37"}
]

customers.insert_many(customer_list)

## 4. Listar documentos en una colección

Para listar todos los documentos de una colección tenemos dos opciones:

In [None]:
customers_found = db.customers.find()

for customer in customers_found:
    print(customer)

In [None]:
customers_found = db.customers.find({})

for customer in customers_found:
    print(customer)

Podemos seleccionar la proyección de los datos que nos interesen.

La función find recibe dos parámetros, el primero es la query que se quiere ejecutar, el segundo indica la proyección de los datos (los campos que queremos traer en la búsqueda, como la cláusula SLECT en SQL). 

Si sólo quermos traernos el campo name:

In [None]:
customer_list = customers.find({},{ "name": 1})
for customer in customer_list:
    print(customer)

Como ves, aunque hemos idicado que sólo queremos traernos el campo name, también trae el campo _id. Eso es porque MongoDB siempre devuelve ese campo a no ser que le indiquemos expresamente que no lo traiga en la proyección.

In [None]:
customer_list = customers.find({},{"_id":0, "name": 1})
for customer in customer_list:
    print(customer)

Otra forma de indicar la proyección es haciéndolo justo al revés, indicando que campos no nos queremos traer:

In [None]:
customer_list = customers.find({},{"_id":0, "name": 0})
for customer in customer_list:
    print(customer)

## 5. Buscar un documento

El método **find_one()** devuelve el primer documento que cumple la condicón de búsqueda.


In [None]:
customer = db.customers.find_one()
print(customer)

Igual que con el métdo find, podemos seleccionar la proyección 

In [None]:
customer = db.customers.find_one({},{"_id":0, "name": 1})
print(customer)

## 6. Consultas

Cuando buscamos documentos en una colección podemos filtrar la búsqueda. Para ello utilizaremos el primer campo de los métodos find() y find_one(). Si te has fijado hata ahora le pasábmos el valor '{}' lo que indica que no hay query.

Si queremos por ejemplo buscar por el campo '_id'

In [None]:
customer = db.customers.find_one({"_id": 1})
print(customer)

Podemos además indicar la proyección en el segundo parámetro del método find_one

In [None]:
customer = db.customers.find_one({"_id": 1}, {"name": 1})
print(customer)

También podemos buscar por el _id generado por MongoDB que es de tipo ObjectId.

Si quieres saber más sobre el ObjectId puedes entrar en su página de documentación de MongoDB: https://docs.mongodb.com/manual/reference/method/ObjectId/

Para poder pasarle a la query el valor del ObjectId necesitamos importar la clase ObjectId del paquet bson y a continuación utilizarlo en la query.

Para que esta query te funcione tienes que utilizar un _id que te haya devuelto una sentencia find anterior.

In [None]:
from bson.objectid import ObjectId

customer = db.customers.find_one({"_id": ObjectId('5e59658a6989d70ab44e5995')})
print(customer)

Funcionaría exactamente igual con el método find()

In [None]:
customer_list = db.customers.find({"name": "Amy"}, {"_id": 0})

for customer in customer_list:
    print(customer)

Podemos utilizar modificadores en la consulta, como por ejemplo obtener los documentos cuyas direcciones empiecen por 'S' y letras mayores alfabéticamente. 

In [None]:
customer_list = db.customers.find({"address": {"$gt": "S"}})

for customer in customer_list:
    print(customer)

También podemos utilizar expresiones regulares para hacer la búsqueda. Por ejemplo obtener los documentos que incuyan la palabre st en la dirección.

In [None]:
customer_list = db.customers.find({"address": {"$regex": ".*st.*"}})

for customer in customer_list:
    print(customer)

Si quisiéramos podríamos buscar por varios campos a la vez.

In [None]:
customer_list = db.customers.find({"name": "Amy", "address": {"$regex": ".*st.*"}})

for customer in customer_list:
    print(customer)

### Ejercicio 1:

Antes de hacer el ejercicio, entra ne la página de la documentación de MongoDB sobre los operadores de las sentencias de consutla: https://docs.mongodb.com/manual/reference/operator/query/

Para el ejercicio crea otra colección que vamos a llamar pets e inserta un pequeño dataset:

`
{name: "Mikey", species: "Gerbil", age: 2}
{name: "Davey Bungooligan", species: "Piranha", age: 10}
{name: "Suzy B", species: "Cat", age: 12}
{name: "Mikey", species: "Hotdog", age: 10}
{name: "Terrence", species: "Sausagedog": age: 5}
{name: "Philomena Jones", species: "Cat": age:13}
`

Y realiza las siguientes consultas:

* Añade una nueva 'piranha' que se llame 'Henry'
* Utiliza el método find para listar todas las mascotas.
* Utiliza el método find para buscar la mascota "Mikey" por ID.
* Utiliza el método find para buscar todos los 'gerbils'.
* Encuentra todas las mascotas que se llamen 'Mikey'.
* Encuentra todas las mascotas que se llamen 'Mikey' y que sean 'gerbils'.
* Buscar todas las mascotas que contengan 'dog' en el nombre de su especie.
* Buscar las mascotas que tengan menos de 10 años.
* Buscar las mascotas que tengan 10 o más años.


## 7. Count, Limit, Skip & Sort

Operadores del cursor de mongo: https://docs.mongodb.com/manual/reference/method/js-cursor/

### 7.1 Count

Para contar los elementos devueltos por una consulta utilizamos el método count()

In [None]:
total_customers = db.customers.count({"_id": 1})
print(total_customers)

### 7.2 Limit & Skip

* Con limit limitamos el número de elementos que quermos devolver
* Con Skip indicamos cuantos elementos queremos obviar de la consulta empezando por el principio de la colección resultante.

Si lo sutilizamos conjuntamente podemos paginar los resultados.


In [None]:
# Primera ventana de 5 elementos
customer_list = db.customers.find({}).limit(5)

for customer in customer_list:
    print(customer)

In [None]:
# Segunda ventana de 5 elementos: obviamos los 5 primeros y limitamos a 5 para obtener los 5 siguientes
customer_list = db.customers.find({}).skip(5).limit(5)

for customer in customer_list:
    print(customer)

### 7.3 Sort

Sort permite ordenar la búsqueda por algún campo:

* sort("name", 1) #Ordena por nombre ascendentemente
* sort("name", -1) #Ordena por nombre descendentemente

In [None]:
customer_list = db.customers.find({}).sort("name", 1)

for customer in customer_list:
    print(customer)

In [None]:
customer_list = db.customers.find({}).sort("name", -1)

for customer in customer_list:
    print(customer)

### Ejercicio 2:

Antes de hacer el ejercicio visita la página de la documentación de MongoDB para los modificadores Count, Limit, Skip y Sort

* Count https://docs.mongodb.com/manual/reference/method/cursor.count/#cursor.count
* Limit https://docs.mongodb.com/manual/reference/method/cursor.limit/#cursor.limit
* Skip https://docs.mongodb.com/manual/reference/method/cursor.skip/#cursor.skip
* Sort https://docs.mongodb.com/manual/reference/method/cursor.sort/#cursor.sort


Vamos a añadir algunos documentos más a la coleción de pets del ejercicio anterior:

`
{name: "Poppy Bella", species: "Gerbil", age: 5}
{name: "Molly Alfie", species: "Piranha", age: 9}
{name: "Charlie Daisy", species: "Cat", age: 13}
{name: "Rosie Teddy", species: "Hotdog", age: 9}
{name: "Lola Millie", species: "Sausagedog": age: 7}
{name: "Bella Tilly", species: "Cat": age:13}
{name: "Lola Coco", species: "Gerbil", age: 4}
{name: "Daisy Poppy", species: "Piranha", age: 10}
{name: "Phoebe", species: "Cat", age: 11}
{name: "Rosie", species: "Hotdog", age: 10}
{name: "Molly", species: "Sausagedog": age: 6}
{name: "Luna", species: "Cat": age:12}
{name: "Tilly", species: "Gerbil", age: 3}
{name: "Bella", species: "Piranha", age: 11}
{name: "Teddy", species: "Cat", age: 13}
{name: "Mikey", species: "Hotdog", age: 13}
{name: "Coco", species: "Sausagedog": age: 7}
{name: "Teddy", species: "Cat": age:10}
`

Realiza las siguientes consultas:

* La mascota con la menor edad.
* La mascota con la mayor edad.
* Las mascotas ordenadas por edad paginadas de 4 en 4.

## 8. Modificar los documentos de una colección

Podemos modificar un documento con el método update_one(). El método update_one recibe dos parámetos, 
* la query que busca los documentos a modificar.
* la sentencia de modificación a aplicar sobre los documentos encontrados.

Al igual que pasara con find_one(), modificará el primer documento que cumpla la condición de búsqueda.

In [None]:
myquery = { "_id": 1 }
newvalues = { "$set": { "address": "Canyon 123" } }

db.customers.update_one(myquery, newvalues)

In [None]:
customer_list = db.customers.find({"_id": 1})

for customer in customer_list:
    print(customer)

Si queremos modificar varios documentos a la vez, utilizamos el métdodo update_many() que funciona igual que el método update_one() sólo que modificará todos los documentos que cumplan la query.

In [None]:
myquery = { "address": { "$regex": "^S" } }
newvalues = { "$set": { "name": "Minnie" } }

db.customers.update_many(myquery, newvalues)

In [None]:
customer_list = db.customers.find()

for customer in customer_list:
    print(customer)

Para saber más sobre el comando update y update_one visita sus páginas de la documentación de MongoDB:
* update_one() https://docs.mongodb.com/manual/reference/method/db.collection.updateOne/
* update() https://docs.mongodb.com/manual/reference/method/db.collection.update/

### Ejercicio 3:

Sobre la colección pets realiza las siguientes consultas:

* Modifica la edad de todos los gatos a 22.
* Modifica el monbre de la mascota 'Philomena Jones'.

## 9.  Borrar documentos de una colección

Para borrar un documento utilizaremos el método delete_one() que recibe un parámetrod que es la query que busca los elementos a borrar. delete_one() borrarrá el primer documento que cumpla la query.

In [None]:
myquery = { "_id": 1 }

db.customers.delete_one(myquery) 

In [None]:
customer = db.customers.find_one({"_id": 1})

print(customer)

Si queremos borrar más de un documento a la vez utilizamos el método delete_many() al que se le pasa la query que busca los documentos a borrar.

In [None]:
myquery = { "address": {"$regex": ".*st.*"} }

db.customers.delete_many(myquery)

In [None]:
customer_list = db.customers.find()

for customer in customer_list:
    print(customer)

### Ejercicio 4:

Sobre la colección pets, realiza las siguientes consultas:

* Borra la mascota con nombre Suzy B.
* Borra todas las mascotas que sean gatos.

## 10. Borrar una colección

Para borrar una colección completa utilizaremos el método drop()

In [None]:
db.customers.drop()

In [None]:
collections = db.list_collection_names()

for collection in collections:
    print(collection)

### Ejercicio 5:

Borra la colección pets utilizada en los ejercicios anteriores.