**Bases de datos NoSQL**

- La información que contienen está organizada mediante documentos y es muy útil cuando no tenemos un esquema exacto de lo que se va a almacenar.

- Una de las bases de datos NoSQL más populares es MongoDB.

**MongoDB**

- MongoDB almacena datos en documentos similares a JSON, lo que hace que la base de datos sea muy flexible y escalable.

**PyMongo**

- Python necesita un controlador MongoDB para acceder a la base de datos MongoDB.

- Un controlador popular de MongoDB para Python es "PyMongo".

**Otros recursoss**
- [Qué es NoSQL - Amazon](https://aws.amazon.com/es/nosql/)
- [Qué es NoSQL - Microsoft](https://azure.microsoft.com/es-mx/overview/nosql-database/)
- [Página MongoDB](https://www.mongodb.com/es)
- [Ejemplos de Datasets NoSQL](https://www.kaggle.com/search?q=json+in%3Adatasets)



**Iniciemos: Crear una base de datos**

Pasos para crear una base de datos en MongoDB:
1.  Crea un objeto MongoClient.
2. Especifica una URL de conexión con la dirección IP correcta y el nombre de la base de datos que deseas crear.
3. MongoDB creará la base de datos si no existe y se conectará a ella.

In [1]:
# Es posible que tengamos que instalar el controlador MongoDB
!apt install mongodb
!service mongodb start

Reading package lists... Done
Building dependency tree       
Reading state information... Done
The following packages were automatically installed and are no longer required:
  cuda-command-line-tools-10-0 cuda-command-line-tools-10-1
  cuda-command-line-tools-11-0 cuda-compiler-10-0 cuda-compiler-10-1
  cuda-compiler-11-0 cuda-cuobjdump-10-0 cuda-cuobjdump-10-1
  cuda-cuobjdump-11-0 cuda-cupti-10-0 cuda-cupti-10-1 cuda-cupti-11-0
  cuda-cupti-dev-11-0 cuda-documentation-10-0 cuda-documentation-10-1
  cuda-documentation-11-0 cuda-documentation-11-1 cuda-gdb-10-0 cuda-gdb-10-1
  cuda-gdb-11-0 cuda-gpu-library-advisor-10-0 cuda-gpu-library-advisor-10-1
  cuda-libraries-10-0 cuda-libraries-10-1 cuda-libraries-11-0
  cuda-memcheck-10-0 cuda-memcheck-10-1 cuda-memcheck-11-0 cuda-nsight-10-0
  cuda-nsight-10-1 cuda-nsight-11-0 cuda-nsight-11-1 cuda-nsight-compute-10-0
  cuda-nsight-compute-10-1 cuda-nsight-compute-11-0 cuda-nsight-compute-11-1
  cuda-nsight-systems-10-1 cuda-nsight-systems-

In [2]:
from pymongo import MongoClient
# Pasos para crear una BD MongoDB
# 1. Crear un Objeto MongoClient
client = MongoClient()
client.list_database_names() # Por defecto salen las bases de datos de ['admin', 'local']

['admin', 'local']

In [3]:
# Crear una base de datos "mydatabase"
mydb = client["mydatabase"]

In [4]:
print(client.list_database_names())

['admin', 'local']


In [5]:
# Verificar si existe una base de datos llamada "mydatabase"
dblist = client.list_database_names()
if "mydatabase" in dblist:
  print("The database exists.")
else:
  print("The database does not exist")
# Imprime que no aparece una base de datos debido a que no tiene contenido 

The database does not exist


  - Tabla --> Coleccion
  - Registro (fila) --> Documento 
  - Columna --> Campo

**Importante:** ¡En MongoDB, no se crea una base de datos hasta que obtiene contenido!

**SQL vs MongoDB**

<style type="text/css">
.tg  {border-collapse:collapse;border-spacing:0;}
.tg td{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  overflow:hidden;padding:10px 5px;word-break:normal;}
.tg th{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  font-weight:normal;overflow:hidden;padding:10px 5px;word-break:normal;}
.tg .tg-c3ow{border-color:inherit;text-align:center;vertical-align:top}
.tg .tg-0pky{border-color:inherit;text-align:left;vertical-align:top}
</style>
<table class="tg">
<thead>
  <tr>
    <th class="tg-c3ow"><span style="font-weight:bold">MongoDB</span></th>
    <th class="tg-c3ow"><span style="font-weight:bold">SQL</span></th>
  </tr>
</thead>
<tbody>
  <tr>
    <td class="tg-0pky">Colección</td>
    <td class="tg-0pky">Tabla</td>
  </tr>
</tbody>
</table>

**Crear una colección**
- Usa el objeto de base de datos y especifica el nombre de la colección que deseas crear.
- MongoDB creará la colección si no existe.


In [6]:
mydb = client["mydatabase"]   # Creando Base de Datos llamada "Database"
mycol = mydb["customers"]     # Creando una coleccion llamada "customers"

**Ejemplo**

- Devuelve una lista de todas las colecciones de tu base de datos

In [7]:
mydb = client["mydatabase"]
print(mydb.list_collection_names())
# Imprime que no existe porque:
# Asi como una base de datos necesita colecciones para que se cree
# Una coleccion necesita datos para que se cree

[]


**Ejemplo**
- Comprueba si existe la colección "customers":

In [8]:
collist = mydb.list_collection_names()
if "customers" in collist:
  print("The collection exists.")
else:
  print("The collection does not exist")

The collection does not exist


**Recuerda**: en MongoDB, una colección no se crea hasta que obtiene contenido.

**SQL vs MongoDB**

<style type="text/css">
.tg  {border-collapse:collapse;border-spacing:0;}
.tg td{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  overflow:hidden;padding:10px 5px;word-break:normal;}
.tg th{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  font-weight:normal;overflow:hidden;padding:10px 5px;word-break:normal;}
.tg .tg-c3ow{border-color:inherit;text-align:center;vertical-align:top}
.tg .tg-0pky{border-color:inherit;text-align:left;vertical-align:top}
.tg .tg-0lax{text-align:left;vertical-align:top}
</style>
<table class="tg">
<thead>
  <tr>
    <th class="tg-c3ow"><span style="font-weight:bold">MongoDB</span></th>
    <th class="tg-c3ow"><span style="font-weight:bold">SQL</span></th>
  </tr>
</thead>
<tbody>
  <tr>
    <td class="tg-0pky">Colección</td>
    <td class="tg-0pky">Tabla</td>
  </tr>
  <tr>
    <td class="tg-0lax">Documento</td>
    <td class="tg-0lax">Registro</td>
  </tr>
</tbody>
</table>

**Insertar en la colección**
- Para insertar un registro, o documento como se llama en MongoDB, en una colección, usamos el método *insert_one()*.

- El primer parámetro del método *insert_one()* es un diccionario que contiene los nombres y valores de cada campo en el documento que deseas insertar.

In [9]:
mydb = client["mydatabase"]
mycol = mydb["customers"]

mydict = { "name": "John", "address": "Highway 37" }

x = mycol.insert_one(mydict)

- El método *insert_one()* devuelve un objeto *InsertOneResult*, que tiene un atributo, *inserted_id*, que contiene la identificación del documento insertado.



In [10]:
mydict = { "name": "Peter", "address": "oLowstreet 27" }

x = mycol.insert_one(mydict)

print(x.inserted_id)

62112ca0ac76a344096b14e9


In [11]:
print(client.list_database_names())
print(mydb.list_collection_names())

['admin', 'local', 'mydatabase']
['customers']


**Recuerda**
- Si no especificas un _id, MongoDB agregará uno; le asignará una identificación única para cada documento.

- En el ejemplo anterior no se especificó ningún campo _id, por lo que MongoDB asignó un _id único para el registro (documento).

**Insertar varios documentos**
- Para insertar varios documentos en una colección en MongoDB, usamos el método *insert_many()*.

- El primer parámetro del método *insert_many()* es una lista que contiene diccionarios con los datos que desea insertar.

In [12]:
mydb = client["mydatabase"]
mycol = mydb["customers"]

mylist = [
  { "name": "Amy", "address": "Apple st 652"},
  { "name": "Hannah", "address": "Mountain 21"},
  { "name": "Michael", "address": "Valley 345"},
  { "name": "Sandy", "address": "Ocean blvd 2"},
  { "name": "Betty", "address": "Green Grass 1"},
  { "name": "Richard", "address": "Sky st 331"},
  { "name": "Susan", "address": "One way 98"},
  { "name": "Vicky", "address": "Yellow Garden 2"},
  { "name": "Ben", "address": "Park Lane 38"},
  { "name": "William", "address": "Central st 954"},
  { "name": "Chuck", "address": "Main Road 989"},
  { "name": "Viola", "address": "Sideway 1633"}
]

x = mycol.insert_many(mylist)

#print list of the _id values of the inserted documents:
print(x.inserted_ids)


[ObjectId('62112ca4ac76a344096b14ea'), ObjectId('62112ca4ac76a344096b14eb'), ObjectId('62112ca4ac76a344096b14ec'), ObjectId('62112ca4ac76a344096b14ed'), ObjectId('62112ca4ac76a344096b14ee'), ObjectId('62112ca4ac76a344096b14ef'), ObjectId('62112ca4ac76a344096b14f0'), ObjectId('62112ca4ac76a344096b14f1'), ObjectId('62112ca4ac76a344096b14f2'), ObjectId('62112ca4ac76a344096b14f3'), ObjectId('62112ca4ac76a344096b14f4'), ObjectId('62112ca4ac76a344096b14f5')]


- Similar a *insert_one()*, el método *insert_many()* devuelve un objeto InsertManyResult, que tiene una propiedad, insert_ids, que contiene los identificadores de los documentos insertados.

**Insertar varios documentos, con identificaciones especificadas**
- Si no quieres que MongoDB asigne _id únicos para tus documentos, entonces puedes especificar manualmente el campo _id cuando inserte los documentos.

- **Recuerda** que los valores tienen que ser únicos. Dos documentos no pueden tener el mismo _id.

In [13]:
mydb = client["mydatabase"]
mycol = mydb["customers"]

mylist = [
  { "_id": 1, "name": "John", "address": "Highway 37"},
  { "_id": 2, "name": "Peter", "address": "Lowstreet 27"},
  { "_id": 3, "name": "Amy", "address": "Apple st 652"},
  { "_id": 4, "name": "Hannah", "address": "Mountain 21"},
  { "_id": 5, "name": "Michael", "address": "Valley 345"},
  { "_id": 6, "name": "Sandy", "address": "Ocean blvd 2"},
  { "_id": 7, "name": "Betty", "address": "Green Grass 1"},
  { "_id": 8, "name": "Richard", "address": "Sky st 331"},
  { "_id": 9, "name": "Susan", "address": "One way 98"},
  { "_id": 10, "name": "Vicky", "address": "Yellow Garden 2"},
  { "_id": 11, "name": "Ben", "address": "Park Lane 38"},
  { "_id": 12, "name": "William", "address": "Central st 954"},
  { "_id": 13, "name": "Chuck", "address": "Main Road 989"},
  { "_id": 14, "name": "Viola", "address": "Sideway 1633"}
]

x = mycol.insert_many(mylist)

#print list of the _id values of the inserted documents:
print(x.inserted_ids)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]


**Instrucciones *find()* y *findOne()*** 
- Se usa para buscar datos en una colección.

- Al igual que la instrucción SELECT se usa para buscar datos en una tabla en una base de datos SQL.

<style type="text/css">
.tg  {border-collapse:collapse;border-spacing:0;}
.tg td{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  overflow:hidden;padding:10px 5px;word-break:normal;}
.tg th{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  font-weight:normal;overflow:hidden;padding:10px 5px;word-break:normal;}
.tg .tg-c3ow{border-color:inherit;text-align:center;vertical-align:top}
.tg .tg-0pky{border-color:inherit;text-align:left;vertical-align:top}
.tg .tg-0lax{text-align:left;vertical-align:top}
</style>
<table class="tg">
<thead>
  <tr>
    <th class="tg-c3ow"><span style="font-weight:bold">MongoDB</span></th>
    <th class="tg-c3ow"><span style="font-weight:bold">SQL</span></th>
  </tr>
</thead>
<tbody>
  <tr>
    <td class="tg-0pky">Colección</td>
    <td class="tg-0pky">Tabla</td>
  </tr>
  <tr>
    <td class="tg-0lax">Documento</td>
    <td class="tg-0lax">Registro</td>
  </tr>
  <tr>
    <td class="tg-0lax">find() / findOne()</td>
    <td class="tg-0lax">SELECT</td>
  </tr>
</tbody>
</table>

**_findOne()_**
- Para seleccionar datos de una colección en MongoDB.

- Devuelve la primera aparición en la selección.

In [14]:
x = mycol.find_one()
print(x)

{'_id': ObjectId('62112c9eac76a344096b14e8'), 'name': 'John', 'address': 'Highway 37'}


**_find()_**
- Devuelve todas las apariciones en la selección.

- El primer parámetro del método *find()* es un objeto de consulta. En este ejemplo usamos un objeto de consulta vacío, que selecciona todos los documentos de la colección.

- *find()* da el mismo resultado que SELECT * en SQL.

In [15]:
type(mycol.find())

pymongo.cursor.Cursor

In [16]:
for x in mycol.find():
  print(x)

{'_id': ObjectId('62112c9eac76a344096b14e8'), 'name': 'John', 'address': 'Highway 37'}
{'_id': ObjectId('62112ca0ac76a344096b14e9'), 'name': 'Peter', 'address': 'oLowstreet 27'}
{'_id': ObjectId('62112ca4ac76a344096b14ea'), 'name': 'Amy', 'address': 'Apple st 652'}
{'_id': ObjectId('62112ca4ac76a344096b14eb'), 'name': 'Hannah', 'address': 'Mountain 21'}
{'_id': ObjectId('62112ca4ac76a344096b14ec'), 'name': 'Michael', 'address': 'Valley 345'}
{'_id': ObjectId('62112ca4ac76a344096b14ed'), 'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'_id': ObjectId('62112ca4ac76a344096b14ee'), 'name': 'Betty', 'address': 'Green Grass 1'}
{'_id': ObjectId('62112ca4ac76a344096b14ef'), 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': ObjectId('62112ca4ac76a344096b14f0'), 'name': 'Susan', 'address': 'One way 98'}
{'_id': ObjectId('62112ca4ac76a344096b14f1'), 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': ObjectId('62112ca4ac76a344096b14f2'), 'name': 'Ben', 'address': 'Park Lane 38'}
{'_id': Object

**Devolver solo algunos campos**
- El segundo parámetro del método *find()* es un objeto que describe qué campos incluir en el resultado.

- Este parámetro es opcional y, si se omite, todos los campos se incluirán en el resultado.

In [17]:
# En el segundo campo de find, podemos controlar que es lo que queremos ver impreso con un "0" o "1" y a su vez con "True" y "False"
# Se requiere ver en la documentacion la posicion de la funcion dentro de find que queremos modificar, es necesario utilizar corchetes en las posiciones que estan antes:
# ....mycol.find({}, {}, {"_id": 0})
# ....mycol.find({}, {}, {}, {}, {}, {True})

for x in mycol.find({},{ "_id": 0, "name": 1, "address": 1 }): #No incluyas _id. Sí incluye name y address
  print(x)

{'name': 'John', 'address': 'Highway 37'}
{'name': 'Peter', 'address': 'oLowstreet 27'}
{'name': 'Amy', 'address': 'Apple st 652'}
{'name': 'Hannah', 'address': 'Mountain 21'}
{'name': 'Michael', 'address': 'Valley 345'}
{'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'name': 'Betty', 'address': 'Green Grass 1'}
{'name': 'Richard', 'address': 'Sky st 331'}
{'name': 'Susan', 'address': 'One way 98'}
{'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'name': 'Ben', 'address': 'Park Lane 38'}
{'name': 'William', 'address': 'Central st 954'}
{'name': 'Chuck', 'address': 'Main Road 989'}
{'name': 'Viola', 'address': 'Sideway 1633'}
{'name': 'John', 'address': 'Highway 37'}
{'name': 'Peter', 'address': 'Lowstreet 27'}
{'name': 'Amy', 'address': 'Apple st 652'}
{'name': 'Hannah', 'address': 'Mountain 21'}
{'name': 'Michael', 'address': 'Valley 345'}
{'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'name': 'Betty', 'address': 'Green Grass 1'}
{'name': 'Richard', 'address': 'Sky st 331'}
{'name': 'Sus

In [18]:
# Para evitar lo de la celda anterior (corchetes en lugares vacios) se puede definir el nombre de la funcion de interes dentro de find
for x in mycol.find(projection={ "_id": 0, "name": 1, "address": 1 }): #Significado --> No imprimas el "id". Sí imprime "name" y "address"
  print(x)

{'name': 'John', 'address': 'Highway 37'}
{'name': 'Peter', 'address': 'oLowstreet 27'}
{'name': 'Amy', 'address': 'Apple st 652'}
{'name': 'Hannah', 'address': 'Mountain 21'}
{'name': 'Michael', 'address': 'Valley 345'}
{'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'name': 'Betty', 'address': 'Green Grass 1'}
{'name': 'Richard', 'address': 'Sky st 331'}
{'name': 'Susan', 'address': 'One way 98'}
{'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'name': 'Ben', 'address': 'Park Lane 38'}
{'name': 'William', 'address': 'Central st 954'}
{'name': 'Chuck', 'address': 'Main Road 989'}
{'name': 'Viola', 'address': 'Sideway 1633'}
{'name': 'John', 'address': 'Highway 37'}
{'name': 'Peter', 'address': 'Lowstreet 27'}
{'name': 'Amy', 'address': 'Apple st 652'}
{'name': 'Hannah', 'address': 'Mountain 21'}
{'name': 'Michael', 'address': 'Valley 345'}
{'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'name': 'Betty', 'address': 'Green Grass 1'}
{'name': 'Richard', 'address': 'Sky st 331'}
{'name': 'Sus

In [19]:
for x in mycol.find({},{ "_id": False, "name": True, "address": True }): #No incluyas _id. Sí incluye name y address
  print(x)

{'name': 'John', 'address': 'Highway 37'}
{'name': 'Peter', 'address': 'oLowstreet 27'}
{'name': 'Amy', 'address': 'Apple st 652'}
{'name': 'Hannah', 'address': 'Mountain 21'}
{'name': 'Michael', 'address': 'Valley 345'}
{'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'name': 'Betty', 'address': 'Green Grass 1'}
{'name': 'Richard', 'address': 'Sky st 331'}
{'name': 'Susan', 'address': 'One way 98'}
{'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'name': 'Ben', 'address': 'Park Lane 38'}
{'name': 'William', 'address': 'Central st 954'}
{'name': 'Chuck', 'address': 'Main Road 989'}
{'name': 'Viola', 'address': 'Sideway 1633'}
{'name': 'John', 'address': 'Highway 37'}
{'name': 'Peter', 'address': 'Lowstreet 27'}
{'name': 'Amy', 'address': 'Apple st 652'}
{'name': 'Hannah', 'address': 'Mountain 21'}
{'name': 'Michael', 'address': 'Valley 345'}
{'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'name': 'Betty', 'address': 'Green Grass 1'}
{'name': 'Richard', 'address': 'Sky st 331'}
{'name': 'Sus

**NOTA:** No se permite especificar valores 0 y 1 en el mismo objeto (excepto si uno de los campos es el campo _id). Si especificas un campo con el valor 0, todos los demás campos obtienen el valor 1 y viceversa.

In [20]:
for x in mycol.find({},{ "address": True }):
  print(x)

{'_id': ObjectId('62112c9eac76a344096b14e8'), 'address': 'Highway 37'}
{'_id': ObjectId('62112ca0ac76a344096b14e9'), 'address': 'oLowstreet 27'}
{'_id': ObjectId('62112ca4ac76a344096b14ea'), 'address': 'Apple st 652'}
{'_id': ObjectId('62112ca4ac76a344096b14eb'), 'address': 'Mountain 21'}
{'_id': ObjectId('62112ca4ac76a344096b14ec'), 'address': 'Valley 345'}
{'_id': ObjectId('62112ca4ac76a344096b14ed'), 'address': 'Ocean blvd 2'}
{'_id': ObjectId('62112ca4ac76a344096b14ee'), 'address': 'Green Grass 1'}
{'_id': ObjectId('62112ca4ac76a344096b14ef'), 'address': 'Sky st 331'}
{'_id': ObjectId('62112ca4ac76a344096b14f0'), 'address': 'One way 98'}
{'_id': ObjectId('62112ca4ac76a344096b14f1'), 'address': 'Yellow Garden 2'}
{'_id': ObjectId('62112ca4ac76a344096b14f2'), 'address': 'Park Lane 38'}
{'_id': ObjectId('62112ca4ac76a344096b14f3'), 'address': 'Central st 954'}
{'_id': ObjectId('62112ca4ac76a344096b14f4'), 'address': 'Main Road 989'}
{'_id': ObjectId('62112ca4ac76a344096b14f5'), 'addre

**Ejemplo**
- Se obtiene un error si especificas los valores 0 y 1 en el mismo objeto (excepto si uno de los campos es el campo _id).

In [22]:
for x in mycol.find({},{ "name": True, "address": True }):  #True != 0  False == 0
  print(x)

{'_id': ObjectId('62112c9eac76a344096b14e8'), 'name': 'John', 'address': 'Highway 37'}
{'_id': ObjectId('62112ca0ac76a344096b14e9'), 'name': 'Peter', 'address': 'oLowstreet 27'}
{'_id': ObjectId('62112ca4ac76a344096b14ea'), 'name': 'Amy', 'address': 'Apple st 652'}
{'_id': ObjectId('62112ca4ac76a344096b14eb'), 'name': 'Hannah', 'address': 'Mountain 21'}
{'_id': ObjectId('62112ca4ac76a344096b14ec'), 'name': 'Michael', 'address': 'Valley 345'}
{'_id': ObjectId('62112ca4ac76a344096b14ed'), 'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'_id': ObjectId('62112ca4ac76a344096b14ee'), 'name': 'Betty', 'address': 'Green Grass 1'}
{'_id': ObjectId('62112ca4ac76a344096b14ef'), 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': ObjectId('62112ca4ac76a344096b14f0'), 'name': 'Susan', 'address': 'One way 98'}
{'_id': ObjectId('62112ca4ac76a344096b14f1'), 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': ObjectId('62112ca4ac76a344096b14f2'), 'name': 'Ben', 'address': 'Park Lane 38'}
{'_id': Object

**Filtrar el resultado**
- Al buscar documentos en una colección, puedes filtrar el resultado mediante un objeto de consulta.

- El primer argumento del método *find()* es un objeto de consulta y también se utiliza para limitar la búsqueda.

**Ejemplo**
- Buscar los documentos con la dirección "Park Lane 38".

In [23]:
myquery = { "address": "Park Lane 38" }

mydoc = mycol.find(myquery)

for x in mydoc:
  print(x)

{'_id': ObjectId('62112ca4ac76a344096b14f2'), 'name': 'Ben', 'address': 'Park Lane 38'}
{'_id': 11, 'name': 'Ben', 'address': 'Park Lane 38'}


In [24]:
myquery = { "address": "Park Lane 38" }

mydoc = mycol.find(myquery,{"_id":0, "name": True})

for x in mydoc:
  print(x)

{'name': 'Ben'}
{'name': 'Ben'}


**Consulta avanzada**
- Para realizar consultas avanzadas, puedes utilizar modificadores como valores en el objeto de consulta.

**Ejemplo**
- Para encontrar los documentos donde el campo "dirección" comienza con la letra "S" o superior (alfabéticamente), se usa el modificador mayor que: {"$ gt": "S"}:

**Recurso:**
- [Operadores](https://docs.mongodb.com/manual/reference/operator/)

In [25]:
myquery = { "address": { "$gt": "S" } }

mydoc = mycol.find(myquery)

for x in mydoc:
  print(x)

{'_id': ObjectId('62112ca0ac76a344096b14e9'), 'name': 'Peter', 'address': 'oLowstreet 27'}
{'_id': ObjectId('62112ca4ac76a344096b14ec'), 'name': 'Michael', 'address': 'Valley 345'}
{'_id': ObjectId('62112ca4ac76a344096b14ef'), 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': ObjectId('62112ca4ac76a344096b14f1'), 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': ObjectId('62112ca4ac76a344096b14f5'), 'name': 'Viola', 'address': 'Sideway 1633'}
{'_id': 5, 'name': 'Michael', 'address': 'Valley 345'}
{'_id': 8, 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': 10, 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': 14, 'name': 'Viola', 'address': 'Sideway 1633'}


Filtrar con expresiones regulares
También puede utilizar expresiones regulares como modificador.

Las expresiones regulares solo se pueden usar para consultar cadenas.

Para buscar solo los documentos donde el campo "dirección" comienza con la letra "S", use la expresión regular {"$ regex": "^ S"}:

In [26]:
myquery = { "address": { "$regex": "o" } } # Buscar los registros que contengan la letra "o"
#myquery = { "address": { "$regex": "^o" } } # Buscar los registros que contengan como primera letra, la letra "o"

mydoc = mycol.find(myquery)

for x in mydoc:
  print(x)

{'_id': ObjectId('62112ca0ac76a344096b14e9'), 'name': 'Peter', 'address': 'oLowstreet 27'}


**Ordenar el resultado**
- Utilice el método *sort()* para ordenar el resultado en orden ascendente o descendente.

- El método *sort()* toma un parámetro para "nombre de campo" y un parámetro para "dirección" (ascendente es la dirección predeterminada).

In [27]:
mydoc = mycol.find().sort("name",-1) #-1 DESCENDING

for x in mydoc:
  print(x)

{'_id': ObjectId('62112ca4ac76a344096b14f3'), 'name': 'William', 'address': 'Central st 954'}
{'_id': 12, 'name': 'William', 'address': 'Central st 954'}
{'_id': ObjectId('62112ca4ac76a344096b14f5'), 'name': 'Viola', 'address': 'Sideway 1633'}
{'_id': 14, 'name': 'Viola', 'address': 'Sideway 1633'}
{'_id': ObjectId('62112ca4ac76a344096b14f1'), 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': 10, 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': ObjectId('62112ca4ac76a344096b14f0'), 'name': 'Susan', 'address': 'One way 98'}
{'_id': 9, 'name': 'Susan', 'address': 'One way 98'}
{'_id': ObjectId('62112ca4ac76a344096b14ed'), 'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'_id': 6, 'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'_id': ObjectId('62112ca4ac76a344096b14ef'), 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': 8, 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': ObjectId('62112ca0ac76a344096b14e9'), 'name': 'Peter', 'address': 'oLowstreet 27'}
{'_id': 2, 'name': 'Peter'

In [29]:
# Prueba de la funcion de la celda pasada
import pymongo
print(pymongo.DESCENDING)
print(pymongo.ASCENDING)

-1
1


**Orden descendente**
- Utiliza el valor -1 como segundo parámetro para ordenar de forma descendente.

  - *sort("nombre", 1)* #ascendente 
  - *sort("nombre", -1)* #descendente

In [30]:
mydoc = mycol.find().sort("name", -1)

for x in mydoc:
  print(x)

{'_id': ObjectId('62112ca4ac76a344096b14f3'), 'name': 'William', 'address': 'Central st 954'}
{'_id': 12, 'name': 'William', 'address': 'Central st 954'}
{'_id': ObjectId('62112ca4ac76a344096b14f5'), 'name': 'Viola', 'address': 'Sideway 1633'}
{'_id': 14, 'name': 'Viola', 'address': 'Sideway 1633'}
{'_id': ObjectId('62112ca4ac76a344096b14f1'), 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': 10, 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': ObjectId('62112ca4ac76a344096b14f0'), 'name': 'Susan', 'address': 'One way 98'}
{'_id': 9, 'name': 'Susan', 'address': 'One way 98'}
{'_id': ObjectId('62112ca4ac76a344096b14ed'), 'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'_id': 6, 'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'_id': ObjectId('62112ca4ac76a344096b14ef'), 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': 8, 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': ObjectId('62112ca0ac76a344096b14e9'), 'name': 'Peter', 'address': 'oLowstreet 27'}
{'_id': 2, 'name': 'Peter'

**Eliminar un documento**
- Para eliminar un documento, usamos el método *delete_one()*.

- El primer parámetro del método *delete_one()* es un objeto de consulta que define qué documento eliminar.

- **Nota:** Si la consulta encuentra más de un documento, solo se elimina la primera aparición.

**Ejemplo**
- Borrar el documento con la dirección "Muntain 21":

In [31]:
myquery = { "address": "Mountain 21" }

mycol.delete_one(myquery)

<pymongo.results.DeleteResult at 0x7f2a2bbac960>

**Eliminar muchos documentos**
- Usa el método *delete_many()*.

- El primer parámetro del método *delete_many()* es un objeto de consulta que define qué documentos eliminar.

**Ejemplo**
- Eliminar todos los documentos donde la dirección comience con la letra S.

In [32]:
myquery = { "address": {"$regex": "^S"} }

x = mycol.delete_many(myquery)

print(x.deleted_count, " documents deleted.")

4  documents deleted.


In [33]:
type(x)

pymongo.results.DeleteResult

**Eliminar todos los documentos de una colección**
- Para eliminar todos los documentos de una colección, pasa un objeto de consulta vacío al método *delete_many()*.

**Ejemplo**
- Eliminar todos los documentos de la colección "customers".

In [None]:
# Eliminar todos los elementos de la coleccion
x = mycol.delete_many({})

print(x.deleted_count, " documents deleted.")

**Eliminar una colección**
- Puedea eliminar una tabla o colección como se llama en MongoDB, utilizando el método *drop()*.

**Ejemplo**
- Eliminar la colección "customers".

In [None]:
# Eliminar toda la coleccion, hasta el nombre de la misma
mycol = mydb["customers"]

mycol.drop()

**NOTA:** El método drop () devuelve verdadero si la colección se eliminó correctamente y falso si la colección no existe.


**Actualizar una colección**
- Puedes actualizar un registro o documento como se llama en MongoDB, utilizando el método *update_one()*.

- El primer parámetro del método *update_one()* es un objeto de consulta que define qué documento actualizar.

- **Nota:** Si la consulta encuentra más de un registro, solo se actualiza la primera aparición.

- El segundo parámetro es un objeto que define los nuevos valores del documento.

**Ejemplo**
- Cambiar la dirección de "Valley 345" por "Canyon 123".

In [34]:
#mydb = client["mydatabase"]
#mycol = mydb["customers"]

myquery = { "address": "Valley 345" }
newvalues = { "$set": { "address": "Canyon 123" } }

mycol.update_one(myquery, newvalues)

#print "customers" after the update:
for x in mycol.find():
  print(x)

{'_id': ObjectId('62112c9eac76a344096b14e8'), 'name': 'John', 'address': 'Highway 37'}
{'_id': ObjectId('62112ca0ac76a344096b14e9'), 'name': 'Peter', 'address': 'oLowstreet 27'}
{'_id': ObjectId('62112ca4ac76a344096b14ea'), 'name': 'Amy', 'address': 'Apple st 652'}
{'_id': ObjectId('62112ca4ac76a344096b14ec'), 'name': 'Michael', 'address': 'Canyon 123'}
{'_id': ObjectId('62112ca4ac76a344096b14ed'), 'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'_id': ObjectId('62112ca4ac76a344096b14ee'), 'name': 'Betty', 'address': 'Green Grass 1'}
{'_id': ObjectId('62112ca4ac76a344096b14f0'), 'name': 'Susan', 'address': 'One way 98'}
{'_id': ObjectId('62112ca4ac76a344096b14f1'), 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': ObjectId('62112ca4ac76a344096b14f2'), 'name': 'Ben', 'address': 'Park Lane 38'}
{'_id': ObjectId('62112ca4ac76a344096b14f3'), 'name': 'William', 'address': 'Central st 954'}
{'_id': ObjectId('62112ca4ac76a344096b14f4'), 'name': 'Chuck', 'address': 'Main Road 989'}
{'_id': 1

**Actualizar varios documentos**
- Para actualizar todos los documentos que cumplen con los criterios de la consulta, usa el método *update_many()*.

**Ejemplo**
- Actualizar todos los documentos donde la dirección comience con la letra "S".

In [None]:
myquery = { "address": { "$regex": "^S" } }
newvalues = { "$set": { "name": "Minnie" } }

x = mycol.update_many(myquery, newvalues)

print(x.modified_count, "documents updated.")

0 documents updated.


**Limitar el resultado**
- Para limitar el resultado en MongoDB, usamos el método *limit()*.

- El método *limit()* toma un parámetro, un número que define cuántos documentos devolver.

**Ejemplo**
- Limitar el resultado para devolver solo 5 documentos.

In [None]:
myresult = mycol.find().limit(5)

#print the result:
for x in myresult:
  print(x)

{'_id': ObjectId('61055603dbbcb3344dbd5cdc'), 'name': 'John', 'address': 'Highway 37'}
{'_id': 1, 'name': 'John', 'address': 'Highway 37'}
{'_id': 2, 'name': 'Peter', 'address': 'Lowstreet 27'}
{'_id': 3, 'name': 'Amy', 'address': 'Apple st 652'}
{'_id': 5, 'name': 'Michael', 'address': 'Canyon 123'}


<style type="text/css">
.tg  {border-collapse:collapse;border-spacing:0;}
.tg td{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  overflow:hidden;padding:10px 5px;word-break:normal;}
.tg th{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  font-weight:normal;overflow:hidden;padding:10px 5px;word-break:normal;}
.tg .tg-c3ow{border-color:inherit;text-align:center;vertical-align:top}
.tg .tg-0pky{border-color:inherit;text-align:left;vertical-align:top}
.tg .tg-0lax{text-align:left;vertical-align:top}
</style>
<table class="tg">
<thead>
  <tr>
    <th class="tg-c3ow"><span style="font-weight:bold">MongoDB</span></th>
    <th class="tg-c3ow"><span style="font-weight:bold">SQL</span></th>
  </tr>
</thead>
<tbody>
  <tr>
    <td class="tg-0pky">Colección</td>
    <td class="tg-0pky">Tabla</td>
  </tr>
  <tr>
    <td class="tg-0pky">Documento</td>
    <td class="tg-0pky">Registro/Fila</td>
  </tr>
  <tr>
    <td class="tg-0lax">Campo</td>
    <td class="tg-0lax">Columna</td>
  </tr>
  <tr>
    <td class="tg-0pky">find() / findOne()</td>
    <td class="tg-0pky">SELECT</td>
  </tr>
</tbody>
</table>

# **Ejercicio**
## Cargar archivo "JSON" a base de datos NoSQL

In [None]:
import json
from pymongo import MongoClient 
  
  
# Making Connection
myclient = MongoClient() 
   
# database 
db = myclient["BDEjemplo"]
   
# Created or Switched to collection 
Collection = db["iris_data"]
  
# Loading or Opening the json file
with open('iris.json') as file:
    file_data = json.load(file)
      
# Inserting the loaded data in the Collection
# if JSON contains data more than one entry
# insert_many is used else inser_one is used
if isinstance(file_data, list):
    Collection.insert_many(file_data)  
else:
    Collection.insert_one(file_data)

In [None]:
for x in Collection.find():
  print(x)

{'_id': ObjectId('62111be4f1e33a37979e0847'), 'sepalLength': 5.1, 'sepalWidth': 3.5, 'petalLength': 1.4, 'petalWidth': 0.2, 'species': 'setosa'}
{'_id': ObjectId('62111be4f1e33a37979e0848'), 'sepalLength': 4.9, 'sepalWidth': 3.0, 'petalLength': 1.4, 'petalWidth': 0.2, 'species': 'setosa'}
{'_id': ObjectId('62111be4f1e33a37979e0849'), 'sepalLength': 4.7, 'sepalWidth': 3.2, 'petalLength': 1.3, 'petalWidth': 0.2, 'species': 'setosa'}
{'_id': ObjectId('62111be4f1e33a37979e084a'), 'sepalLength': 4.6, 'sepalWidth': 3.1, 'petalLength': 1.5, 'petalWidth': 0.2, 'species': 'setosa'}
{'_id': ObjectId('62111be4f1e33a37979e084b'), 'sepalLength': 5.0, 'sepalWidth': 3.6, 'petalLength': 1.4, 'petalWidth': 0.2, 'species': 'setosa'}
{'_id': ObjectId('62111be4f1e33a37979e084c'), 'sepalLength': 5.4, 'sepalWidth': 3.9, 'petalLength': 1.7, 'petalWidth': 0.4, 'species': 'setosa'}
{'_id': ObjectId('62111be4f1e33a37979e084d'), 'sepalLength': 4.6, 'sepalWidth': 3.4, 'petalLength': 1.4, 'petalWidth': 0.3, 'speci