## Python MongoDB

Python puede usarse en aplicaciones de base de datos.
Una de las más populares bases NOSQL es MonoDB


### MongoDB

MongoDB almacena datos en documentos JSON, lo cual hace la base de datos muy flexible y escalable.

### PyMongo

Python necesita un manejador de Mongo para acceder a la base. En este caso usaremos `PyMongo` 

### Probar Mongo

Para probar si la instalación fue exitosa, o si ya se tiene "pymongo" instalado, crea una pagina de Python con el siguiente contenido.

Si el comando se ejecuta sin errores, entonces ya es posible manipular la información por medio de PyMongo

In [3]:
import pymongo


### Creando una Base de Datos

Para crear una base de datos en Mongo, empieza por crear un objeto cliente, después especificar una conexión URL con la ip correcta y el nombre de la base de datos que se quiere crear.

Mongo creará una base de datos si no existe y hará una conexión a ella.


**En MongoDB una base de datos no se crea hasta que tenga contenido.**

### Crear una Colección

Una **Colección** en MongoDB es igual a una tabla en SQL

Para crear una Colección en Mongo, usa un objeto "Base de datos" y especifica el nombre de la colección que desees crear.

Mongo creará una colección si es que no existe

Ejemplo. Crear una collección llamada **Cientes**

~~~py
import pymongo

micilente = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]

mycol = mydb["clientes"]


~~~

**En Mongo una colección no se crea hasta que tenga contenido. Mongo espera hasta que hayas insertado un documento antes de que cree una colección**


### Insertar un Documento

Un **Docuemento** en Mongo es lo mismo que un registro en SQL

Para insertar una registro o *documento* en una colección (Tabla), usamos el método `insert_one()`

El primer parámetro del método es un diccionario que contiene el nombre y los valores de cada campo en el documento que se desea insertar.


Ejemplo. Insertar un registro en la colección "clientes":

~~~py
import pymongo

micliente = pymongo.MongoClient("mongodb://localhost:27017/")

mydb = myclient["mydatabase"]

mycol = ["clientes"]


mydicc = {"nombre" : "Saltiel", "Direccion": "Lucio Blanco 461"}

x = mycol.insert_one(mydict)

~~~

#### Regresr el campo _id

El método `insert_one()` regresa un objeto *InsertOneResult* el cual tiene una propiedad, `inserted_id` que contiene el id del documento insertado.

Si no se especifica un `_id` entonces Mongo agregará uno por ti y asignará un id único para cada documento.

~~~
print(x.inserted_id)
~~~


### Insertar Multiples Documentos

Para isertar multiples documentos en una colección en Mongo usamos el método `insert_many()`

El parámetro que acepta `insert_many()` es una lista que contiene los diccionarios con los datos que se desean insertar.

EL método regresa un objeto *InsertManyResult* que posee la propiedad `inserted_ids` la cual indica los id's de los documentos insertados.

~~~py
import pymongo

micliente = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = micliente["mydatabase"]
mycol = mydb["cliente"]

mylist = [
  { "_id": 1, "name": "John", "address": "Highway 37"},
  { "_id": 2, "name": "Peter", "address": "Lowstreet 27"},
  { "_id": 3, "name": "Amy", "address": "Apple st 652"},
  { "_id": 4, "name": "Hannah", "address": "Mountain 21"},
  { "_id": 5, "name": "Michael", "address": "Valley 345"},
  { "_id": 6, "name": "Sandy", "address": "Ocean blvd 2"},
  { "_id": 7, "name": "Betty", "address": "Green Grass 1"},
  { "_id": 8, "name": "Richard", "address": "Sky st 331"},
  { "_id": 9, "name": "Susan", "address": "One way 98"},
  { "_id": 10, "name": "Vicky", "address": "Yellow Garden 2"},
  { "_id": 11, "name": "Ben", "address": "Park Lane 38"},
  { "_id": 12, "name": "William", "address": "Central st 954"},
  { "_id": 13, "name": "Chuck", "address": "Main Road 989"},
  { "_id": 14, "name": "Viola", "address": "Sideway 1633"}
]

x = mycol.insert_many(mylist)

#Imprime la lista de _id de los documentos insertados:
print(x.inserted_ids)

~~~

### Verificar si existe una Base de Datos

Se puede verificar si existe una base de datos, listando todas las bases en el sistema:

In [1]:
import pymongo 

micliente =pymongo.MongoClient("mongodb://localhost:27017/")

print(micliente.list_database_names())

['CRM', 'admin', 'config', 'local']


### Verificar si existe una colección 

Puedes verificar si existe una colección en una base de datos enlistando todas las colecciones:


In [7]:
# seleccionamos la base de datos "local" y la guardamos en la variable mydb
mydb = micliente['local']

# imprimimos las colecciones contenidas en esa base de datos

print(mydb.list_collection_names())


['startup_log']


### Find One

En Mongo se utilizan los métodos **find** y **findOne** para encontrar datos dentro de las colecciones.

Así como la sentencia **SELECT** es utilizada para buscar datos en una tabla.

Para seleccionar datos de una colección en Mongo, podemos utilizar `find_one()` lo cual no s devolverá la primera ocurrencia en la selección.

### Find All

Para obtener todas las ocurrencias en la selección, el primer parámetro de `find()` es un Query. En este ejemplo usamos un objeto Query vacío, el cual seleccionará todos los documentos en la colección. Tal como hacer un `SELECT * from Tabla`

Utilizando la base de datos *CRM* y la colección *cliente* obtenemos los datos

In [4]:
import pymongo

micliente = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = micliente["CRM"]
mycol = mydb["cliente"]

for x in mycol.find():
    print(x)

{'_id': 1, 'name': 'John', 'address': 'Highway 37'}
{'_id': 2, 'name': 'Peter', 'address': 'Lowstreet 27'}
{'_id': 3, 'name': 'Amy', 'address': 'Apple st 652'}
{'_id': 4, 'name': 'Hannah', 'address': 'Mountain 21'}
{'_id': 5, 'name': 'Michael', 'address': 'Valley 345'}
{'_id': 6, 'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'_id': 7, 'name': 'Betty', 'address': 'Green Grass 1'}
{'_id': 8, 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': 9, 'name': 'Susan', 'address': 'One way 98'}
{'_id': 10, 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': 11, 'name': 'Ben', 'address': 'Park Lane 38'}
{'_id': 12, 'name': 'William', 'address': 'Central st 954'}
{'_id': 13, 'name': 'Chuck', 'address': 'Main Road 989'}
{'_id': 14, 'name': 'Viola', 'address': 'Sideway 1633'}


### Contar registros

Podemos contar cuantos documentos tiene una colección con el método `count_documents({})` 


In [22]:
print(mycol.count_documents({}))

14


#### Regresar solo algunos campos

El segundo parámetro de `find()` es un objeto describiendo qué campos incluir en el resultado.
Este parámetro es opcional y si se omite, todos los campos se incluirán en el resultado.

Ejemplo. Regresar todos los campos, excepto los `_id`

In [14]:
import pymongo

micliente = pymongo.MongoClient("mongodb://localhost:27017/")

mycol=micliente["CRM"]["cliente"]

for x in mycol.find({},{"_id":0,"name":1 ,"address":1}):
    print(x)

{'name': 'John', 'address': 'Highway 37'}
{'name': 'Peter', 'address': 'Lowstreet 27'}
{'name': 'Amy', 'address': 'Apple st 652'}
{'name': 'Hannah', 'address': 'Mountain 21'}
{'name': 'Michael', 'address': 'Valley 345'}
{'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'name': 'Betty', 'address': 'Green Grass 1'}
{'name': 'Richard', 'address': 'Sky st 331'}
{'name': 'Susan', 'address': 'One way 98'}
{'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'name': 'Ben', 'address': 'Park Lane 38'}
{'name': 'William', 'address': 'Central st 954'}
{'name': 'Chuck', 'address': 'Main Road 989'}
{'name': 'Viola', 'address': 'Sideway 1633'}


### Query

Cuando se buscan documentos en una colección, se pueden filtrar los resultados utilizando un objeto Query. El primer argumento del método `find()` es un objeto *Query* y es utilizado para limitar la búsqueda.

~~~py
myquery = { "address": "Park Lane 38" }

mydoc = mycol.find(myquery)

for x in mydoc:
  print(x)
~~~
```
{'_id': 11, 'name': 'Ben', 'address': 'Park Lane 38'}
```

### Selectores de Query

Como en SQL, Mono también utiliza operadores para filtrar información.

| Nombre   | Descripción | Ejemplo   |
| -------  | :---------: | --------- |
|   eq o =   |    Coincide valores con un valor específico |     {name: {eq : John}}    |
|   gt o >   |  Coincide los valores que son mayores a un valor específico   | {_id : { gt: 5}} |
|   gte o >= |  Coincide los valores que son mayores o iguales a un valor específico   | {_id : { gte: 5}} |
| in         | Coincide con los valores que se encuentran en un arreglo específico |  {name: {in : [ John , Amy, Michael ] }}|
| lt o <   | Coincide los valores que son menores a un valor en específico | { cantidad : { lt : 20} }  |
| lte o <=   | Coincide los valores que son menores o iguales a un valor en específico | { cantidad : { lte : 50} }  |
| ne != o <>  | Coincide los valores que no son iguales a un valor en específico | { cantidad : { ne : 20} }  |
| nin o not in   | Descarta los valores que estan dentro de un arreglo  | {name: {nin : [ John , Amy, Michael ] } } |

- **Lógicos**

| Nombre   | Descripción | Ejemplo   |
| -------  | :---------: | --------- |
|   and   |    Une consultas con un AND y devuelve los documentos que cumplan las condiciones  |     {and: [ {edad : {gte: 18}},{edad : {lte:35} } ] }   |
| not  |  Ejecuta un NOT en la expresión e incluye documentos que no contienen el campo | { precio : { not: { gt : 20} } } |
|   NOR | Ejecuta un NOR lógico y selecciona los documentos que no cumplen las condiciones   | { nor: [ { precio: 1.99 }, { sale: true } ]  } |
| OR         | Une consultas con un OR y devuelve los documentos que cumplan las condiciones | {or: [ {edad : {gte: 18}},{edad : {lte:35} } ] } |
| exists         | Coincide los documentos que contiene cierto campo aunque esté vacío. | db.inventory.find( { qty: { $exists: true, $nin: [ 5, 15 ] } } ) |

#### Query Avanzado
Para crear Querys avanzados podemos utilizar modificadores como valores en el objeto del Query.


Para encontrar los documentos donde la dirección empiece con la letra "S" o mayor (alfabeticamente) utilizar el modificador "greater than": `{"$gt": "S"} :` 

- Filtro con Expresiones Regulares 

Para encontrar los documentos solo donde la "dirección" comience con la letra "S" usamos la expresión regular `{"$regex": "^S"}:`




In [18]:
# Direcciones que comiencen con S
myquery = { "address": { "$regex": "^S" } }

mydoc = mycol.find(myquery)

for x in mydoc:
  print(x)

{'_id': 8, 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': 14, 'name': 'Viola', 'address': 'Sideway 1633'}


In [19]:
#Direcciones que comiencen con S o mayor.
myquery = { "address": { "$gt": "S" } }

mydoc = mycol.find(myquery,{"name":0})

for x in mydoc:
  print(x)

{'_id': 5, 'address': 'Valley 345'}
{'_id': 8, 'address': 'Sky st 331'}
{'_id': 10, 'address': 'Yellow Garden 2'}
{'_id': 14, 'address': 'Sideway 1633'}


### Ordenamiento

Utilizar el método `sort()` para ordenar el resultado en orden ascendente o descendente. El método toma un parámetro por campo y un parámetro para la dirección (ascendente es la dirección por default)


`mydoc = mycol.find().sort("name")`


Utilizar -1 como segundo parámetro para ordenar de forma descendente.

~~~
sort("name", 1) #ascending
sort("name", -1) #descending
~~~

In [20]:
mydoc = mycol.find().sort("name", -1)

for x in mydoc:
  print(x)

{'_id': 12, 'name': 'William', 'address': 'Central st 954'}
{'_id': 14, 'name': 'Viola', 'address': 'Sideway 1633'}
{'_id': 10, 'name': 'Vicky', 'address': 'Yellow Garden 2'}
{'_id': 9, 'name': 'Susan', 'address': 'One way 98'}
{'_id': 6, 'name': 'Sandy', 'address': 'Ocean blvd 2'}
{'_id': 8, 'name': 'Richard', 'address': 'Sky st 331'}
{'_id': 2, 'name': 'Peter', 'address': 'Lowstreet 27'}
{'_id': 5, 'name': 'Michael', 'address': 'Valley 345'}
{'_id': 1, 'name': 'John', 'address': 'Highway 37'}
{'_id': 4, 'name': 'Hannah', 'address': 'Mountain 21'}
{'_id': 13, 'name': 'Chuck', 'address': 'Main Road 989'}
{'_id': 7, 'name': 'Betty', 'address': 'Green Grass 1'}
{'_id': 11, 'name': 'Ben', 'address': 'Park Lane 38'}
{'_id': 3, 'name': 'Amy', 'address': 'Apple st 652'}


### Delete

Para borrar un documento podemos utilizar dos métodos `delete_one()` o `delete_many()` el parámetro que le debemos pasar es un Query object definiendo qué documento borrar.

Para `delete_one()` borrará la primera coincidencia que encuentre.

Para eliminar varios documentos (registros) usamos `delete_many()` 

~~~py

myquery = { 'address': {"$regex": '^S'} }

x = mycol.delete_many(myquery)
~~~


Para eliminar todos los documentos de una colección utilizamos `delete_many({})` 

~~~py

import pymongo

myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]

x = mycol.delete_many({})

print(x.deleted_count, " documents deleted.")
~~~


### Drop Collection

Para eliminar una colección utilizamos el método `drop()`

~~~py
import pymongo

myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]

mycol.drop()
~~~

EL método devolverá un `True` si l colección fue borrada y `False` si la colección no existe. 

### Update 

Se pueden actualizar los registros utilizando `update_one()` o `update_many()`.

El primer parámetro es un Query object definiendo qué documento se actualizará.

El segundo parámetro es un objeto definiendo los nuevos valores del documento.

#### Update_one

~~~py
mycol = mydb["cliente"]

myquery = { "address": "Valley 345" }
newvalues = { "$set": { "address": "Canyon 123" } }

mycol.update_one(myquery, newvalues)
~~~


#### Update_many

Actualiza todos los documentos que coincidan con el criterio del Query.

Ejemplo: Actualiza todos los documentos en donde la dirección comience con "S" : 

~~~py
import pymongo

myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["CRM"]
mycol = mydb["cliente"]

myquery = { "address": { "$regex": "^S" } }
newvalues = { "$set": { "name": "Minnie" } }

x = mycol.update_many(myquery, newvalues)

print(x.modified_count, "documents updated.")

~~~

### Limit

Para limitar el resultado de una consulta en Mongo, utilizamos el método `limit()`. Este método toma un parámetro, un número definiendo cuántos documentos regresará.

Limitaremos el resultado a 5 

In [21]:
myresult = mycol.find().limit(5)

#print the result:
for x in myresult:
  print(x)

{'_id': 1, 'name': 'John', 'address': 'Highway 37'}
{'_id': 2, 'name': 'Peter', 'address': 'Lowstreet 27'}
{'_id': 3, 'name': 'Amy', 'address': 'Apple st 652'}
{'_id': 4, 'name': 'Hannah', 'address': 'Mountain 21'}
{'_id': 5, 'name': 'Michael', 'address': 'Valley 345'}


### Listar los nombres de los campos en una colección

Podemos utilizar llamar un documento con `find_one()` y almacenaro en una variable, esta tendrá la estructura de un Diccionario de  Python, así con el método `keys()` podremos saber los campos de esa colección.

Ejemplo:

In [28]:
x = mydb.cliente.find_one()
print(x.keys())

dict_keys(['_id', 'name', 'address'])


### DISTINCT

Uusando este método podemos reunir un grupo de valores asignados a un campo en específico en todos los documentos

In [8]:
#print(micliente.list_database_names())

import pymongo

micliente = pymongo.MongoClient("mongodb://localhost:27017/")
data=micliente["aeropuertos"]["data"]


data.distinct("_id.aeropuerto")


['MDW',
 'MSP',
 'BWI',
 'PDX',
 'IAD',
 'SAN',
 'CLT',
 'LGA',
 'TPA',
 'FLL',
 'BOS',
 'LAS',
 'SEA',
 'JFK',
 'EWR',
 'SLC',
 'DEN',
 'DTW',
 'DCA',
 'ORD',
 'MIA',
 'IAH',
 'SFO',
 'DFW',
 'LAX',
 'PHL',
 'ATL',
 'PHX',
 'MCO']

Si quisieramos saber qué aerolíneas están en cierto aeropuerto  que no se encentran en otro, lo podemos realizar con un distinct. 

In [11]:
set(data.distinct("Carrier.name",{"_id.aeropuerto":"JFK"})) - set(data.distinct("Carrier.name",{"_id.aeropuerto":"MIA"}))

{'Atlantic Coast Airlines',
 'Endeavor Air Inc.',
 'Hawaiian Airlines Inc.',
 'Independence Air',
 'JetBlue Airways',
 'Virgin America'}