# Mongo desde Python 


Para una introducción al uso de Mongo desde Python, ver:

http://api.mongodb.com/python/current/tutorial.html


## Índice:
* [Conexión con el servidor](#Conexión-con-el-servidor)
* [Acceso a la base de datos](#Acceso-a-la-base-de-datos)
* [Insert](#Insert)
* [Replace](#Replace)
* [Update](#Update)
* [Delete](#Delete)
* [Listando colecciones](#Listando-colecciones)
* [Find](#Find)
* [Un ejemplo más complejo](#Un-ejemplo-más-complejo)

### Conexión con el servidor

In [25]:
import sys
# pymongo
try:
    import pymongo
    print("Pymongo está en el sistema!")
except ImportError as e:
    !{sys.executable} -m pip install --upgrade --user pymongo



You should consider upgrading via the 'python -m pip install --upgrade pip' command.


In [24]:
import pymongo  # la conexión con mongo; si no funciona, descomentar la línea siguiente
from pprint import pprint # para mostrar los json bonitos
from pymongo import MongoClient

# Atlas: 
#client = MongoClient("mongodb+srv://aniceto:gominolas@cluster0.nubot.mongodb.net/test?retryWrites=true&w=majority")
client = MongoClient('mongodb://127.0.0.1:27017/')

# código para ver si se ha conectado bien
try:
    s = client.server_info() # si hay error tendremos una excepción
    print("Conectado a MongoDB, versión",s["version"])
except:
    print ("connection error")
   

Conectado a MongoDB, versión 4.4.1


### Acceso a la base de datos



Empezamos por acceder a la base de datos. Lo hacemos a través del cliente.

In [26]:
db = client.prueba

### Insert

Un insert de prueba

In [27]:
import datetime
queja = {"_id": 1, 
         "user": { "name": "Herminia", "telfs": ["594333","91128987"]},
         "level": 5,
         "tags": ["mongodb", "python", "pymongo"],
         "date": datetime.datetime.utcnow(),
         "comment": "Mongo casca con error 121"}

db.quejas.drop() # Ojo, esto borra completamente la colección
db.quejas.insert_one(queja)
print("insertado")

insertado


Ojo que si el _id ya existe tendremos un error de clave duplicada

In [28]:
db.quejas.insert_one(queja)

DuplicateKeyError: E11000 duplicate key error collection: prueba.quejas index: _id_ dup key: { _id: 1 }

### Replace

Si lo que queremos es que se "machaque" la copia anterior con la nueva si ya existe o que se inserte si en nuevo, podemos utilizar `replace_one` con upsert=True

https://api.mongodb.com/python/current/api/pymongo/collection.html

In [31]:
queja["_id"]

1

In [32]:
# sintaxis replace_one(filter, update, upsert=False...)
result = db.quejas.replace_one({"_id":queja["_id"]},queja,upsert=True)
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

# una nueva queja de herminia
queja2 = {"_id": 2, # si no se pone se creará automáticamente
         "user": { "name": "Herminia", "telfs": ["594333","91128987"]},
         "level":4,
         "tags": ["mongodb", "python", "pymongo",'claves'],
         "date": datetime.datetime.utcnow(),
         "comment": "Error, clave duplicada"}
result = db.quejas.replace_one({"_id":queja2["_id"]},queja2,upsert=True)
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

print("Documentos en quejas: ", db.quejas.count_documents({}))

Encajan  1  Modificados:  0  _Id de los insertados:  None
Encajan  0  Modificados:  0  _Id de los insertados:  2
Documentos en quejas:  2


¿Por qué no lo ha modificado?

In [33]:
queja["level"] +=1
result = db.quejas.replace_one({"_id":queja["_id"]},queja,upsert=True)
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

Encajan  1  Modificados:  1  _Id de los insertados:  None


### Update

El código anterior es muy ineficiente; para modificar solo el nivel de 
la queja machaca todo el documento. Para hacer mejor podemos modificar solo la parte que queremos:

In [35]:
result = db.quejas.update_one({"_id":queja["_id"]},
                              {"$set":{"level":3}},upsert=True)
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

Encajan  1  Modificados:  1  _Id de los insertados:  None


Existen varios [update operators](https://docs.mongodb.com/manual/reference/operator/update/). Podemos aplicárselos a varios documentos a la vez:

In [36]:
result = db.quejas.update_many({}, # así encajan todos
                              {"$inc":{"level":1}})
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

Encajan  2  Modificados:  2  _Id de los insertados:  None


### Delete

In [37]:
queja3 = {"_id": 3, # si no se pone se creará automáticamente
         "user": { "name": "Aniceto", "telfs": ["579431"], "mail":"aniceto@gmail.com"},
         "level": 5,
         "tags": ["mongodb", "Compass", "claves"],
         "date": datetime.datetime.utcnow(),
         "comment": "No me señala las claves únicas"}

queja4 = {"_id": 4, # si no se pone se creará automáticamente
         "user": { "name": "Aniceto", "telfs": ["579431"],"mail":"aniceto@gmail.com"},
         "level": 5,
         "tags": ["mongodb", "Atlas"],
         "date": datetime.datetime.utcnow(),
         "comment": "Problemas para acceder desde la facultad"}

db.quejas.insert_many([queja3,queja4])
result = db.quejas.delete_one({"_id":4})
print("Borrados: ",result.deleted_count)

Borrados:  1


### Listando colecciones

Comprobamos que se ha creado listando las colecciones en la BD

In [39]:
colecciones = db.list_collection_names()
print(colecciones)

['quejas']


Veamos cuantos elementos tiene cada coleccion

In [40]:
for col in colecciones:
    print(col,db[col].count_documents({}))  # db.col.

quejas 3


### Find

Sintaxis:

db.collecion.find(where,select) 

Ejemplo: select name,level from quejas where name="Herminia";
En mongo

db.quejas.find({"user.name":"Herminia"},{"user.name":1,"level":1,"_id":0})


Encontrar solo uno

In [43]:
unaqueja = db.quejas.find_one() # el primer usuario
pprint(unaqueja)

{'_id': 1,
 'comment': 'Mongo casca con error 121',
 'date': datetime.datetime(2020, 10, 14, 15, 15, 53, 995000),
 'level': 4,
 'tags': ['mongodb', 'python', 'pymongo'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}


Quejas emitidas por Herminia:

In [44]:
cursor = db.quejas.find({'user.name': 'Herminia'}) 
for doc in cursor:
    pprint(doc)

{'_id': 1,
 'comment': 'Mongo casca con error 121',
 'date': datetime.datetime(2020, 10, 14, 15, 15, 53, 995000),
 'level': 4,
 'tags': ['mongodb', 'python', 'pymongo'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}
{'_id': 2,
 'comment': 'Error, clave duplicada',
 'date': datetime.datetime(2020, 10, 14, 15, 21, 27, 14000),
 'level': 5,
 'tags': ['mongodb', 'python', 'pymongo', 'claves'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}


De estas quejas, mostrar solo el `comment` y el `level` (2 formas de hacerlo)

In [46]:
cursor = db.quejas.find({'user.name': 'Herminia'},{'comment':1,'level':1,'_id':0}) 
for doc in cursor:
    pprint(doc)

{'comment': 'Mongo casca con error 121', 'level': 4}
{'comment': 'Error, clave duplicada', 'level': 5}


In [50]:
cursor = db.quejas.find({'user.name': 'Herminia'}) 
for doc in cursor:
    print("{'comment':", doc["comment"],doc["level"],'}')

{'comment': Mongo casca con error 121 4 }
{'comment': Error, clave duplicada 5 }


Quejas con nivel mayor que 5

In [67]:
cursor = db.quejas.find({'level': {"$gt":5}}) 
for doc in cursor:
    pprint(doc)

{'_id': 1,
 'comment': 'Mongo casca con error 121',
 'date': datetime.datetime(2020, 10, 13, 13, 16, 38, 500000),
 'level': 8,
 'tags': ['mongodb', 'python', 'pymongo'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}


Quejas que incluyan el tag 'claves' (array tags)

In [52]:
cursor = db.quejas.find({'tags': {"$nin":['python']}}) 
for doc in cursor:
    pprint(doc)

{'_id': 3,
 'comment': 'No me señala las claves únicas',
 'date': datetime.datetime(2020, 10, 14, 15, 32, 8, 993000),
 'level': 5,
 'tags': ['mongodb', 'Compass', 'claves'],
 'user': {'mail': 'aniceto@gmail.com', 'name': 'Aniceto', 'telfs': ['579431']}}


### Un ejemplo más complejo

Vamos a crear una colección con datos aleatorios

In [34]:
import random
import datetime
nombres = ['bertoldo','herminia','aniceto','calixta','melibea']

total = 1000 # total de usuarios a añadir

l = []
db.compras.drop()
for i in range(total):
    nombre= random.choice(nombres)+"_"+str(i)    
    edad = random.randint(1,101)
    totalcompras = random.randint(0,21)
    compras = []
    for j in range(totalcompras):
        compras.append(random.randint(1,200))
    dato = {"_id":i,"nombre": nombre, "edad":edad,"precios":compras, 
             "dir":{"calle":"rosa "+str(i %10), "num":str(i+len(compras)%50)},
             "hora":datetime.datetime.utcnow()}
    l.append(dato)
db.compras.insert_many(l)
print("Insertados ",db.compras.count_documents({}), " documentos")


Insertados  1000  documentos


Para que vaya más rápido podemos crear un índice

In [30]:
db.compras.drop_indexes()
result = db.compras.create_index([('precios', pymongo.ASCENDING)],
                                   unique=False)
print(result)

precios_1


Estamos interesados en saber los nombres de los menores que han hecho alguna compra

In [33]:
query = db.compras.find({"edad":{"$lt":18}}).limit(10)
for doc in query:
    print(doc['nombre'],doc['edad'])

melibea_1 5
herminia_8 13
aniceto_9 11
calixta_16 7
calixta_19 9
aniceto_20 6
calixta_22 13
herminia_28 2
melibea_29 6
calixta_36 7
aniceto_39 12
melibea_42 8
melibea_49 17
bertoldo_67 2
herminia_71 11
melibea_73 13
calixta_74 9
herminia_90 8
calixta_91 5
herminia_100 9
calixta_101 17
melibea_105 7
bertoldo_109 3
melibea_110 1
calixta_111 13
melibea_113 2
bertoldo_119 14
herminia_123 10
herminia_126 5
melibea_133 15
melibea_139 6
melibea_142 12
melibea_152 12
bertoldo_160 1
calixta_162 7
bertoldo_164 7
calixta_166 17
melibea_194 8
aniceto_198 5
herminia_202 1
calixta_219 3
herminia_221 13
melibea_223 13
herminia_224 13
herminia_230 13
calixta_240 9
calixta_245 17
calixta_249 6
melibea_257 16
calixta_258 1
bertoldo_259 9
melibea_261 8
aniceto_274 7
melibea_279 14
calixta_285 17
herminia_292 9
aniceto_294 17
herminia_297 1
bertoldo_303 2
herminia_310 3
herminia_319 2
calixta_320 1
calixta_321 9
herminia_335 1
calixta_337 7
aniceto_339 2
melibea_340 6
bertoldo_342 10
melibea_344 14
anicet

Queremos saber los nombres de los que hayan hecho alguna compra entre 180 y 190 euros.
En caso de que haya varios elementos de este tipo nos basta con mostrar el primero

```
{'nombre': 'aniceto_3', 'precios': [185]}
{'nombre': 'herminia_6', 'precios': [183]}
{'nombre': 'melibea_7', 'precios': [181]}
{'nombre': 'aniceto_9', 'precios': [190]}
```

In [38]:
query = db.compras.find({"precios":{"$elemMatch":{"$gte":180,"$lte":190}}},{"nombre":1,"precios.$":1,"_id":0})
for doc in query:
    print(doc)

{'nombre': 'aniceto_3', 'precios': [185]}
{'nombre': 'herminia_6', 'precios': [183]}
{'nombre': 'melibea_7', 'precios': [181]}
{'nombre': 'aniceto_9', 'precios': [190]}
{'nombre': 'aniceto_15', 'precios': [187]}
{'nombre': 'melibea_18', 'precios': [187]}
{'nombre': 'aniceto_21', 'precios': [186]}
{'nombre': 'calixta_23', 'precios': [184]}
{'nombre': 'aniceto_30', 'precios': [185]}
{'nombre': 'aniceto_36', 'precios': [183]}
{'nombre': 'herminia_37', 'precios': [184]}
{'nombre': 'melibea_38', 'precios': [187]}
{'nombre': 'bertoldo_40', 'precios': [187]}
{'nombre': 'herminia_42', 'precios': [188]}
{'nombre': 'bertoldo_44', 'precios': [181]}
{'nombre': 'calixta_48', 'precios': [181]}
{'nombre': 'herminia_51', 'precios': [182]}
{'nombre': 'aniceto_58', 'precios': [185]}
{'nombre': 'aniceto_62', 'precios': [188]}
{'nombre': 'aniceto_64', 'precios': [189]}
{'nombre': 'calixta_67', 'precios': [190]}
{'nombre': 'herminia_69', 'precios': [190]}
{'nombre': 'melibea_70', 'precios': [182]}
{'nombre

Obtener los documentos de personas que se llamen herminia_XXX y que el número de calle sea menor que 50.