# Mongo desde Python 


Para una introducción al uso de Mongo desde Python, ver:

http://api.mongodb.com/python/current/tutorial.html


## Índice:
* [Conexión con el servidor](#Conexión-con-el-servidor)
* [Acceso a la base de datos](#Acceso-a-la-base-de-datos)
* [Modificando de la base de datos](#Modificando-la-base-de-datos)
    * [Insert](#Insert)
    * [Replace](#Replace)
    * [Update](#Update)
    * [Delete](#Delete)
* [Consultas](#Consultas)
    * [Listando colecciones](#Listando-colecciones)
    * [Find](#Find)
* [Un ejemplo más complejo](#Un-ejemplo-más-complejo)

### Conexión con el servidor

Empezamos asegurándonos de que pymongo, la librería, existe

In [1]:
import sys
# pymongo
try:
    import pymongo
    print("Pymongo está en el sistema!")
except ImportError as e:
    !{sys.executable} -m pip install --upgrade --user pymongo
    
    
!{sys.executable} -m pip install --upgrade --user dnspython    

Pymongo está en el sistema!


In [2]:
import pymongo  # la conexión con mongo; si no funciona, descomentar la línea siguiente
from pprint import pprint # para mostrar los json bonitos
from pymongo import MongoClient

# Atlas: 
#client = MongoClient("mongodb+srv://aniceto:gominolas@cluster0.nubot.mongodb.net/test?retryWrites=true&w=majority")
client = MongoClient('mongodb://127.0.0.1:27017/')

# código para ver si se ha conectado bien
try:
    s = client.server_info() # si hay error tendremos una excepción
    print("Conectado a MongoDB, versión",s["version"])
except:
    print ("connection error")
   

Conectado a MongoDB, versión 6.0.2


### Acceso a la base de datos



Empezamos por acceder a la base de datos. Lo hacemos a través del cliente.

In [3]:
db = client.prueba

In [4]:
db.prueba.count_documents({})

0

# Modificando la base de datos



Para [modicar la base de datos MongoDB en pymongo](https://pymongo.readthedocs.io/en/stable/api/pymongo/collection.html) disponemos de una lista de funciones; casi todas tienen dos alternativas, una para un solo documento y otra para varios

     insert_one(document,...):  Insert a single document.
     insert_many(documents, ordered=True,...): insert an iterable of documents.
     replace_one(filter, replacement, upsert=False, ...):  Replace a single document matching the filter.
     update_one(filter, update, upsert=False,...).  Update a single document matching the filter.
     update_many(filter, update, upsert=False,...):   Update one or more documents that match the filter.
     delete_one(filter,...):  Delete a single document matching the filter.
     delete_many(filter,...):  Delete one or more documents matching the filter.
     bulk_write(requests, ordered=True,...): Send a batch of write operations to the server.

### Insert



Un insert de prueba

In [5]:
import datetime
queja = {"_id": 1, 
         "user": { "name": "Herminia", "telfs": ["594333","91128987"]},
         "level": 5,
         "tags": ["mongodb", "python", "pymongo"],
         "date": datetime.datetime.utcnow(),
         "comment": "Mongo casca con error 121"}

db.quejas.drop() # Ojo, esto borra completamente la colección
res = db.quejas.insert_one(queja)
if res.inserted_id is not None:
    print("insertado con id",res.inserted_id)

insertado con id 1


In [6]:
# recordar que en MongoDB cada documento tiene un _id es único
print(queja["_id"]) # python

1


In [7]:
# Insertamos varios documentos con ids 3,4,...10
lista = []
for i in range(5,11):
    copia = queja.copy()
    copia["_id"] = i
    lista.append(copia)
result = db.quejas.insert_many(lista)
    print("Insertados: ",result.inserted_ids)
print("Num quejas", db.quejas.count_documents({}))

Insertados:  [5, 6, 7, 8, 9, 10]
Num quejas 7


por supuesto si el _id ya existe tendremos un error de clave duplicada

In [34]:
db.quejas.insert_one(queja)

DuplicateKeyError: E11000 duplicate key error collection: prueba.quejas index: _id_ dup key: { _id: 1 }, full error: {'index': 0, 'code': 11000, 'keyPattern': {'_id': 1}, 'keyValue': {'_id': 1}, 'errmsg': 'E11000 duplicate key error collection: prueba.quejas index: _id_ dup key: { _id: 1 }'}

### Replace

Si lo que queremos es que se "machaque" la copia anterior con la nueva si ya existe o que se inserte si es nuevo, podemos utilizar `replace_one` con upsert=True

https://api.mongodb.com/python/current/api/pymongo/collection.html

In [8]:
queja["_id"]

1

In [9]:
# sintaxis replace_one(filter, update, upsert=False...)
result = db.quejas.replace_one({"_id":queja["_id"]},queja,upsert=True)
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

# una nueva queja de herminia
queja2 = {"_id": 2, # si no se pone se creará automáticamente
         "user": { "name": "Herminia", "telfs": ["594333","91128987"]},
         "level":4,
         "tags": ["mongodb", "python", "pymongo",'claves'],
         "date": datetime.datetime.utcnow(),
         "comment": "Error, clave duplicada"}
result = db.quejas.replace_one({"_id":queja2["_id"]},queja2,upsert=True)
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

print("Documentos en quejas: ", db.quejas.count_documents({}))

Encajan  1  Modificados:  0  _Id de los insertados:  None
Encajan  0  Modificados:  0  _Id de los insertados:  2
Documentos en quejas:  8


¿Por qué no lo ha modificado?
    No lo ha modificado por que el elemento remplazar y la remplazación tienen los mismos valores.

In [10]:
queja["level"] +=1
result = db.quejas.replace_one({"_id":queja["_id"]},queja,upsert=True)
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

Encajan  1  Modificados:  1  _Id de los insertados:  None


### Update

El código anterior es muy ineficiente; para modificar solo el nivel de 
la queja machaca todo el documento. Para hacer mejor podemos modificar solo la parte que queremos:

In [38]:
result = db.quejas.update_one({"_id":queja["_id"]},
                              {"$set":{"level":3}},upsert=True)
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

Encajan  1  Modificados:  1  _Id de los insertados:  None


Existen varios [update operators](https://docs.mongodb.com/manual/reference/operator/update/). Podemos aplicárselos a varios documentos a la vez:

In [39]:
result = db.quejas.update_many({}, # así encajan todos
                              {"$inc":{"level":1}})
print("Encajan ",result.matched_count, 
      " Modificados: ",result.modified_count,
      " _Id de los insertados: ",result.upserted_id)

Encajan  8  Modificados:  8  _Id de los insertados:  None


### Delete

In [11]:
queja3 = {"_id": 3, # si no se pone se creará automáticamente
         "user": { "name": "Aniceto", "telfs": ["579431"], "mail":"aniceto@gmail.com"},
         "level": 5,
         "tags": ["mongodb", "Compass", "claves"],
         "date": datetime.datetime.utcnow(),
         "comment": "No me señala las claves únicas"}

queja4 = {"_id": 4, # si no se pone se creará automáticamente
         "user": { "name": "Aniceto", "telfs": ["579431"],"mail":"aniceto@gmail.com"},
         "level": 5,
         "tags": ["mongodb", "Atlas"],
         "date": datetime.datetime.utcnow(),
         "comment": "Problemas para acceder desde la facultad"}

db.quejas.insert_many([queja3,queja4])
result = db.quejas.delete_one({"_id":4})
print("Borrados: ",result.deleted_count)

Borrados:  1


# Consultas

### Listando colecciones

In [12]:
colecciones = db.list_collection_names()

Veamos cuantos elementos tiene cada coleccion

In [13]:
for col in colecciones:
    print(col,db[col].count_documents({}))  # db.col. accedería a la colección con nombre 'col'

quejas 9


### Find

Sintaxis:

db.collecion.find(where,select) 

Ejemplo: select name,level from quejas where name="Herminia";
En mongo

db.quejas.find({"user.name":"Herminia"},{"user.name":1,"level":1,"_id":0})


Encontrar solo uno

In [14]:
unaqueja = db.quejas.find_one() # el primer usuario
pprint(unaqueja)

{'_id': 1,
 'comment': 'Mongo casca con error 121',
 'date': datetime.datetime(2022, 10, 8, 9, 16, 49, 580000),
 'level': 6,
 'tags': ['mongodb', 'python', 'pymongo'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}


Quejas emitidas por Herminia:

In [46]:
cursor = db.quejas.find({'user.name': 'Herminia'}) 
for doc in cursor:
    pprint(doc)

{'_id': 1,
 'comment': 'Mongo casca con error 121',
 'date': datetime.datetime(2021, 9, 19, 10, 13, 0, 778000),
 'level': 4,
 'tags': ['mongodb', 'python', 'pymongo'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}
{'_id': 5,
 'comment': 'Mongo casca con error 121',
 'date': datetime.datetime(2021, 9, 19, 10, 13, 0, 778000),
 'level': 6,
 'tags': ['mongodb', 'python', 'pymongo'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}
{'_id': 6,
 'comment': 'Mongo casca con error 121',
 'date': datetime.datetime(2021, 9, 19, 10, 13, 0, 778000),
 'level': 6,
 'tags': ['mongodb', 'python', 'pymongo'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}
{'_id': 7,
 'comment': 'Mongo casca con error 121',
 'date': datetime.datetime(2021, 9, 19, 10, 13, 0, 778000),
 'level': 6,
 'tags': ['mongodb', 'python', 'pymongo'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}
{'_id': 8,
 'comment': 'Mongo casca con error 121',
 'date': datetime.da

De estas quejas, mostrar solo el `comment` y el `level` (2 formas de hacerlo)

In [15]:
# Versión A
cursor = db.quejas.find({'user.name': 'Herminia'},{'comment':1,'level':1,'_id':0}) 
for doc in cursor:
    pprint(doc)

{'comment': 'Mongo casca con error 121', 'level': 6}
{'comment': 'Mongo casca con error 121', 'level': 5}
{'comment': 'Mongo casca con error 121', 'level': 5}
{'comment': 'Mongo casca con error 121', 'level': 5}
{'comment': 'Mongo casca con error 121', 'level': 5}
{'comment': 'Mongo casca con error 121', 'level': 5}
{'comment': 'Mongo casca con error 121', 'level': 5}
{'comment': 'Error, clave duplicada', 'level': 4}


# fatal!!!

In [49]:
# Versión B---> FATAL
cursor = db.quejas.find() 
for doc in cursor:
    if doc['user']['name']=='Herminia':
        print("{'comment':", doc["comment"],doc["level"],'}')

{'comment': Mongo casca con error 121 4 }
{'comment': Mongo casca con error 121 6 }
{'comment': Mongo casca con error 121 6 }
{'comment': Mongo casca con error 121 6 }
{'comment': Mongo casca con error 121 6 }
{'comment': Mongo casca con error 121 6 }
{'comment': Mongo casca con error 121 6 }
{'comment': Error, clave duplicada 5 }


Quejas con nivel mayor que 5

In [16]:
cursor = db.quejas.find({'level': {"$gt":5}}) 
for doc in cursor:
    pprint(doc)

{'_id': 1,
 'comment': 'Mongo casca con error 121',
 'date': datetime.datetime(2022, 10, 8, 9, 16, 49, 580000),
 'level': 6,
 'tags': ['mongodb', 'python', 'pymongo'],
 'user': {'name': 'Herminia', 'telfs': ['594333', '91128987']}}


Quejas que no incluyan el tag 'python' (array tags)

In [17]:
# version 1
cursor = db.quejas.find({'tags': {"$nin":['python']}}) 
for doc in cursor:
    pprint(doc)

{'_id': 3,
 'comment': 'No me señala las claves únicas',
 'date': datetime.datetime(2022, 10, 8, 9, 37, 13, 17000),
 'level': 5,
 'tags': ['mongodb', 'Compass', 'claves'],
 'user': {'mail': 'aniceto@gmail.com', 'name': 'Aniceto', 'telfs': ['579431']}}


In [18]:
# version 2
cursor = db.quejas.find({'tags': {"$ne":'python'}}) 
for doc in cursor:
    pprint(doc)

{'_id': 3,
 'comment': 'No me señala las claves únicas',
 'date': datetime.datetime(2022, 10, 8, 9, 37, 13, 17000),
 'level': 5,
 'tags': ['mongodb', 'Compass', 'claves'],
 'user': {'mail': 'aniceto@gmail.com', 'name': 'Aniceto', 'telfs': ['579431']}}


### Un ejemplo más complejo

Vamos a crear una colección con datos aleatorios

In [19]:
import random
import datetime
nombres = ['bertoldo','herminia','aniceto','calixta','melibea']

total = 1000 # total de usuarios a añadir

l = []
db.compras.drop()
for i in range(total):
    nombre= random.choice(nombres)+"_"+str(i)    
    edad = random.randint(1,101)
    totalcompras = random.randint(0,21)
    compras = []
    for j in range(totalcompras):
        compras.append(random.randint(1,200))
        
    dato = {"_id":i,"nombre": nombre, "edad":edad,"precios":compras, 
             "dir":{"calle":"rosa "+str(i %10), "num":str(i+len(compras)%50)},
             "hora":datetime.datetime.utcnow()}
    l.append(dato)
    
db.compras.insert_many(l)
print("Insertados ",db.compras.count_documents({}), " documentos")


Insertados  1000  documentos


Para que vaya más rápido podemos crear un índice

In [20]:
db.compras.drop_indexes()
result = db.compras.create_index([('precios', pymongo.ASCENDING)],
                                   unique=False)
print(result)

precios_1


Estamos interesados en saber los nombres de los menores que han hecho alguna compra

In [21]:
query = db.compras.find({"edad":{"$lt":18}}).limit(10)
for doc in query:
    print(doc['nombre'],doc['edad'])

bertoldo_12 7
bertoldo_14 13
aniceto_18 4
herminia_21 14
herminia_22 16
bertoldo_39 12
calixta_45 4
melibea_52 8
bertoldo_55 15
calixta_58 8


Queremos saber los nombres de los que hayan hecho alguna compra entre 180 y 190 euros.
En caso de que haya varios elementos de este tipo nos basta con mostrar el primero

```
{'nombre': 'aniceto_3', 'precios': [185]}
{'nombre': 'herminia_6', 'precios': [183]}
{'nombre': 'melibea_7', 'precios': [181]}
{'nombre': 'aniceto_9', 'precios': [190]}
```

In [22]:
query = db.compras.find({"precios":{"$elemMatch":{"$gte":180,"$lte":190}}},{"nombre":1,"precios.$":1,"_id":0})
for doc in query:
    print(doc)

{'nombre': 'herminia_1', 'precios': [180]}
{'nombre': 'bertoldo_14', 'precios': [180]}
{'nombre': 'aniceto_34', 'precios': [180]}
{'nombre': 'bertoldo_76', 'precios': [180]}
{'nombre': 'melibea_89', 'precios': [185]}
{'nombre': 'herminia_96', 'precios': [180]}
{'nombre': 'herminia_152', 'precios': [180]}
{'nombre': 'bertoldo_167', 'precios': [180]}
{'nombre': 'bertoldo_186', 'precios': [180]}
{'nombre': 'bertoldo_192', 'precios': [180]}
{'nombre': 'herminia_256', 'precios': [185]}
{'nombre': 'aniceto_270', 'precios': [185]}
{'nombre': 'melibea_280', 'precios': [184]}
{'nombre': 'calixta_314', 'precios': [180]}
{'nombre': 'aniceto_324', 'precios': [180]}
{'nombre': 'bertoldo_337', 'precios': [180]}
{'nombre': 'bertoldo_351', 'precios': [190]}
{'nombre': 'herminia_358', 'precios': [186]}
{'nombre': 'calixta_364', 'precios': [184]}
{'nombre': 'herminia_369', 'precios': [180]}
{'nombre': 'aniceto_370', 'precios': [180]}
{'nombre': 'melibea_384', 'precios': [180]}
{'nombre': 'calixta_392', 