# MongoDB

In [2]:
!pip install pymongo

Collecting pymongo
  Obtaining dependency information for pymongo from https://files.pythonhosted.org/packages/4e/50/7e0e838892507d99a6b981824c73617cba567a56a802a518d49e12da77b6/pymongo-4.5.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata
  Downloading pymongo-4.5.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (22 kB)
Collecting dnspython<3.0.0,>=1.16.0 (from pymongo)
  Obtaining dependency information for dnspython<3.0.0,>=1.16.0 from https://files.pythonhosted.org/packages/f6/b4/0a9bee52c50f226a3cbfb54263d02bb421c7f2adc136520729c2c689c1e5/dnspython-2.4.2-py3-none-any.whl.metadata
  Using cached dnspython-2.4.2-py3-none-any.whl.metadata (4.9 kB)
Using cached pymongo-4.5.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (671 kB)
Using cached dnspython-2.4.2-py3-none-any.whl (300 kB)
Installing collected packages: dnspython, pymongo
Successfully installed dnspython-2.4.2 pymongo-4.5.0

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;

In [1]:
import pymongo

# Conecta a MongoDB (asegúrate de que MongoDB esté en ejecución)
client = pymongo.MongoClient("mongodb://localhost:27017/")
print(client)

# Crea una base de datos llamada "mydatabase"
db = client["mydatabase"]
print(db)

MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True)
Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'mydatabase')


In [2]:
# Crea una colección llamada "mycollection"
collection = db["mycollection"]
print(collection)

Collection(Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'mydatabase'), 'mycollection')


### Crear (Create)

In [5]:
# Insertar un documento en la colección
# insert_one()
data = {"name": "Jorge", "age": 30}
result = collection.insert_one(data)
print(f"Documento insertado con ID: {result.inserted_id}")

Documento insertado con ID: 653fb5257b6f6aa49aae6a29


### Leer (Read)

In [18]:
# Leer todos los documentos en la colección
documents = collection.find()
for docs in documents:
    print(docs)

{'_id': ObjectId('653fb5257b6f6aa49aae6a29'), 'name': 'Jorge', 'age': 30}


In [16]:
from bson.objectid import ObjectId  # Importar ObjectId para trabajar con _id

# Definir el ID del documento que deseas encontrar
document_id = ObjectId("653fb42a7b6f6aa49aae6a28")

# Utilizar find_one para buscar el documento por su ID
doc = collection.find_one({"_id": document_id})
print(doc)

{'_id': ObjectId('653fb42a7b6f6aa49aae6a28'), 'name': 'Ejemplo', 'age': 35}


### Actualizar (Update)

In [14]:
# Actualizar un documento existente
query = {"name": "Ejemplo"}
new_values = {"$set": {"age": 35}}
collection.update_one(query, new_values)

<pymongo.results.UpdateResult at 0x7f16c2f76ad0>

### Eliminar (Delete)

In [17]:
# Eliminar un documento
query = {"name": "Ejemplo"}
collection.delete_one(query)

<pymongo.results.DeleteResult at 0x7f16c2c63d00>

### Crear varios documentos (Create - Many)

In [19]:
# Datos a insertar
data_list = [
    {"name": "Persona1", "age": 25},
    {"name": "Persona2", "age": 30},
    {"name": "Persona3", "age": 35}
]

# Insertar varios documentos en la colección
result = collection.insert_many(data_list)
print(f"Documentos insertados con IDs: {result.inserted_ids}")

Documentos insertados con IDs: [ObjectId('653fb8637b6f6aa49aae6a2a'), ObjectId('653fb8637b6f6aa49aae6a2b'), ObjectId('653fb8637b6f6aa49aae6a2c')]


### Leer varios documentos (Read - Many)

In [25]:
# Leer documentos que cumplen un cierto criterio (por ejemplo, mayores de 30 años)
query = {"age": {"$gt": 20}}
documents = collection.find(query)

for doc in documents:
    print(doc)

{'_id': ObjectId('653fb5257b6f6aa49aae6a29'), 'name': 'Jorge', 'age': 30}
{'_id': ObjectId('653fb8637b6f6aa49aae6a2a'), 'name': 'Persona1', 'age': 25}
{'_id': ObjectId('653fb8637b6f6aa49aae6a2b'), 'name': 'Persona2', 'age': 30}
{'_id': ObjectId('653fb8637b6f6aa49aae6a2c'), 'name': 'Persona3', 'age': 35, 'status': 'Mayor'}


### Actualizar varios documentos (Update - Many)

In [26]:
# Actualizar varios documentos que cumplen un cierto criterio
query = {"age": {"$gt": 30}}
new_values = {"$set": {"status": "Mayor"}}
result = collection.update_many(query, new_values)
print(f"{result.modified_count} documentos actualizados")

0 documentos actualizados


### Eliminar varios documentos (Delete - Many)

In [28]:
# Eliminar varios documentos que cumplen un cierto criterio
query = {"status": "Mayor"}
result = collection.delete_many(query)
print(f"{result.deleted_count} documentos eliminados")

0 documentos eliminados


### REGEX EXPRESIONES LIKE

In [31]:
# Expresión regular para buscar nombres que comiencen con "P" y terminen en un número
result = collection.find({"name": {"$regex": r'^P.*\d$'}})

# Recorre los resultados
for doc in result:
    print(doc)

{'_id': ObjectId('653fb8637b6f6aa49aae6a2a'), 'name': 'Persona1', 'age': 25}
{'_id': ObjectId('653fb8637b6f6aa49aae6a2b'), 'name': 'Persona2', 'age': 30}


## Mongo Engine

In [33]:
!pip install mongoengine

Collecting mongoengine
  Downloading mongoengine-0.27.0-py3-none-any.whl (110 kB)
[2K     [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m110.6/110.6 kB[0m [31m229.8 kB/s[0m eta [36m0:00:00[0m kB/s[0m eta [36m0:00:01[0m:01[0m
Installing collected packages: mongoengine
Successfully installed mongoengine-0.27.0

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.2.1[0m[39;49m -> [0m[32;49m23.3.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


In [35]:
# Paso 1: Importamos las bibliotecas necesarias
from mongoengine import Document, StringField, IntField, ReferenceField, connect

# Paso 2: Nos conectamos a la base de datos MongoDB
connect('mydatabase', host='mongodb://localhost:27017')

# Paso 3: Definimos los modelos de documentos

# Creamos un modelo para Usuarios (User)
class User(Document):
    username = StringField(required=True, max_length=100)

# Creamos un modelo para Publicaciones (Post)
class Post(Document):
    title = StringField(required=True, max_length=100)
    content = StringField(required=True)
    author = ReferenceField(User)

# Creamos un modelo para Comentarios (Comment)
class Comment(Document):
    text = StringField(required=True)
    author = ReferenceField(User)
    post = ReferenceField(Post)

In [36]:
# Paso 4: Creamos instancias de los modelos

# Creamos usuarios
user1 = User(username="user1").save()
user2 = User(username="user2").save()

# Creamos publicaciones
post1 = Post(title="Post 1", content="Contenido del Post 1", author=user1).save()
post2 = Post(title="Post 2", content="Contenido del Post 2", author=user2).save()

# Creamos comentarios
comment1 = Comment(text="Comentario en Post 1", author=user1, post=post1).save()
comment2 = Comment(text="Comentario en Post 2", author=user2, post=post2).save()
comment3 = Comment(text="Comentario en Post 2", author=user2, post=post2).save()
comment3 = Comment(text="Comentario en Post 2", author=user2, post=post2).save()

In [37]:
# Paso 5: Actualizamos y eliminamos documentos

# Actualizamos un usuario
user_to_update = User.objects(username="user1").first()
user_to_update.username = "new_user1"
user_to_update.save()

# Eliminamos un comentario
comment_to_delete = Comment.objects(text="Comentario en Post 2").first()
comment_to_delete.delete()

In [39]:
# Paso 6: Realizamos consultas

# Consultamos el usuario actualizado
updated_user = User.objects(username="user2").first()
# Consultamos las publicaciones del usuario
posts = Post.objects(author=updated_user)
# Consultamos los comentarios del usuario
comments = Comment.objects(author=updated_user)

# Paso 7: Mostramos resultados

print(f"Usuario actualizado: {updated_user.username}")
print("Publicaciones:")
for post in posts:
    print(f"- {post.title}: {post.content}")

print("Comentarios:")
for comment in comments:
    print(f"- {comment.text} en el post '{comment.post.title}'")

Usuario actualizado: user2
Publicaciones:
- Post 2: Contenido del Post 2
Comentarios:
- Comentario en Post 2 en el post 'Post 2'
- Comentario en Post 2 en el post 'Post 2'


### Mongo Shell

- `docker exec -it mongo bash`
- `mongosh`
- `show dbs`
- `use mydatabase`
- `show collections`
- `db.mycollection.find({})`

## Restaurantes ejemplo

In [42]:
import json
import pymongo

# Establece la conexión con el servidor de MongoDB (asegúrate de tener un servidor MongoDB en ejecución)
client = pymongo.MongoClient("mongodb://localhost:27017/")

# Selecciona la base de datos (o créala si no existe)
db = client["mydatabase"]

# Selecciona la colección en la que deseas insertar los datos
collection = db["restaurants"]

# Abre el archivo JSON y procesa cada línea como un objeto JSON
with open("restaurants.json", "r") as file:
    for line in file:
        try:
            data = json.loads(line)
            collection.insert_one(data)
        except json.JSONDecodeError as e:
            print(f"Error al cargar una línea: {e}")

In [58]:
count = collection.count_documents({})
print(f"Total de documentos en la colección: {count}")

Total de documentos en la colección: 3772


In [59]:
# Utiliza el método `find` con un filtro para obtener documentos con 'borough' igual a 'Brooklyn'
documents = collection.find({"borough": "Brooklyn", 'cuisine': 'Hamburgers'})

# Itera a través de los documentos que cumplen con el filtro e imprímelos con formato JSON indentado
for document in documents:
    # Utiliza json.dumps para imprimir el documento indentado
    print(document)

{'_id': ObjectId('653ff44b7b6f6aa49aae6a39'), 'address': {'building': '469', 'coord': [-73.961704, 40.662942], 'street': 'Flatbush Avenue', 'zipcode': '11225'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'grades': [{'date': {'$date': 1419897600000}, 'grade': 'A', 'score': 8}, {'date': {'$date': 1404172800000}, 'grade': 'B', 'score': 23}, {'date': {'$date': 1367280000000}, 'grade': 'A', 'score': 12}, {'date': {'$date': 1336435200000}, 'grade': 'A', 'score': 12}], 'name': "Wendy'S", 'restaurant_id': '30112340'}
{'_id': ObjectId('653ff44b7b6f6aa49aae6a52'), 'address': {'building': '531', 'coord': [-73.9634876, 40.6940001], 'street': 'Myrtle Avenue', 'zipcode': '11205'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'grades': [{'date': {'$date': 1395100800000}, 'grade': 'A', 'score': 8}, {'date': {'$date': 1363564800000}, 'grade': 'A', 'score': 8}, {'date': {'$date': 1349827200000}, 'grade': 'A', 'score': 7}, {'date': {'$date': 1316649600000}, 'grade': 'A', 'score': 2}], 'name': 'Wh

In [60]:
# Ahora con un nuevo diccionario para mostrar solo los campos con 1
documents = collection.find(
    {"borough": "Brooklyn", "cuisine": "Hamburgers"},
    {"name": 1, "address.street": 1, "address.coord": 1, 'borough': 1, 'cuisine': 1}
)

# Itera a través de los documentos que cumplen con el filtro y proyección e imprímelos
for document in documents:
    print(document)

{'_id': ObjectId('653ff44b7b6f6aa49aae6a39'), 'address': {'coord': [-73.961704, 40.662942], 'street': 'Flatbush Avenue'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': "Wendy'S"}
{'_id': ObjectId('653ff44b7b6f6aa49aae6a52'), 'address': {'coord': [-73.9634876, 40.6940001], 'street': 'Myrtle Avenue'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': 'White Castle'}
{'_id': ObjectId('653ff44c7b6f6aa49aae6b07'), 'address': {'coord': [-73.95802549999999, 40.6487475], 'street': 'Flatbush Avenue'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': "Mcdonald'S"}
{'_id': ObjectId('653ff44c7b6f6aa49aae6b42'), 'address': {'coord': [-73.9808063, 40.6895078], 'street': 'Flatbush Avenue Extension'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': "Mcdonald'S"}
{'_id': ObjectId('653ff44c7b6f6aa49aae6b49'), 'address': {'coord': [-73.9321666, 40.6632351], 'street': 'Empire Boulevard'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': 'White Castle'}
{'_id': ObjectI

In [62]:
# Tambien podemos excluir con 0
documents = collection.find(
    {"borough": "Brooklyn", "cuisine": "Hamburgers"},
    {"_id": 0,"name": 1, "address.street": 1, "address.coord": 1, 'borough': 1, 'cuisine': 1}
)

# Itera a través de los documentos que cumplen con el filtro y proyección e imprímelos
for document in documents:
    print(document)

{'address': {'coord': [-73.961704, 40.662942], 'street': 'Flatbush Avenue'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': "Wendy'S"}
{'address': {'coord': [-73.9634876, 40.6940001], 'street': 'Myrtle Avenue'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': 'White Castle'}
{'address': {'coord': [-73.95802549999999, 40.6487475], 'street': 'Flatbush Avenue'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': "Mcdonald'S"}
{'address': {'coord': [-73.9808063, 40.6895078], 'street': 'Flatbush Avenue Extension'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': "Mcdonald'S"}
{'address': {'coord': [-73.9321666, 40.6632351], 'street': 'Empire Boulevard'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': 'White Castle'}
{'address': {'coord': [-73.993031, 40.6417669], 'street': 'Ft Hamilton Parkway'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': 'White Castle'}
{'address': {'coord': [-73.9308722, 40.656262], 'street': 'Utica Avenue'}, 'borough': 

In [63]:
# También podemos limitar los resutados
# Tambien podemos excluir con 0
documents = collection.find(
    {"borough": "Brooklyn", "cuisine": "Hamburgers"},
    {"_id": 0,"name": 1, "address.street": 1, "address.coord": 1, 'borough': 1, 'cuisine': 1}
).limit(5)

# Itera a través de los documentos que cumplen con el filtro y proyección e imprímelos
for document in documents:
    print(document)

{'address': {'coord': [-73.961704, 40.662942], 'street': 'Flatbush Avenue'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': "Wendy'S"}
{'address': {'coord': [-73.9634876, 40.6940001], 'street': 'Myrtle Avenue'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': 'White Castle'}
{'address': {'coord': [-73.95802549999999, 40.6487475], 'street': 'Flatbush Avenue'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': "Mcdonald'S"}
{'address': {'coord': [-73.9808063, 40.6895078], 'street': 'Flatbush Avenue Extension'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': "Mcdonald'S"}
{'address': {'coord': [-73.9321666, 40.6632351], 'street': 'Empire Boulevard'}, 'borough': 'Brooklyn', 'cuisine': 'Hamburgers', 'name': 'White Castle'}


In [65]:
# Utiliza el método `find` con un filtro para obtener documentos con 'score' mayor a 90
documents = collection.find(
    {"grades.score": {"$gt": 90}}, 
    {"_id": 0,"name": 1, "address.street": 1, "address.coord": 1, 'borough': 1, 'cuisine': 1}
)

# Itera a través de los documentos que cumplen con el filtro e imprímelos
for document in documents:
    print(document)

{'address': {'coord': [-73.9782725, 40.7624022], 'street': 'West   54 Street'}, 'borough': 'Manhattan', 'cuisine': 'American ', 'name': "Murals On 54/Randolphs'S"}
{'address': {'coord': [-73.9864626, 40.7266739], 'street': 'East 6 Street'}, 'borough': 'Manhattan', 'cuisine': 'Indian', 'name': 'Gandhi'}
{'address': {'coord': [-73.984758, 40.7457939], 'street': 'Madison Avenue'}, 'borough': 'Manhattan', 'cuisine': 'Pizza/Italian', 'name': 'Bella Napoli'}


### Practica

Recupera y muestra los nombres, direcciones y coordenadas de restaurantes en el Bronx que sirvan comida italiana ('cuisine') y tengan un puntaje ('score') mayor a 20 en sus calificaciones, utilizando el método find de MongoDB con un filtro específico.

In [74]:
# Utiliza el método `find` con un filtro para obtener documentos con 'cuisine' igual a 'Italian' y 'borough' igual a 'Brooklyn'
documents = collection.find(
    {"grades.score": {"$gt": 20}, "cuisine": "Italian", "borough": "Bronx"},
    {"_id": 0, "name": 1, "address.street": 1, "address.coord": 1}
)

# Itera a través de los documentos que cumplen con el filtro e imprímelos
for document in documents:
    print(document)

{'address': {'coord': [-73.8177658, 40.8204314], 'street': 'East Tremont Avenue'}, 'name': "Spoto'S Restaurant"}
{'address': {'coord': [-73.8189257, 40.82115659999999], 'street': 'East Tremont Avenue'}, 'name': "Rino'S"}
{'address': {'coord': [-73.8889027, 40.8543105], 'street': 'Arthur Avenue'}, 'name': "Dominick'S Bar & Restaurant"}
{'address': {'coord': [-73.8887814, 40.85436720000001], 'street': 'Arthur Avenue'}, 'name': 'Enzo Cafe'}
{'address': {'coord': [-73.78706799999999, 40.8496359], 'street': 'City Island Avenue'}, 'name': "Artie'S"}
{'address': {'coord': [-73.8892497, 40.8537883], 'street': 'Arthur Avenue'}, 'name': 'Pasquale Rigoletto Restaurant'}
