In [None]:
from pymongo import MongoClient

client = MongoClient('localhost', 27017, username='root', password='example')

db = client['quiz']

users_collecition = db['users']

In [None]:
from itertools import islice
import json
from datetime import datetime

with open ('data.jsonl', 'r') as f:
    for line in islice(f, 40):
        data = json.loads(line)
        data['post']['timestamp'] = datetime.fromisoformat(data['post']['timestamp'])
        for comment in data['comments']:
            comment['comment']['timestamp'] = datetime.fromisoformat(comment['comment']['timestamp'])
        
        users_collecition.insert_one(data)


1. Operaciones CRUD básicas (Crear, Leer, Actualizar, Eliminar)

In [3]:
# 1. Insertar 5 nuevos documentos de usuario con datos únicos.
doc1 = {"user": "Jerson", "user_age": 21, "user_email": "jerson@gmail.com"}
doc2 = {"user": "Carlos", "user_age": 22, "user_email": "carlos@gmail.com"}
doc3 = {"user": "Luis", "user_age": 23, "user_email": "luis@gmail.com"}
doc4 = {"user": "Pedro", "user_age": 24, "user_email": "pedro@gmail.com"}
doc5 = {"user": "Maria", "user_age": 35, "user_email": "maria@gmail.com"}

# insertar documentos a la colección
users_collecition.insert_one(doc1)
users_collecition.insert_one(doc2)
users_collecition.insert_one(doc3)
users_collecition.insert_one(doc4)
users_collecition.insert_one(doc5)

InsertOneResult(ObjectId('65f1098b4da40f1600c11cd6'), acknowledged=True)

In [None]:
# 2. Buscar todos los usuarios con edad mayor a 25.


In [41]:
# 3. Buscar un usuario por dirección de correo electrónico.
email_to_find = "jerson@gmail.com"

query = {"user_email": email_to_find}
result = users_collecition.find_one(query)
if result:
    print("Usuario encontrado:")
    print(result)
else:
    print("No se encontró ningún usuario con ese correo electrónico.")


Usuario encontrado:
{'_id': ObjectId('65f1098b4da40f1600c11cd2'), 'user': 'Jerson', 'user_age': 21, 'user_email': 'jerson@gmail.com'}


In [None]:
# 4. Actualizar el contenido de la publicación de un usuario específico.

In [None]:
# 5. Eliminar un documento de usuario y todos sus comentarios asociados.

2. Consultas con operadores

In [None]:
# 1. Buscar todos los usuarios cuyo nombre de usuario contenga la palabra S̈mith.̈ (Expresiones regulares)

In [None]:
# 2. Buscar publicaciones creadas después de una fecha específica (por ejemplo, 2000-01-01).
from datetime import datetime
fecha_especifica = datetime(2014, 1, 1)
query = {"post.timestamp": {"$gt": fecha_especifica}}
result = users_collecition.find(query)

print("Publicaciones creadas después de", fecha_especifica)
for post in result:
    print(post)


In [None]:
# 3. Buscar usuarios que aún no han publicado ningún comentario

In [34]:
# 4. Encontrar la edad promedio de todos los usuarios.
pipeline = [
    {
        "$group": {
            "_id": None,
            "total_users": {"$sum": 1},
            "total_age": {"$sum": "$user_age"}
        }
    },
    {
        "$project": {
            "_id": 0,
            "average_age": {"$divide": ["$total_age", "$total_users"]}
        }
    }
]

result = users_collecition.aggregate(pipeline)

average_age = list(result)[0]["average_age"]
print("Edad promedio de todos los usuarios:", average_age)


Edad promedio de todos los usuarios: 28.1


In [None]:
# 5. Buscar documentos donde la longitud del contenido de la publicación sea superior a 100 caracteres

3. Operadores lógicos y proyección

In [None]:
# 1. Buscar usuarios que tengan más de 20 años pero menos de 30. (Combinar operadores)

In [None]:
# 2. Recuperar solo el nombre de usuario y la edad del usuario de todos los documentos. (Proyección)

In [None]:
# 3. Buscar todas las publicaciones y excluir el campo ”comentarios”

In [None]:
# 4. Buscar usuarios con al menos un comentario en su matriz ”comentarios”

In [None]:
# 5. Buscar comentarios publicados por usuarios mayores de 40 años. (Consultas anidadas)
query = {
    "comments": {
        "$elemMatch": {
            "user_age": {"$gt": 40}
        }
    }
}

result = users_collecition.find(query)

# Iterar sobre los resultados
print("Comentarios de usuarios mayores de 40 años:")
for user in result:
    for comment in user['comments']:
        if comment['user_age'] > 40:
            print(comment)


4. Ordenar y limitar

In [10]:
# 1. Ordenar todos los usuarios por edad en orden descendente.



Collection(Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'quiz'), "users.Collection(Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'quiz'), 'users')")


In [None]:
# 2. Buscar los 3 usuarios principales con las publicaciones más recientes (en función de la marca de tiempo).

In [None]:
# 3. Omitir los primeros 5 resultados y recuperar los próximos 10 usuarios.
result = users_collecition.find().skip(5).limit(10)
print("Próximos 10 usuarios después de omitir los primeros 5:")
for user in result:
    print(user)


5. Marco de agregación

In [None]:
# 1. Utilizar el pipeline de agregación para calcular el número total de usuarios

In [None]:
# 2. Encontrar al usuario con el contenido de publicación más largo (en función del número de caracteres).
pipeline = [
    {"$unwind": "$posts"}, 
    {"$group": {
        "_id": "$user",
        "max_post_length": {"$max": {"$strLenCP": "$posts.content"}}
    }},
    {"$sort": {"max_post_length": -1}},
    {"$limit": 1}  
]
result = users_collecition.aggregate(pipeline)
print("Usuario con la publicación más larga:")
for user in result:
    print(user) 






In [None]:
# 3. Agrupar a los usuarios por edad y contar la cantidad de usuarios en cada grupo de edad.

In [None]:
# 4. Calcular la longitud promedio de los comentarios en todos los comentarios.

In [None]:
# 5. Cambiar la forma como se presentan los datos, de tal forma que cada usuario tenga la lista de todos
# los posts asociados a él. No se deben agregar el detalle de los comentarios, solo un nuevo campo con
# el total de comentarios.

6. Actualización y eliminación con operadores

In [None]:
# 1. Incrementar la edad de todos los usuarios en 1.


In [None]:
# 2. Establecer el campo ”contenido” de una publicación específica en una cadena vacía

In [None]:
# 3. Eliminar todos los comentarios de la publicación de un usuario
usuario = "Joann Bowen"  
titulo_publicacion = "Random title for Joann Bowen"  
query = {
    "user": usuario, 
    "post.title": titulo_publicacion  
}

update_query = {
    "$set": {
        "comments": []  
    }
}
result = users_collecition.update_many(query, update_query)
print("Número de comentarios eliminados:", result.modified_count)


In [None]:
# 4. Eliminar todos los usuarios con direcciones de correo electrónico que terminen en ”@example.org”.
query = {
    "user_email": {"$regex": r"@example\.org$"} 
}

result = users_collecition.delete_many(query)
print("Número de usuarios eliminados:", result.deleted_count)
                                                                                    #Elimina terminados en @example.org, no @example.com ni @example.net


7. Indexación y optimización avanzadas

In [None]:
# 1. Crear un índice en el campo ”user_email” para búsquedas de correo electrónico más rápidas.

In [None]:
# 2. Explicar el plan de consulta para encontrar usuarios con edad mayor a 30



#
#La consulta para encontrar usuarios con edad mayor a 30 en sintaxis de MongoDB puede verse de la siguiente manera:
#                                                   query = {"user_age": {"$gt": 30}}
#


#Plan de consulta:
#Cuando ejecutamos esta consulta MongoDB utilizará el índice creado en el campo "user_age" para optimizar la búsqueda, lo que mejora su rendimiento y permite obtener resultados de forma eficiente
#   MongoDB buscará en el índice de user_age los valores que son mayores a 30.
#   Después usará estos valores del índice para acceder directamente a los documentos que satisfacen la condición de la consulta.
#   Finalmente, MongoDB devolverá los documentos encontrados que cumplan con el criterio de búsqueda.



In [None]:
#3. Discutir las ventajas y desventajas de almacenar comentarios dentro del documento de usuario.
