In [1]:
import pymongo

# Establecer conexión
client = pymongo.MongoClient("mongodb://usuario:micontraseña@localhost:27017/")
db = client["analisis_datos"]
coleccion = db["productos"]

# Insertar un documento
producto = {
    "nombre": "Teclado Mecánico",
    "categoria": "Accesorios",
    "precio": 129.99,
    "stock": 15
}
resultado = coleccion.insert_one(producto)
print(f"ID del nuevo documento: {resultado.inserted_id}")

# Consultar documentos
for producto in coleccion.find({"categoria": "Accesorios"}):
    print(f"{producto['nombre']}: ${producto['precio']}")

# Cerrar conexión
client.close()

ID del nuevo documento: 6818e6b744e9ca062a5a4ecd
Mouse Ergonómico: $49.99
Teclado Mecánico: $129.99


In [None]:
import pymongo

# Establecer conexión
client = pymongo.MongoClient("mongodb://usuario:micontraseña@localhost:27017/")
db = client["analisis_datos"]
coleccion = db["productos"]

# Consultar documentos
for producto in coleccion.find():
    print(f"{producto['nombre']}: ${producto['precio']}")

# Cerrar conexión
client.close()

Laptop ProX: $1199.99
Mouse Ergonómico: $49.99
Laptop 2: $500
Teclado Mecánico: $129.99


In [7]:
from mongoengine import Document, StringField, FloatField, IntField, connect

# Conectar a la base de datos
connect('analisis_datos', host='mongodb://usuario:micontraseña@localhost:27017/analisis_datos?authSource=admin')

# Definir una clase para documentos
class Producto(Document):
    nombre = StringField(required=True, max_length=200)
    categoria = StringField(required=True)
    precio = FloatField(required=True)
    stock = IntField(default=0)

    meta = {'collection': 'productos'}

# Crear y guardar un documento
nuevo_producto = Producto(
    nombre="Teclado Mecánico 2",
    categoria="Accesorios",
    precio=200,
    stock=15
)
nuevo_producto.save()
print(f"ID del nuevo documento: {nuevo_producto.id}")

# Consultar documentos
accesorios = Producto.objects(categoria="Accesorios")
for producto in accesorios:
    print(f"{producto.nombre}: ${producto.precio}")


ID del nuevo documento: 6818ed3a44e9ca062a5a4ed4
Mouse Ergonómico: $49.99
Teclado Mecánico: $129.99
Teclado Mecánico 2: $200.0


In [6]:
from mongoengine import disconnect
disconnect()

In [8]:
import pymongo
from pymongo import MongoClient

# Parámetros de conexión
params = {
    'host': 'localhost',
    'port': 27017,
    'username': 'usuario',
    'password': 'micontraseña',
    'authSource': 'admin'
}

# Establecer conexión
try:
    # Conexión con parámetros individuales
    client = MongoClient(
        host=params['host'],
        port=params['port'],
        username=params['username'],
        password=params['password'],
        authSource=params['authSource']
    )

    # Alternativamente, conexión con URI
    # client = MongoClient(f"mongodb://{params['username']}:{params['password']}@{params['host']}:{params['port']}/{params['authSource']}")

    # Verificar conexión
    client.admin.command('ping')
    print("Conexión establecida correctamente!")

    # Operaciones con la base de datos
    # ...

    # Cerrar conexión
    client.close()
except Exception as e:
    print(f"Error al conectar: {e}")


Conexión establecida correctamente!


In [1]:
from pymongo import MongoClient
from contextlib import contextmanager

@contextmanager
def get_mongo_client(connection_string):
    client = MongoClient(connection_string)
    try:
        yield client
    finally:
        print('Cerrando conexión ...')
        client.close()

# Uso del context manager
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    productos = db.productos.find()
    for producto in productos:
        print(f"{producto['nombre']}: ${producto['precio']}")


Ultrabook Pro X5: $1299.99
Monitor UltraWide 34: $449.99
Teclado Mecánico RGB: $129.99
Teléfono UltraClear 12: $899.99
Tarjeta Gráfica Pro Gaming: $799.99
Disco SSD Ultra Rápido: $199.99
Router Mesh Premium: $249.99
Cerrando conexión ...


In [13]:
# Insertar un solo documento
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    resultado = db.productos.insert_one({
        "nombre": "Monitor UltraHD",
        "categoria": "Electrónicos",
        "precio": 349.99,
        "stock": 8,
        "especificaciones": {
            "tamaño": "27 pulgadas",
            "resolución": "3840x2160",
            "tipo": "IPS"
        }
    })
    print(f"ID del documento insertado: {resultado.inserted_id}")

ID del documento insertado: 6818f06144e9ca062a5a4edc
Cerrando conexión ...


In [14]:
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    # Encontrar un solo documento
    producto = db.productos.find_one({"nombre": "Monitor UltraHD"})
    if producto:
        print(f"Producto encontrado: {producto['nombre']} - ${producto['precio']}")

    # Encontrar múltiples documentos con filtros
    query = {"categoria": "Electrónicos", "precio": {"$lt": 500}}
    productos = db.productos.find(query).sort("precio", -1)
    print("Productos electrónicos por debajo de $500:")
    for producto in productos:
        print(f"- {producto['nombre']}: ${producto['precio']}")

    # Proyección: seleccionar solo ciertos campos
    productos = db.productos.find(
        {"stock": {"$gt": 0}},
        {"nombre": 1, "precio": 1, "stock": 1, "_id": 0}
    )
    print("\nProductos en stock (solo nombre, precio y cantidad):")
    for producto in productos:
        print(f"- {producto['nombre']}: ${producto['precio']} ({producto['stock']} unidades)")

    # Consultas avanzadas con operadores
    clientes_tech = db.clientes.find({"intereses": {"$in": ["tecnología"]}})
    print("\nClientes interesados en tecnología:")
    for cliente in clientes_tech:
        print(f"- {cliente['nombre']} ({cliente['email']})")

Producto encontrado: Monitor UltraHD - $349.99
Productos electrónicos por debajo de $500:
- Monitor UltraHD: $349.99
- Monitor UltraHD: $349.99

Productos en stock (solo nombre, precio y cantidad):
- Laptop ProX: $1199.99 (15 unidades)
- Mouse Ergonómico: $49.99 (25 unidades)
- Teclado Mecánico: $129.99 (15 unidades)
- Teclado Mecánico 2: $200.0 (15 unidades)
- Monitor UltraHD: $349.99 (8 unidades)
- Monitor UltraHD: $349.99 (8 unidades)

Clientes interesados en tecnología:
- Ana García (ana@ejemplo.com)
Cerrando conexión ...


In [15]:
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    # Actualizar un solo documento
    resultado = db.productos.update_one(
        {"nombre": "Monitor UltraHD"},
        {"$set": {"precio": 329.99, "promocion": True}}
    )
    print(f"Documentos modificados: {resultado.modified_count}")

    # Actualizar múltiples documentos
    resultado = db.productos.update_many(
        {"categoria": "Electrónicos", "promocion": {"$exists": False}},
        {"$set": {"promocion": False}}
    )
    print(f"Electrónicos actualizados: {resultado.modified_count}")

    # Operadores de actualización
    # $inc para incrementar valores
    db.productos.update_one(
        {"nombre": "Monitor UltraHD"},
        {"$inc": {"stock": -1}}  # Reducir stock en 1
    )

    # $push para añadir a arrays
    db.clientes.update_one(
        {"email": "laura@ejemplo.com"},
        {"$push": {"intereses": "deportes"}}
    )

    # Upsert (insertar si no existe)
    db.productos.update_one(
        {"sku": "MON-UHD-27"},  # Documento que quizás no existe
        {"$set": {"nombre": "Monitor UltraHD", "sku": "MON-UHD-27"}},
        upsert=True
    )

Documentos modificados: 1
Electrónicos actualizados: 3
Cerrando conexión ...


In [16]:
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos  
    # Eliminar un solo documento
    resultado = db.clientes.delete_one({"email": "elena@ejemplo.com"})
    print(f"Documentos eliminados: {resultado.deleted_count}")

    # Eliminar múltiples documentos
    resultado = db.productos.delete_many({"stock": 0, "descontinuado": True})
    print(f"Productos obsoletos eliminados: {resultado.deleted_count}")

    # Eliminar colección
    db.temp_collection.drop()

Documentos eliminados: 1
Productos obsoletos eliminados: 0
Cerrando conexión ...


Conexión y Operaciones CRUD Básicas
Objetivo: Conectar a MongoDB, crear una colección y realizar operaciones CRUD básicas.
Tareas:

Establece una conexión a tu base de datos MongoDB utilizando PyMongo
Crea una colección llamada "libros"
Inserta al menos 5 documentos de libros con campos como: título, autor, año de publicación, género y precio
Busca todos los libros de un género específico
Actualiza el precio de un libro
Elimina un libro por su título
Muestra todos los libros ordenados por año de publicación

In [None]:
from pymongo import MongoClient
from contextlib import contextmanager

@contextmanager
def get_mongo_client(connection_string):
    client = MongoClient(connection_string)
    try:
        yield client
    finally:
        print('Cerrando conexión ...')
        client.close()

# Uso del context manager
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos

    coleccion = db['libros']

    libros = [
        {
            "titulo": "La sombra del viento",
            "autor": "Carlos Ruiz Zafón",
            "año": 2001,
            "genero": "Novela histórica",
            "precio": 22.50,
            "editorial": "Planeta",
            "ciudad": "Barcelona"
        },
        {
            "titulo": "Patria",
            "autor": "Fernando Aramburu",
            "año": 2016,
            "genero": "Novela social",
            "precio": 21.90,
            "editorial": "Tusquets",
            "ciudad": "Barcelona"
        },
        {
            "titulo": "Nada",
            "autor": "Carmen Laforet",
            "año": 1944,
            "genero": "Novela",
            "precio": 18.50,
            "editorial": "Destino",
            "ciudad": "Madrid"
        },
        {
            "titulo": "Fortunata y Jacinta",
            "autor": "Benito Pérez Galdós",
            "año": 1887,
            "genero": "Novela realista",
            "precio": 24.00,
            "editorial": "Cátedra",
            "ciudad": "Madrid"
        },
        {
            "titulo": "Luces de bohemia",
            "autor": "Ramón María del Valle-Inclán",
            "año": 1924,
            "genero": "Teatro",
            "precio": 15.95,
            "editorial": "Espasa",
            "ciudad": "Madrid"
        }
    ]
   
    resultado = db.libros.insert_many(libros)
    print(f"IDs de documentos insertados: {resultado.inserted_ids}")



IDs de documentos insertados: [ObjectId('6818f87744e9ca062a5a4ef3'), ObjectId('6818f87744e9ca062a5a4ef4'), ObjectId('6818f87744e9ca062a5a4ef5'), ObjectId('6818f87744e9ca062a5a4ef6'), ObjectId('6818f87744e9ca062a5a4ef7')]
Cerrando conexión ...


In [30]:
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    query = {"genero": "Teatro"}
    libros = db.libros.find(query)
    print("LIbros de género Teatro")
    for libro in libros:
        print(f"- {libro['titulo']}: ${libro['precio']}")

LIbros de género Teatro
- Luces de bohemia: $19.95
Cerrando conexión ...


In [29]:
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    resultado = db.libros.update_one(
        {"titulo": "Luces de bohemia"},
        {"$set": {"precio": 19.95, "promocion": True}}
    )
    print(f"Documentos modificados: {resultado.modified_count}")

Documentos modificados: 1
Cerrando conexión ...


In [31]:
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    resultado = db.libros.delete_one({"titulo": "Fortunata y Jacinta"})
    print(f"Documentos eliminados: {resultado.deleted_count}")

Documentos eliminados: 1
Cerrando conexión ...


In [2]:
# 5. LEER: Mostrar todos los libros ordenados por año
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    print("\nLibros españoles ordenados por año de publicación:")
    libros = coleccion.find().sort("año", 1)  # 1 para ascendente
    for libro in libros:
        print(f"{libro['año']} - '{libro['titulo']}' por {libro['autor']} (Editorial: {libro['editorial']}, {libro['precio']}€)")

NameError: name 'get_mongo_client' is not defined

In [1]:
from pymongo import MongoClient
import re
import random
from datetime import datetime, timedelta
import pprint

# Establecer conexión a MongoDB
try:
    client = MongoClient(
        host='localhost',
        port=27017,
        username='usuario',
        password='micontraseña',
        authSource='admin'
    )
    
    # Verificar la conexión
    client.admin.command('ping')
    print("Conexión exitosa a MongoDB")
    
    # Seleccionar base de datos
    db = client['analisis_datos']
    
    # 1. CREAR COLECCIÓN DE PRODUCTOS
    productos_collection = db['productos']
    productos_collection.drop()  # Limpiar colección existente
    
    # Crear productos con descripciones detalladas
    productos = [
        {
            "nombre": "Ultrabook Pro X5",
            "categoria": "Portátiles",
            "precio": 1299.99,
            "stock": 25,
            "descripcion": "Portátil ultraligero de alta calidad con procesador i7 y pantalla 4K"
        },
        {
            "nombre": "Monitor UltraWide 34",
            "categoria": "Monitores",
            "precio": 449.99,
            "stock": 15,
            "descripcion": "Monitor de alta resolución con excelente calidad de imagen y tecnología HDR"
        },
        {
            "nombre": "Teclado Mecánico RGB",
            "categoria": "Periféricos",
            "precio": 129.99,
            "stock": 50,
            "descripcion": "Teclado mecánico resistente con retroiluminación RGB personalizable"
        },
        {
            "nombre": "Teléfono UltraClear 12",
            "categoria": "Smartphones",
            "precio": 899.99,
            "stock": 30,
            "descripcion": "Smartphone con cámara de alta resolución y batería de larga duración"
        },
        {
            "nombre": "Tarjeta Gráfica Pro Gaming",
            "categoria": "Componentes",
            "precio": 799.99,
            "stock": 10,
            "descripcion": "Tarjeta gráfica de alta calidad para gaming profesional con 12GB VRAM"
        },
        {
            "nombre": "Disco SSD Ultra Rápido",
            "categoria": "Almacenamiento",
            "precio": 199.99,
            "stock": 40,
            "descripcion": "Disco SSD de alta velocidad y resistente para uso intensivo"
        },
        {
            "nombre": "Router Mesh Premium",
            "categoria": "Redes",
            "precio": 249.99,
            "stock": 20,
            "descripcion": "Sistema de red mesh de alta calidad para cobertura completa del hogar"
        }
    ]
    
    # Insertar productos y crear índice de texto en descripción
    productos_collection.insert_many(productos)
    productos_collection.create_index([("descripcion", "text")])
    print(f"Se insertaron {len(productos)} productos y se creó un índice de texto")
    
    # 2. CREAR COLECCIÓN DE TIENDAS CON COORDENADAS GEOESPACIALES
    tiendas_collection = db['tiendas']
    tiendas_collection.drop()  # Limpiar colección existente
    
    # Crear tiendas con ubicaciones geoespaciales
    tiendas = [
        {
            "nombre": "Electrónica Central",
            "direccion": "Calle Mayor 123, Madrid",
            "ubicacion": {
                "type": "Point",
                "coordinates": [-3.7037902, 40.4167754]  # Madrid
            },
            "telefono": "+34 91 123 4567",
            "horario": "9:00-20:00"
        },
        {
            "nombre": "TechShop Barcelona",
            "direccion": "Passeig de Gràcia 101, Barcelona",
            "ubicacion": {
                "type": "Point",
                "coordinates": [2.1686, 41.3874]  # Barcelona
            },
            "telefono": "+34 93 456 7890",
            "horario": "10:00-21:00"
        },
        {
            "nombre": "Gadget Store Valencia",
            "direccion": "Avda. del Puerto 27, Valencia",
            "ubicacion": {
                "type": "Point",
                "coordinates": [-0.3773900, 39.4699075]  # Valencia
            },
            "telefono": "+34 96 345 6789",
            "horario": "9:30-20:30"
        },
        {
            "nombre": "TechCorner Sevilla",
            "direccion": "Calle Sierpes 45, Sevilla",
            "ubicacion": {
                "type": "Point",
                "coordinates": [-5.9953403, 37.3890924]  # Sevilla
            },
            "telefono": "+34 95 567 8901",
            "horario": "10:00-20:00"
        },
        {
            "nombre": "Electrobox Bilbao",
            "direccion": "Gran Vía 76, Bilbao",
            "ubicacion": {
                "type": "Point", 
                "coordinates": [-2.9350039, 43.2630126]  # Bilbao
            },
            "telefono": "+34 94 678 9012",
            "horario": "9:00-21:00"
        }
    ]
    
    # Insertar tiendas y crear índice geoespacial
    tiendas_collection.insert_many(tiendas)
    tiendas_collection.create_index([("ubicacion", "2dsphere")])
    print(f"Se insertaron {len(tiendas)} tiendas y se creó un índice geoespacial")
    
    # 3. CREAR COLECCIÓN DE VENTAS CON DATOS TEMPORALES
    ventas_collection = db['ventas']
    ventas_collection.drop()  # Limpiar colección existente
    
    # Generar datos de ventas para los últimos 2 años
    fecha_inicio = datetime.now() - timedelta(days=730)  # 2 años atrás
    regiones = ["Norte", "Sur", "Este", "Oeste", "Centro"]
    estados = ["completado", "pendiente", "cancelado"]
    
    ventas = []
    for _ in range(200):  # Generar 200 ventas
        # Seleccionar un producto aleatorio
        producto = random.choice(productos)
        
        # Generar fecha aleatoria en los últimos 2 años
        dias_aleatorios = random.randint(0, 730)
        fecha_venta = fecha_inicio + timedelta(days=dias_aleatorios)
        
        # Crear documento de venta
        venta = {
            "producto_id": str(producto["_id"]),
            "nombre_producto": producto["nombre"],
            "categoria_producto": producto["categoria"],
            "monto": producto["precio"] * random.randint(1, 3),  # Venta de 1-3 unidades
            "cantidad_productos": random.randint(1, 3),
            "fecha_venta": fecha_venta,
            "region_cliente": random.choice(regiones),
            "estado": random.choices(estados, weights=[0.8, 0.15, 0.05])[0],  # 80% completadas
            "cliente_id": f"CLI{random.randint(1000, 9999)}"
        }
        ventas.append(venta)
    
    # Insertar ventas
    ventas_collection.insert_many(ventas)
    print(f"Se insertaron {len(ventas)} ventas")
    
    # DEMOSTRAR CONSULTAS AVANZADAS
    print("\n--- CONSULTAS AVANZADAS ---")
    
    # 1. Consultas con expresiones regulares
    print("\n1. Productos que contienen 'Ultra' en su nombre:")
    regex_pattern = re.compile('ultra', re.IGNORECASE)
    productos_ultra = list(productos_collection.find({"nombre": regex_pattern}))
    for producto in productos_ultra:
        print(f"- {producto['nombre']} (${producto['precio']})")
    
    # 2. Consultas geoespaciales
    print("\n2. Tiendas cercanas a Madrid (radio de 300km):")
    madrid_coords = [-3.7037902, 40.4167754]
    tiendas_cercanas = list(tiendas_collection.find({
        "ubicacion": {
            "$near": {
                "$geometry": {
                    "type": "Point",
                    "coordinates": madrid_coords
                },
                "$maxDistance": 300000  # 300km
            }
        }
    }))
    for tienda in tiendas_cercanas:
        print(f"- {tienda['nombre']} ({tienda['direccion']})")
    
    # 3. Consultas de texto completo
    print("\n3. Productos relacionados con 'alta calidad':")
    productos_calidad = list(productos_collection.find({"$text": {"$search": "alta calidad"}}))
    for producto in productos_calidad:
        print(f"- {producto['nombre']}: {producto['descripcion']}")
    
    # DEMOSTRAR FRAMEWORK DE AGREGACIÓN
    print("\n--- FRAMEWORK DE AGREGACIÓN ---")
    
    # 1. Pipeline básico: ventas por categoría
    print("\n1. Análisis de ventas por categoría:")
    pipeline = [
        # Etapa 1: Filtrar solo ventas completadas
        {"$match": {"estado": "completado"}},
        
        # Etapa 2: Agrupar por categoría
        {"$group": {
            "_id": "$categoria_producto",
            "total_ventas": {"$sum": "$monto"},
            "cantidad_ventas": {"$sum": 1},
            "promedio_venta": {"$avg": "$monto"}
        }},
        
        # Etapa 3: Ordenar por total de ventas
        {"$sort": {"total_ventas": -1}}
    ]
    
    resultados = ventas_collection.aggregate(pipeline)
    for resultado in resultados:
        print(f"Categoría: {resultado['_id']}")
        print(f"  Total ventas: ${resultado['total_ventas']:,.2f}")
        print(f"  Cantidad: {resultado['cantidad_ventas']}")
        print(f"  Promedio: ${resultado['promedio_venta']:,.2f}")
    
    # 2. Agregación más compleja: análisis de ventas por tiempo y geografía
    print("\n2. Análisis de ventas por región y tiempo:")
    pipeline_complejo = [
        # Etapa 1: Añadir campos calculados para fecha
        {"$addFields": {
            "mes": {"$month": "$fecha_venta"},
            "año": {"$year": "$fecha_venta"}
        }},
        
        # Etapa 2: Filtrar solo ventas completadas
        {"$match": {"estado": "completado"}},
        
        # Etapa 3: Agrupar por región, año y mes
        {"$group": {
            "_id": {
                "region": "$region_cliente",
                "año": "$año",
                "mes": "$mes"
            },
            "total_ventas": {"$sum": "$monto"},
            "cantidad_transacciones": {"$sum": 1},
            "productos_vendidos": {"$sum": "$cantidad_productos"}
        }},
        
        # Etapa 4: Agrupar de nuevo para obtener totales anuales por región
        {"$group": {
            "_id": {
                "region": "$_id.region",
                "año": "$_id.año"
            },
            "ventas_mensuales": {"$push": {
                "mes": "$_id.mes",
                "ventas": "$total_ventas",
                "transacciones": "$cantidad_transacciones"
            }},
            "total_anual": {"$sum": "$total_ventas"},
            "promedio_mensual": {"$avg": "$total_ventas"}
        }},
        
        # Etapa 5: Ordenar por región y año
        {"$sort": {"_id.region": 1, "_id.año": 1}}
    ]
    
    resultados_complejos = ventas_collection.aggregate(pipeline_complejo)
    for resultado in resultados_complejos:
        region = resultado["_id"]["region"]
        año = resultado["_id"]["año"]
        print(f"Región: {region}, Año: {año}")
        print(f"  Total anual: ${resultado['total_anual']:,.2f}")
        print(f"  Promedio mensual: ${resultado['promedio_mensual']:,.2f}")
        print("  Desglose mensual:")
        for mes in sorted(resultado["ventas_mensuales"], key=lambda x: x["mes"]):
            print(f"    Mes {mes['mes']}: ${mes['ventas']:,.2f} ({mes['transacciones']} transacciones)")
        print()
    
except Exception as e:
    print(f"Error: {e}")
finally:
    # Cerrar la conexión
    if 'client' in locals():
        client.close()
        print("\nConexión cerrada")

Conexión exitosa a MongoDB
Se insertaron 7 productos y se creó un índice de texto
Se insertaron 5 tiendas y se creó un índice geoespacial
Se insertaron 200 ventas

--- CONSULTAS AVANZADAS ---

1. Productos que contienen 'Ultra' en su nombre:
- Ultrabook Pro X5 ($1299.99)
- Monitor UltraWide 34 ($449.99)
- Teléfono UltraClear 12 ($899.99)
- Disco SSD Ultra Rápido ($199.99)

2. Tiendas cercanas a Madrid (radio de 300km):
- Electrónica Central (Calle Mayor 123, Madrid)

3. Productos relacionados con 'alta calidad':
- Disco SSD Ultra Rápido: Disco SSD de alta velocidad y resistente para uso intensivo
- Tarjeta Gráfica Pro Gaming: Tarjeta gráfica de alta calidad para gaming profesional con 12GB VRAM
- Teléfono UltraClear 12: Smartphone con cámara de alta resolución y batería de larga duración
- Ultrabook Pro X5: Portátil ultraligero de alta calidad con procesador i7 y pantalla 4K
- Router Mesh Premium: Sistema de red mesh de alta calidad para cobertura completa del hogar
- Monitor UltraWide

In [6]:
# Consultas con expresions regulares
import re
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    regex_pattern = re.compile('ultra', re.IGNORECASE)
    productos = db.productos.find({"nombre": regex_pattern})
    for producto in productos:
        print(f"- {producto['nombre']} (${producto['precio']})")

- Ultrabook Pro X5 ($1299.99)
- Monitor UltraWide 34 ($449.99)
- Teléfono UltraClear 12 ($899.99)
- Disco SSD Ultra Rápido ($199.99)
Cerrando conexión ...


In [None]:
# Consultas geoespaciales
# guía...

In [None]:
# Consultas de texto completo
# Guia...

In [None]:
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    # Pipeline básico: ventas por categoría
    pipeline = [
        # Etapa 1: Filtrar solo ventas completadas
        {"$match": {"estado": "completado"}},

        # Etapa 2: Agrupar por categoría
        {"$group": {
            "_id": "$categoria_producto",
            "total_ventas": {"$sum": "$monto"},
            "cantidad_ventas": {"$sum": 1},
            "promedio_venta": {"$avg": "$monto"}
        }},

            # Etapa 3: Ordenar por total de ventas
        {"$sort": {"total_ventas": -1}}
    ]

    resultados = db.ventas.aggregate(pipeline)
    for resultado in resultados:
        print(f"Categoría: {resultado['_id']}")
        print(f"  Total ventas: ${resultado['total_ventas']:,.2f}")
        print(f"  Cantidad: {resultado['cantidad_ventas']}")
        print(f"  Promedio: ${resultado['promedio_venta']:,.2f}")



In [None]:
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    # Pipeline básico: ventas por categoría
    pipeline = [
        # Etapa 1: Añadir campos calculados para fecha
            {"$addFields": {
                "mes": {"$month": "$fecha_venta"},
                "año": {"$year": "$fecha_venta"}
            }},
        # Etapa 2: Agrupar por región, año y mes
            {"$group": {
                "_id": {
                        "region": "$region_cliente",
                        "año": "$año",
                        "mes": "$mes"
                    },
                "total_ventas": {"$sum": "$monto"},
                "cantidad_transacciones": {"$sum": 1},
                "productos_vendidos": {"$sum": "$cantidad_productos"}
            }},
        # Etapa 3: Agrupar de nuevo para obtener totales anuales por región
            {"$group": {
                "_id": {
                        "region": "$_id.region",
                        "año": "$_id.año"
                    },
                "ventas_mensuales": {"$push": {
                    "mes": "$_id.mes",
                    "ventas": "$total_ventas",
                    "transacciones": "$cantidad_transacciones"
                    }},
                "total_anual": {"$sum": "$total_ventas"},
                "promedio_mensual": {"$avg": "$total_ventas"}
            }},
        # Etapa 4: Ordenar por región y año
            {"$sort": {"_id.region": 1, "_id.año": 1}}
    ]

    resultados = db.ventas.aggregate(pipeline)
    for resultado in resultados:
        region = resultado["_id"]["region"]
        año = resultado["_id"]["año"]
        print(f"Región: {region}, Año: {año}")
        print(f"  Total anual: ${resultado['total_anual']:,.2f}")
        print(f"  Promedio mensual: ${resultado['promedio_mensual']:,.2f}")
        print("  Desglose mensual:")
        for mes in sorted(resultado["ventas_mensuales"], key=lambda x: x["mes"]):
            print(f"    Mes {mes['mes']}: ${mes['ventas']:,.2f} ({mes['transacciones']} transacciones)")
        print()

In [9]:
from datetime import datetime
import random

with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    productos = db["productos"]

    productos.drop()


    categorias = ["Electrónica", "Ropa", "Hogar", "Deportes", "Libros"]
    nombres_productos = [
        ["Smartphone", "Laptop", "Auriculares", "Tablet", "Smartwatch"],
        ["Camiseta", "Pantalón", "Zapatillas", "Abrigo", "Gorra"],
        ["Lámpara", "Sofá", "Mesa", "Silla", "Estantería"],
        ["Balón", "Raqueta", "Bicicleta", "Mancuernas", "Patines"],
        ["Novela", "Ensayo", "Biografía", "Cómic", "Manual"]
    ]

    # Insertar 50 productos aleatorios
    productos_a_insertar = []
    for _ in range(50):
        cat_index = random.randint(0, 4)
        categoria = categorias[cat_index]
        nombre = random.choice(nombres_productos[cat_index])
        modelo = f"Modelo-{random.randint(1, 100)}"
        
        productos_a_insertar.append({
            "nombre": f"{nombre} {modelo}",
            "categoria": categoria,
            "precio": round(random.uniform(10, 1000), 2),
            "stock": random.randint(0, 100),
            "valoracion": round(random.uniform(1, 5), 1),  # Valoración de 1 a 5
            "num_valoraciones": random.randint(1, 500),
            "fecha_alta": datetime(2023, random.randint(1, 12), random.randint(1, 28))
        })

    productos.insert_many(productos_a_insertar)


    

Cerrando conexión ...


In [37]:
with get_mongo_client("mongodb://usuario:micontraseña@localhost:27017/") as client:
    db = client.analisis_datos
    # Pipeline básico: ventas por categoría
    pipelines = [
        # Etapa 1: Agrupar por categoría
        {"$group": {
            "_id": "$categoria",
            "num_productos": {"$sum": 1},
            "valoracion_media": {"$avg": "$valoracion"},
            "precio_medio" : {"$avg": "$precio"},
            "stock_total": {"$sum": "$stock"}
        }},

        # Etapa 2: Ordenar por valoración media (descendente)
        {"$sort": { "valoracion_media": -1}}
    ]
    
    resultados = db.productos.aggregate(pipelines)
   
    print("\nCategorías de productos por valoración media:")
    print("=============================================")
    for resultado in resultados:
        print(f"Categoría: {resultado['_id']}")
        print(f"  Valoración media: {resultado['valoracion_media']:.1f}/5.0")
        print(f"  Número de productos: {resultado['num_productos']}")
        print(f"  Precio medio: ${resultado['precio_medio']:.2f}")
        print(f"  Stock total: {resultado['stock_total']} unidades")
        print()
        



Categorías de productos por valoración media:
Categoría: Electrónica
  Valoración media: 3.6/5.0
  Número de productos: 4
  Precio medio: $550.76
  Stock total: 269 unidades

Categoría: Libros
  Valoración media: 3.1/5.0
  Número de productos: 13
  Precio medio: $472.47
  Stock total: 561 unidades

Categoría: Ropa
  Valoración media: 3.1/5.0
  Número de productos: 12
  Precio medio: $501.27
  Stock total: 524 unidades

Categoría: Deportes
  Valoración media: 3.0/5.0
  Número de productos: 8
  Precio medio: $540.15
  Stock total: 420 unidades

Categoría: Hogar
  Valoración media: 2.6/5.0
  Número de productos: 13
  Precio medio: $590.19
  Stock total: 696 unidades

Cerrando conexión ...
