In [1]:
import pandas as pd
import random
import string
from datetime import datetime, timedelta
import mysql.connector as con
import pymysql
import sqlalchemy
from sqlalchemy import create_engine, text
from unidecode import unidecode


In [2]:
print(f"pandas=={pd.__version__}")
print(f"sqlalchemy=={sqlalchemy.__version__}")

pandas==2.2.3
sqlalchemy==2.0.37


### 1. CREAR BASE DE DATOS (33%)

* Crear con código SQL una base de datos llamada supermercado.
* Código Python con mysql connector que ejecute el SQL para borrar y generar la base de datos vacía.

![image.png](attachment:image.png)

Tablas: 7 

tiendas
- id_tienda (PRIMARY KEY)
- nombre_tienda
- direccion
- ciudad

empleados
- id_empleado (PRIMARY KEY)
- nombre_empleado
- puesto (ej.: Cajero, Gerente, Reponedor)
- id_tienda (FOREIGN KEY que hace referencia a tiendas.id_tienda)

categorias
- id_categoria (PRIMARY KEY)
- nombre_categoria

productos
- id_producto (PRIMARY KEY)
- nombre_producto
- precio
- stock
- id_categoria (FOREIGN KEY que hace referencia a categorias.id_categoria)

clientes
- id_cliente (PRIMARY KEY)
- first_name
- last_name
- email
- codigo_postal

ordenes
- id_orden (PRIMARY KEY)
- id_cliente (FOREIGN KEY que hace referencia a clientes.id_cliente)
- id_empleado (FOREIGN KEY que hace referencia a empleados.id_empleado)
- fecha_orden
- metodo_pago (una enum que solo admita tres valores Tarjeta, Efectivo)

detalle_orden
- id_orden  (PRIMARY KEY)
- id_detalle (PRIMARY KEY)
- id_orden (FOREIGN KEY que hace referencia a ordenes.id_orden) NOT NULL
- id_producto (FOREIGN KEY que hace referencia a productos.id_producto) NOT NULL
- cantidad
- precio_unitario: mismo precio que en la tabla producto
- descuento (podría ser NULL si no se aplica)



In [3]:
# Código SQL para crear la base de datos y las tablas
sql = """
DROP DATABASE IF EXISTS supermercado;
CREATE DATABASE supermercado;
USE supermercado;
CREATE TABLE tiendas (
    id_tienda INT PRIMARY KEY,
    nombre_tienda VARCHAR(50),
    direccion VARCHAR(100),
    ciudad VARCHAR(50)
);
CREATE TABLE empleados (
    id_empleado INT PRIMARY KEY,
    nombre_empleado VARCHAR(80),
    puesto VARCHAR(20),
    id_tienda INT,
    FOREIGN KEY (id_tienda) REFERENCES tiendas(id_tienda)
);
CREATE TABLE categorias (
    id_categoria INT PRIMARY KEY,
    nombre_categoria VARCHAR(50)
);
CREATE TABLE productos (
    id_producto INT PRIMARY KEY,
    nombre_producto VARCHAR(50),
    precio DECIMAL(10, 2),
    stock INT,
    id_categoria INT,
    FOREIGN KEY (id_categoria) REFERENCES categorias(id_categoria)
);
CREATE TABLE clientes (
    id_cliente INT PRIMARY KEY,
    first_name VARCHAR(50),
    last_name VARCHAR(50),
    email VARCHAR(100),
    codigo_postal VARCHAR(5)
);
CREATE TABLE ordenes (
    id_orden INT PRIMARY KEY,
    id_cliente INT,
    id_empleado INT,
    fecha_orden DATE,
    metodo_pago ENUM('Tarjeta', 'Efectivo'),
    FOREIGN KEY (id_cliente) REFERENCES clientes(id_cliente),
    FOREIGN KEY (id_empleado) REFERENCES empleados(id_empleado)
);
CREATE TABLE detalle_orden (
    id_orden INT,
    id_detalle INT,
    id_producto INT,
    cantidad INT,
    precio_unitario DECIMAL(10, 2),
    descuento DECIMAL(10, 2),
    PRIMARY KEY (id_orden, id_detalle),
    FOREIGN KEY (id_orden) REFERENCES ordenes(id_orden),
    FOREIGN KEY (id_producto) REFERENCES productos(id_producto)
);
"""

In [4]:
try:
    conexion = con.connect(
    host="localhost",
    port= "3306",
    user= "root",
    password= "admin"
    )
    cursor = conexion.cursor()
    # Ejecutar el script SQL
    for statement in sql.split(';'):
        if statement.strip():
            cursor.execute(statement)

    conexion.commit()
except con.Error as error:
    print(f"Ha ocurrido un error: {error}")
    if conexion:
       conexion.rollback()
finally:
    if cursor: 
        cursor.close()
    if conexion:
        conexion.close()
# Cerrar la conexión
print("La base de datos y las tablas se han creado exitosamente.")


La base de datos y las tablas se han creado exitosamente.


### 2. Generar datos demo desde Python (33%)

* Generar datos aleatorios en listas con Python similar los realizados en clase.
    * Uso de datetime, timedelta, random para generar datos aleatorios
* Pasar los datos a DataFrames de Pandas
* Pasar los DataFrames de Pandas a MySQL usando la función to_sql de Pandas con SQLAlchemy o usando MySQL Connector con sentencias INSERT.

tiendas

* id_tienda: valores enteros consecutivos (por ejemplo, 1, 2, 3...).
* nombre_tienda: nombres ficticios o genéricos (p. ej. "Tienda Centro", "Super Norte", "Super Sur").
* direccion: direcciones simples (p. ej. “Calle Falsa 123”).
* ciudad: usar nombres de ciudades ficticias o reales (p. ej. “Madrid”, “Barcelona”, “México DF”, etc.).

En total 5 o 10 tiendas.


In [5]:
# Funciones para generar datos aleatorios
def random_date(start, end):
    return start + timedelta(days=random.randint(0, (end - start).days))

In [6]:
# Generar datos para tiendas
tiendas = []
for i in range(1, 11):
    tiendas.append({
        'id_tienda': i,
        'nombre_tienda': f'Tienda {i}',
        'direccion': f'Calle falsa {random.randint(1, 100)}',
        'ciudad': random.choice(['Madrid', 'Barcelona', 'A Coruña', 'Valencia', 'Sevilla'])
    })

df_tiendas = pd.DataFrame(tiendas)
df_tiendas

Unnamed: 0,id_tienda,nombre_tienda,direccion,ciudad
0,1,Tienda 1,Calle falsa 37,A Coruña
1,2,Tienda 2,Calle falsa 81,Barcelona
2,3,Tienda 3,Calle falsa 87,Madrid
3,4,Tienda 4,Calle falsa 55,Barcelona
4,5,Tienda 5,Calle falsa 12,Valencia
5,6,Tienda 6,Calle falsa 96,Valencia
6,7,Tienda 7,Calle falsa 93,Madrid
7,8,Tienda 8,Calle falsa 9,Barcelona
8,9,Tienda 9,Calle falsa 39,Madrid
9,10,Tienda 10,Calle falsa 89,Madrid


empleados

* id_empleado: valores enteros consecutivos (1, 2, 3...).
* nombre_empleado: nombres y apellidos ficticios (p. ej. “Laura Gutiérrez”, “Juan Pérez”).
* puesto: limitarse a un conjunto reducido de valores (p. ej. {‘Cajero’, ‘Gerente’, ‘Reponedor’, ‘Vendedor’}).
* id_tienda: debe hacer referencia a una tienda existente (por ejemplo, un número entre 1 y 3 si solo tienes 3 tiendas).

En total 20 empleados por tienda.

In [7]:
# Listas de nombres y apellidos 
nombres = ['Carlos', 'María', 'Juan', 'Laura', 'José', 'Ana', 'Luis', 'Carmen', 'Miguel', 'Lucía'] 
apellidos = ['García', 'Martínez', 'López', 'Sánchez', 'Pérez', 'González', 'Rodríguez', 'Fernández', 'Gómez', 'Ruiz']
# # Generar datos para empleados
empleados = []
numero_empleado = 0
for tienda in tiendas:
    for i in range(1, 21): 
        numero_empleado += 1
        empleados.append({
            'id_empleado': numero_empleado,
            'nombre_empleado': f'{random.choice(nombres)} {random.choice(apellidos)}',
            'puesto': random.choice(['Cajero', 'Gerente', 'Reponedor', 'Vendedor']),
            'id_tienda': tienda['id_tienda']
        })

In [8]:
df_empleados = pd.DataFrame(empleados)
df_empleados

Unnamed: 0,id_empleado,nombre_empleado,puesto,id_tienda
0,1,Carlos Gómez,Cajero,1
1,2,Luis Sánchez,Vendedor,1
2,3,Luis Sánchez,Cajero,1
3,4,Ana García,Vendedor,1
4,5,José García,Reponedor,1
...,...,...,...,...
195,196,María Gómez,Gerente,10
196,197,Lucía Ruiz,Vendedor,10
197,198,Juan López,Reponedor,10
198,199,Laura Gómez,Reponedor,10


categorias

* id_categoria: valores enteros consecutivos (1, 2, 3...).
* nombre_categoria: selección de categorías (p. ej. “Lácteos”, “Carnes”, “Frutas”, “Verduras”, “Bebidas”, “Snacks”).

En total 10 categorías.


In [9]:
categorias_productos = [ 'Lácteos', 'Carnes', 'Frutas', 'Verduras', 'Bebidas', 'Snacks', 'Panadería', 'Congelados', 'Dulces', 'Cereales' ]

In [10]:
# Generar datos para categorías

categorias = []
numero_categotia = 0
for categoria in categorias_productos:
    numero_categotia += 1
    categorias.append({
        'id_categoria': numero_categotia,
        'nombre_categoria': categoria
    })

In [11]:
df_categorias = pd.DataFrame(categorias)
df_categorias

Unnamed: 0,id_categoria,nombre_categoria
0,1,Lácteos
1,2,Carnes
2,3,Frutas
3,4,Verduras
4,5,Bebidas
5,6,Snacks
6,7,Panadería
7,8,Congelados
8,9,Dulces
9,10,Cereales


productos

* id_producto: valores enteros consecutivos (1, 2, 3...).
nombre_producto: nombres como “Leche Entera”, “Manzana Roja”, “Refresco de Cola”, etc.
* precio: valores DECIMAL entre 0.50 y 50.00, por ejemplo.
* stock: valores INT entre 0 y 500 (o el rango que quieras).
* id_categoria: debe hacer referencia a las categorías que hayas definido (1, 2, 3, etc.).

En total 4 productos de cada categoría.

In [12]:
productos_por_categoria = {
    'Lácteos': ['Leche Entera', 'Yogur Natural', 'Queso Manchego', 'Mantequilla'],
    'Carnes': ['Filete de Ternera', 'Pechuga de Pollo', 'Chuleta de Cerdo', 'Salchichas'],
    'Frutas': ['Manzana Roja', 'Plátano', 'Naranja', 'Uvas'],
    'Verduras': ['Zanahoria', 'Espinacas', 'Brócoli', 'Lechuga'],
    'Bebidas': ['Refresco de Cola', 'Jugo de Naranja', 'Agua Mineral', 'Té Helado'],
    'Snacks': ['Papas Fritas', 'Galletas de Chocolate', 'Barrita de Granola', 'Palomitas de Maíz'],
    'Panadería': ['Pan de Molde', 'Croissant', 'Pan Integral', 'Baguette'],
    'Congelados': ['Pizza Congelada', 'Helado de Vainilla', 'Guisantes Congelados', 'Patatas Fritas Congeladas'],
    'Dulces': ['Chocolate con Leche', 'Caramelos', 'Galletas de Mantequilla', 'Chicles'],
    'Cereales': ['Corn Flakes', 'Muesli', 'Avena', 'Arroz Inflado']
}

In [13]:
id_producto = 0
productos = []

# Generar productos
for id_categoria, nombre_categoria in enumerate(categorias_productos, start=1):
    for nombre_producto in productos_por_categoria[nombre_categoria]:
        id_producto += 1
        productos.append({
            'id_producto': id_producto,
            'nombre_producto': nombre_producto,
            'precio': round(random.uniform(0.50, 50.00), 2),
            'stock': random.randint(0, 500),
            'id_categoria': id_categoria
        })

In [14]:
df_productos = pd.DataFrame(productos)
df_productos

Unnamed: 0,id_producto,nombre_producto,precio,stock,id_categoria
0,1,Leche Entera,45.95,16,1
1,2,Yogur Natural,48.87,278,1
2,3,Queso Manchego,4.33,213,1
3,4,Mantequilla,20.52,70,1
4,5,Filete de Ternera,46.92,378,2
5,6,Pechuga de Pollo,43.32,249,2
6,7,Chuleta de Cerdo,43.67,251,2
7,8,Salchichas,26.49,268,2
8,9,Manzana Roja,26.29,384,3
9,10,Plátano,15.54,225,3


clientes

* id_cliente: valores enteros consecutivos (1, 2, 3...).
* nombre_cliente: nombres y apellidos ficticios (p. ej. “Carlos López”, “María Gil”).
* email: podrías generar correos ficticios (p. ej. “carlos.lopez@test.com”).
* telefono: número de 9 o 10 dígitos (dependiendo del país).
* direccion: calles y números ficticios (p. ej. “Av. Siempre Viva 742”).

En total: 2000.

In [15]:
nombres1 = [
    'Carlos', 'María', 'Juan', 'Laura', 'José', 'Ana', 'Luis', 'Carmen', 'Miguel', 'Lucía',
    'Antonio', 'Isabel', 'Francisco', 'Teresa', 'David', 'Elena', 'Javier', 'Marta', 'Manuel', 'Patricia',
    'Pablo', 'Rosa', 'Álvaro', 'Silvia', 'Sergio', 'Raquel', 'Alejandro', 'Beatriz', 'Fernando', 'Clara',
    'Ramón', 'Julia', 'Andrés', 'Alicia', 'Roberto', 'Sonia', 'Vicente', 'Lorena', 'Adrián', 'Gloria',
    'Joaquín', 'Sandra', 'Jesús', 'Irene', 'Tomás', 'Pilar', 'Ignacio', 'Eva', 'Guillermo', 'Nuria'
]

# Listas de apellidos de clientes
apellidos1 = [
    'García', 'Martínez', 'López', 'Sánchez', 'Pérez', 'González', 'Rodríguez', 'Fernández', 'Gómez', 'Ruiz',
    'Díaz', 'Álvarez', 'Morales', 'Ortega', 'Castillo', 'Romero', 'Vega', 'Torres', 'Flores', 'Ramos',
    'Castro', 'Silva', 'Rojas', 'Mendoza', 'Molina', 'Herrera', 'Vargas', 'Delgado', 'Paredes', 'Cabrera',
    'Gallardo', 'Núñez', 'Aguirre', 'Valdez', 'Peña', 'Salazar', 'Fuentes', 'Mora', 'Méndez', 'Jiménez',
    'Espinoza', 'Pacheco', 'León', 'Soto', 'Reyes', 'Campos', 'Carrillo', 'Navarrete', 'Bustamante', 'Serrano'
]


In [16]:
clientes = []
for i in range(1, 2001):
    nombre = random.choice(nombres1)
    apellido = random.choice(apellidos1)
    nombre_sin_acento = unidecode(nombre).lower()
    apellido_sin_acento = unidecode(apellido).lower()
    clientes.append({
        'id_cliente': i,
        'first_name': nombre,
        'last_name': apellido,
        'email': f'{nombre_sin_acento}.{apellido_sin_acento}@test.com',
        'codigo_postal': ''.join(random.choices(string.digits, k=5))
    })

In [17]:
df_clientes = pd.DataFrame(clientes)
df_clientes

Unnamed: 0,id_cliente,first_name,last_name,email,codigo_postal
0,1,Francisco,Reyes,francisco.reyes@test.com,99172
1,2,Juan,Delgado,juan.delgado@test.com,19983
2,3,David,Molina,david.molina@test.com,35931
3,4,Gloria,Torres,gloria.torres@test.com,95161
4,5,Rosa,Navarrete,rosa.navarrete@test.com,81561
...,...,...,...,...,...
1995,1996,Pilar,Espinoza,pilar.espinoza@test.com,15890
1996,1997,Patricia,Espinoza,patricia.espinoza@test.com,59205
1997,1998,Ramón,Salazar,ramon.salazar@test.com,80203
1998,1999,Elena,Vega,elena.vega@test.com,98839


ordenes

* id_orden: valores enteros consecutivos (1, 2, 3...).
* id_cliente: haz referencia a los IDs existentes de la tabla clientes.
* id_empleado: haz referencia a los IDs existentes de la tabla empleados.
* fecha_orden: genera fechas aleatorias o secuenciales (p. ej. entre ‘2024-01-01’ y ‘2025-01-01’).
* metodo_pago: escoge entre {‘Tarjeta’, ‘Efectivo’}.

En total: 10000.


In [18]:
# Generar datos para órdenes
ordenes = []
for i in range(1, 10001):
    ordenes.append({
        'id_orden': i,
        'id_cliente': random.randint(1, 2000),
        'id_empleado': random.randint(1, 200),
        'fecha_orden': random_date(datetime(2024, 1, 1), datetime(2025, 1, 1)),
        'metodo_pago': random.choices(['Tarjeta', 'Efectivo'], weights=[0.70, 0.30])[0]
    })

In [19]:
df_ordenes = pd.DataFrame(ordenes)
df_ordenes

Unnamed: 0,id_orden,id_cliente,id_empleado,fecha_orden,metodo_pago
0,1,636,162,2024-02-06,Tarjeta
1,2,1253,37,2024-07-28,Tarjeta
2,3,689,50,2024-09-06,Efectivo
3,4,1458,29,2024-07-04,Tarjeta
4,5,489,5,2024-03-22,Tarjeta
...,...,...,...,...,...
9995,9996,1081,162,2024-10-27,Tarjeta
9996,9997,1674,149,2024-12-27,Tarjeta
9997,9998,1294,80,2024-10-11,Efectivo
9998,9999,1957,50,2024-07-01,Tarjeta


detalle_orden

* id_orden: referencia al ID de alguna orden válida.
* id_detalle: para cada orden de id_orden generar un numero aleatorio de id_detalles de entre 5 y 15
* id_producto: referencia al ID de algún producto válido.
* cantidad: valores entre 1 y 20, por ejemplo.
* precio_unitario: usar el mismo precio que está en la tabla productos o uno ligeramente distinto si quieres simular ofertas.
* descuento: valores DECIMAL bajos (p. ej. 0.00, 1.00, 2.50) o NULL.



In [20]:

detalle_orden = []
for id_orden in df_ordenes['id_orden']:
    num_detalles = random.randint(5, 15)
    for id_detalle in range(1, num_detalles + 1):
        id_producto = random.randint(1, 40)
        detalle_orden.append({
            'id_orden': id_orden,
            'id_detalle': id_detalle,
            'id_producto': id_producto,
            'cantidad': random.randint(1, 20),
            'precio_unitario': round(random.uniform(0.5, 50.0), 2),
            'descuento': round(random.uniform(0.0, 5.0), 2)
        })

In [21]:
df_detalle_orden = pd.DataFrame(detalle_orden)
df_detalle_orden

Unnamed: 0,id_orden,id_detalle,id_producto,cantidad,precio_unitario,descuento
0,1,1,5,11,36.63,1.70
1,1,2,36,12,38.21,1.44
2,1,3,13,1,23.79,3.46
3,1,4,15,9,42.96,2.68
4,1,5,33,13,10.60,3.98
...,...,...,...,...,...,...
99933,10000,3,33,8,46.17,4.36
99934,10000,4,13,15,0.56,4.26
99935,10000,5,12,8,34.82,1.57
99936,10000,6,21,16,17.71,2.39


In [22]:
user = "root"
password = "admin"
database = "supermercado"

# Crear la conexión
engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

In [23]:
df_tiendas.to_sql('tiendas', con=engine, if_exists='append', index=False)
df_empleados.to_sql('empleados', con=engine, if_exists='append', index=False)
df_categorias.to_sql('categorias', con=engine, if_exists='append', index=False)
df_productos.to_sql('productos', con=engine, if_exists='append', index=False)
df_clientes.to_sql('clientes', con=engine, if_exists='append', index=False)
df_ordenes.to_sql('ordenes', con=engine, if_exists='append', index=False)
df_detalle_orden.to_sql('detalle_orden', con=engine, if_exists='append', index=False)


99938

### 3. Consultas SQL (34%)

Opcional: añadir alguna consulta con subconsultas o algo que no se abarque en las anteriores consulta.


1. Listado de órdenes con detalles de cliente y empleado
* Muestra el ID de la orden, la fecha, el nombre del cliente, el nombre del empleado que atendió la compra y el método de pago.
* Utiliza un JOIN entre las tablas ordenes, clientes y empleados.


In [24]:
query1 = """
SELECT o.id_orden, o.fecha_orden, CONCAT( c.first_name, ' ', c.last_name) AS nombre_cliente, e.nombre_empleado, o.metodo_pago
FROM ordenes o
JOIN clientes c ON o.id_cliente = c.id_cliente
JOIN empleados e ON o.id_empleado = e.id_empleado;
"""
with engine.connect() as connection:
    # Ejecutar y mostrar resultados para cada consulta
    result1 = connection.execute(text(query1)).fetchall()
result1

[(27, datetime.date(2024, 1, 28), 'Antonio Méndez', 'Carlos Gómez', 'Efectivo'),
 (96, datetime.date(2024, 10, 21), 'Antonio Silva', 'Carlos Gómez', 'Tarjeta'),
 (139, datetime.date(2024, 3, 19), 'Tomás Méndez', 'Carlos Gómez', 'Efectivo'),
 (496, datetime.date(2024, 3, 28), 'Patricia Campos', 'Carlos Gómez', 'Tarjeta'),
 (511, datetime.date(2024, 9, 13), 'Fernando León', 'Carlos Gómez', 'Efectivo'),
 (685, datetime.date(2024, 6, 1), 'Clara Campos', 'Carlos Gómez', 'Tarjeta'),
 (966, datetime.date(2024, 2, 25), 'Vicente Campos', 'Carlos Gómez', 'Efectivo'),
 (1126, datetime.date(2024, 8, 12), 'Marta López', 'Carlos Gómez', 'Tarjeta'),
 (1449, datetime.date(2024, 4, 10), 'Raquel Bustamante', 'Carlos Gómez', 'Efectivo'),
 (1783, datetime.date(2024, 7, 2), 'Lorena Castro', 'Carlos Gómez', 'Efectivo'),
 (1830, datetime.date(2024, 9, 14), 'Laura Molina', 'Carlos Gómez', 'Tarjeta'),
 (1884, datetime.date(2024, 2, 4), 'Marta Carrillo', 'Carlos Gómez', 'Efectivo'),
 (1946, datetime.date(2024, 

2. Productos con stock bajo
* Filtra aquellos productos cuyo stock sea menor a 10.
* Muestra nombre del producto, categoría y stock.

In [25]:
query2 = """
SELECT p.nombre_producto, c.nombre_categoria, p.stock
FROM productos p
JOIN categorias c ON p.id_categoria = c.id_categoria
WHERE p.stock < 10;
"""
with engine.connect() as connection:
    result2 = connection.execute(text(query2)).fetchall()
result2

[]

3. Ventas totales por categoría
* Muestra el nombre de la categoría y la suma total de las ventas (ej.: multiplicando cantidad * precio_unitario) para cada categoría.
* Realiza el JOIN con detalle_orden, productos y categorias.
* Utiliza agrupación (GROUP BY).

In [26]:
query3 = """
SELECT c.nombre_categoria, SUM(d.cantidad * d.precio_unitario) AS total_ventas
FROM detalle_orden d
JOIN productos p ON d.id_producto = p.id_producto
JOIN categorias c ON p.id_categoria = c.id_categoria
GROUP BY c.nombre_categoria;
"""
with engine.connect() as connection:
    result3 = connection.execute(text(query3)).fetchall()
result3

[('Lácteos', Decimal('2611809.14')),
 ('Carnes', Decimal('2666275.93')),
 ('Frutas', Decimal('2637468.95')),
 ('Verduras', Decimal('2624201.98')),
 ('Bebidas', Decimal('2702572.59')),
 ('Snacks', Decimal('2710884.95')),
 ('Panadería', Decimal('2633705.38')),
 ('Congelados', Decimal('2689253.28')),
 ('Dulces', Decimal('2631648.31')),
 ('Cereales', Decimal('2658343.94'))]

4. Clientes con mayores gastos acumulados
* Muestra el nombre del cliente y el monto total que ha gastado (suma de todas sus órdenes).
* Asegúrate de tener en cuenta posibles descuentos (descuento) si se ha definido. Por ejemplo, la fórmula podría ser (cantidad * precio_unitario) - descuento.
* Ordena el resultado de mayor a menor gasto acumulado.


In [27]:
query4 = """
SELECT CONCAT(c.first_name,' ', c.last_name) AS nombre_cliente, SUM(d.cantidad * d.precio_unitario - d.descuento) AS gasto_acumulado
FROM clientes c
JOIN ordenes o ON c.id_cliente = o.id_cliente
JOIN detalle_orden d ON o.id_orden = d.id_orden
GROUP BY c.id_cliente
ORDER BY gasto_acumulado DESC;
"""
with engine.connect() as connection:
    result4 = connection.execute(text(query4)).fetchall()
result4

[('Raquel Álvarez', Decimal('37119.05')),
 ('Elena Ramos', Decimal('35997.48')),
 ('Irene Serrano', Decimal('35740.35')),
 ('Marta Ramos', Decimal('35406.04')),
 ('David Molina', Decimal('34245.09')),
 ('Manuel Núñez', Decimal('34190.82')),
 ('José Fernández', Decimal('33697.81')),
 ('Sonia Salazar', Decimal('33586.45')),
 ('Joaquín Sánchez', Decimal('33285.80')),
 ('José Fernández', Decimal('32693.17')),
 ('Irene Silva', Decimal('31631.34')),
 ('Roberto Morales', Decimal('31506.68')),
 ('Javier Vega', Decimal('30850.00')),
 ('Joaquín Méndez', Decimal('30671.17')),
 ('María Rodríguez', Decimal('30666.14')),
 ('Vicente Fuentes', Decimal('30654.94')),
 ('Javier Navarrete', Decimal('30150.50')),
 ('Joaquín Rodríguez', Decimal('29966.10')),
 ('Adrián Serrano', Decimal('29784.13')),
 ('José García', Decimal('29713.36')),
 ('Manuel Fuentes', Decimal('29705.54')),
 ('Juan Jiménez', Decimal('29616.39')),
 ('Lucía Núñez', Decimal('29533.44')),
 ('Luis Cabrera', Decimal('29507.23')),
 ('Clara Ca

5. Empleados y número de órdenes gestionadas
* Muestra el nombre del empleado, el puesto y la cantidad de órdenes que ha gestionado.
* Utiliza GROUP BY y COUNT.


In [28]:
query5 = """
SELECT e.nombre_empleado, e.puesto, COUNT(o.id_orden) AS ordenes_gestionadas
FROM empleados e
JOIN ordenes o ON e.id_empleado = o.id_empleado
GROUP BY e.id_empleado;
"""
with engine.connect() as connection:
    result5 = connection.execute(text(query5)).fetchall()
result5

[('Carlos Gómez', 'Cajero', 58),
 ('Luis Sánchez', 'Vendedor', 45),
 ('Luis Sánchez', 'Cajero', 45),
 ('Ana García', 'Vendedor', 44),
 ('José García', 'Reponedor', 59),
 ('María González', 'Vendedor', 65),
 ('Luis Pérez', 'Vendedor', 52),
 ('Carlos González', 'Reponedor', 49),
 ('Juan Gómez', 'Gerente', 53),
 ('Ana Fernández', 'Cajero', 52),
 ('Carlos Rodríguez', 'Gerente', 56),
 ('Luis Gómez', 'Vendedor', 54),
 ('Juan González', 'Reponedor', 49),
 ('María González', 'Reponedor', 58),
 ('Juan López', 'Reponedor', 57),
 ('Carlos Martínez', 'Cajero', 49),
 ('Miguel Martínez', 'Cajero', 51),
 ('María González', 'Reponedor', 45),
 ('Miguel Ruiz', 'Cajero', 51),
 ('Luis González', 'Reponedor', 42),
 ('Lucía Gómez', 'Reponedor', 42),
 ('Luis Sánchez', 'Vendedor', 53),
 ('Miguel González', 'Gerente', 56),
 ('Luis López', 'Gerente', 54),
 ('Miguel Martínez', 'Vendedor', 47),
 ('Laura Sánchez', 'Vendedor', 47),
 ('Luis Martínez', 'Cajero', 46),
 ('Juan Fernández', 'Reponedor', 43),
 ('Carmen Fe

6. Ordenes filtradas por fecha y tienda
* Muestra todas las órdenes que se realizaron en un rango de fechas determinado (ej.: del 1 de diciembre de 2024 al 31 de diciembre de 2024) y en una tienda específica.
* Incluye datos de la tienda y del cliente.

In [29]:
query6 = """
SELECT o.id_orden, o.fecha_orden, CONCAT(c.first_name, ' ', c.last_name) AS nombre_cliente, t.nombre_tienda, t.direccion
FROM ordenes o
JOIN clientes c ON o.id_cliente = c.id_cliente
JOIN empleados e ON o.id_empleado = e.id_empleado
JOIN tiendas t ON e.id_tienda = t.id_tienda
WHERE o.fecha_orden BETWEEN '2024-12-01' AND '2024-12-31'
AND t.id_tienda = :id_tienda;
"""
id_tienda = 3  
# Ejecutar la consulta y mostrar resultados
with engine.connect() as connection:
    result6 = connection.execute(text(query6), {'id_tienda': id_tienda}).fetchall()
result6

[(58, datetime.date(2024, 12, 24), 'Vicente Campos', 'Tienda 3', 'Calle falsa 87'),
 (375, datetime.date(2024, 12, 5), 'Alicia Fuentes', 'Tienda 3', 'Calle falsa 87'),
 (2400, datetime.date(2024, 12, 9), 'Marta Torres', 'Tienda 3', 'Calle falsa 87'),
 (4333, datetime.date(2024, 12, 23), 'Raquel Morales', 'Tienda 3', 'Calle falsa 87'),
 (8839, datetime.date(2024, 12, 18), 'Gloria Torres', 'Tienda 3', 'Calle falsa 87'),
 (2334, datetime.date(2024, 12, 28), 'Jesús García', 'Tienda 3', 'Calle falsa 87'),
 (5050, datetime.date(2024, 12, 6), 'Tomás Ramos', 'Tienda 3', 'Calle falsa 87'),
 (5246, datetime.date(2024, 12, 24), 'Adrián Méndez', 'Tienda 3', 'Calle falsa 87'),
 (7222, datetime.date(2024, 12, 7), 'Lorena Peña', 'Tienda 3', 'Calle falsa 87'),
 (7572, datetime.date(2024, 12, 15), 'Joaquín Gallardo', 'Tienda 3', 'Calle falsa 87'),
 (782, datetime.date(2024, 12, 4), 'Clara Silva', 'Tienda 3', 'Calle falsa 87'),
 (2890, datetime.date(2024, 12, 1), 'Beatriz López', 'Tienda 3', 'Calle fals

7. Ranking de productos más vendidos en cada tienda
* Para cada tienda, muestra los 3 productos más vendidos (en términos de cantidad total).
* Tendrás que unir tiendas, empleados, ordenes y detalle_orden, además de productos.
* Usa GROUP BY y ordena por la cantidad sumada (y opcionalmente, un LIMIT 3).


In [30]:
query7 = """
SELECT t.id_tienda, t.nombre_tienda, p.nombre_producto, SUM(d.cantidad) AS cantidad_vendida
FROM tiendas t
JOIN empleados e ON t.id_tienda = e.id_tienda
JOIN ordenes o ON e.id_empleado = o.id_empleado
JOIN detalle_orden d ON o.id_orden = d.id_orden
JOIN productos p ON d.id_producto = p.id_producto
GROUP BY t.id_tienda, p.nombre_producto
ORDER BY t.id_tienda, cantidad_vendida DESC
"""

# Ejecutar la consulta y convertir los resultados a un DataFrame
with engine.connect() as connection:
    result7 = connection.execute(text(query7)).fetchall()

df_result7 = pd.DataFrame(result7, columns=['id_tienda','nombre_tienda', 'nombre_producto', 'cantidad_vendida'])

# Obtener los 3 productos más vendidos por tienda
top3_productos = df_result7.groupby('id_tienda').head(3)

# Mostrar los resultados
print(top3_productos)


     id_tienda nombre_tienda            nombre_producto cantidad_vendida
0            1      Tienda 1                  Caramelos             3383
1            1      Tienda 1         Barrita de Granola             3093
2            1      Tienda 1       Guisantes Congelados             3020
40           2      Tienda 2           Pechuga de Pollo             3022
41           2      Tienda 2                  Espinacas             2887
42           2      Tienda 2           Refresco de Cola             2875
80           3      Tienda 3           Refresco de Cola             2907
81           3      Tienda 3                      Avena             2889
82           3      Tienda 3                  Té Helado             2886
120          4      Tienda 4               Manzana Roja             3010
121          4      Tienda 4          Filete de Ternera             2954
122          4      Tienda 4                  Zanahoria             2937
160          5      Tienda 5               Pan de M

Extra. Ranking de pedidos con mas detalles  en cada tienda
* Para cada tienda, muestra los pedidos con mas lineas(en términos de cantidad de detalles mayor que 6).
* Tendrás que unir tiendas, empleados, ordenes y detalle_orden, 
* Usa GROUP BY y ordena por la detalles (y opcionalmente, un LIMIT ).

In [31]:
query8 = """
SELECT t.id_tienda, t.nombre_tienda, o.id_orden, o.fecha_orden, CONCAT( c.first_name, ' ', c.last_name ) AS nombre_cliente, 
    COUNT(d.id_detalle) AS numero_detalles
FROM ordenes o 
JOIN clientes c ON o.id_cliente = c.id_cliente 
JOIN empleados e ON o.id_empleado = e.id_empleado 
JOIN tiendas t ON e.id_tienda = t.id_tienda 
JOIN detalle_orden d ON o.id_orden = d.id_orden
WHERE o.id_orden IN 
	( SELECT id_orden 
    FROM detalle_orden 
    GROUP BY id_orden 
    HAVING COUNT(*) > 6 )
GROUP BY t.nombre_tienda, o.id_orden, o.fecha_orden
ORDER BY  t.id_tienda, numero_detalles desc
"""

# Ejecutar la consulta y convertir los resultados a un DataFrame
with engine.connect() as connection:
    result8 = connection.execute(text(query8)).fetchall()

df_result8 = pd.DataFrame(result8, columns=['id_tienda', 'nombre_tienda', 'id_orden', 'fecha_orden', 'nombre_cliente', 'numero_detalles'])

# Obtener los 3 productos más vendidos por tienda
top3_pedidos = df_result8.groupby('id_tienda').head(3)

# Mostrar los resultados
top3_pedidos


Unnamed: 0,id_tienda,nombre_tienda,id_orden,fecha_orden,nombre_cliente,numero_detalles
0,1,Tienda 1,139,2024-03-19,Tomás Méndez,15
1,1,Tienda 1,1830,2024-09-14,Laura Molina,15
2,1,Tienda 1,2310,2024-08-14,Javier Sánchez,15
877,2,Tienda 2,1680,2024-01-31,Roberto Mora,15
878,2,Tienda 2,5193,2024-03-11,José García,15
879,2,Tienda 2,9311,2024-06-11,Alejandro Herrera,15
1673,3,Tienda 3,58,2024-12-24,Vicente Campos,15
1674,3,Tienda 3,4333,2024-12-23,Raquel Morales,15
1675,3,Tienda 3,4726,2024-01-02,Roberto Vega,15
2497,4,Tienda 4,6561,2024-01-23,Pablo González,15


Cantidad de ordenes y la media de detalles para cada tienda

In [32]:
query9 = """
SELECT 
    t.id_tienda,
    t.nombre_tienda,
    COUNT(DISTINCT o.id_orden) AS cantidad_ordenes,
    AVG(do.cantidad) AS media_detalles
FROM 
    tiendas t
LEFT JOIN 
    empleados e ON t.id_tienda = e.id_tienda
LEFT JOIN 
    ordenes o ON e.id_empleado = o.id_empleado
LEFT JOIN 
    detalle_orden do ON o.id_orden = do.id_orden
GROUP BY 
    t.id_tienda, t.nombre_tienda;
"""
# Ejecutar la consulta y mostrar resultados
with engine.connect() as connection:
    result9 = connection.execute(text(query9)).fetchall()
result9

[(1, 'Tienda 1', 1034, Decimal('10.4211')),
 (2, 'Tienda 2', 992, Decimal('10.4838')),
 (3, 'Tienda 3', 983, Decimal('10.5004')),
 (4, 'Tienda 4', 1003, Decimal('10.5663')),
 (5, 'Tienda 5', 1044, Decimal('10.4776')),
 (6, 'Tienda 6', 960, Decimal('10.5398')),
 (7, 'Tienda 7', 1014, Decimal('10.5475')),
 (8, 'Tienda 8', 1003, Decimal('10.5152')),
 (9, 'Tienda 9', 987, Decimal('10.5250')),
 (10, 'Tienda 10', 980, Decimal('10.5313'))]