In [2]:
import pandas as pd
import random
import string
from datetime import datetime, timedelta
import mysql.connector as con
import pymysql
import sqlalchemy
from sqlalchemy import create_engine, text
from unidecode import unidecode


In [3]:
print(f"pandas=={pd.__version__}")
print(f"sqlalchemy=={sqlalchemy.__version__}")

pandas==2.2.3
sqlalchemy==2.0.37


### 1. CREAR BASE DE DATOS (33%)

* Crear con código SQL una base de datos llamada supermercado.
* Código Python con mysql connector que ejecute el SQL para borrar y generar la base de datos vacía.

![image.png](attachment:image.png)

Tablas: 7 

tiendas
- id_tienda (PRIMARY KEY)
- nombre_tienda
- direccion
- ciudad

empleados
- id_empleado (PRIMARY KEY)
- nombre_empleado
- puesto (ej.: Cajero, Gerente, Reponedor)
- id_tienda (FOREIGN KEY que hace referencia a tiendas.id_tienda)

categorias
- id_categoria (PRIMARY KEY)
- nombre_categoria

productos
- id_producto (PRIMARY KEY)
- nombre_producto
- precio
- stock
- id_categoria (FOREIGN KEY que hace referencia a categorias.id_categoria)

clientes
- id_cliente (PRIMARY KEY)
- first_name
- last_name
- email
- codigo_postal

ordenes
- id_orden (PRIMARY KEY)
- id_cliente (FOREIGN KEY que hace referencia a clientes.id_cliente)
- id_empleado (FOREIGN KEY que hace referencia a empleados.id_empleado)
- fecha_orden
- metodo_pago (una enum que solo admita tres valores Tarjeta, Efectivo)

detalle_orden
- id_orden  (PRIMARY KEY)
- id_detalle (PRIMARY KEY)
- id_orden (FOREIGN KEY que hace referencia a ordenes.id_orden) NOT NULL
- id_producto (FOREIGN KEY que hace referencia a productos.id_producto) NOT NULL
- cantidad
- precio_unitario: mismo precio que en la tabla producto
- descuento (podría ser NULL si no se aplica)



In [4]:
# Código SQL para crear la base de datos y las tablas
sql = """
DROP DATABASE IF EXISTS supermercado;
CREATE DATABASE supermercado;
USE supermercado;
CREATE TABLE tiendas (
    id_tienda INT PRIMARY KEY,
    nombre_tienda VARCHAR(50),
    direccion VARCHAR(100),
    ciudad VARCHAR(50)
);
CREATE TABLE empleados (
    id_empleado INT PRIMARY KEY,
    nombre_empleado VARCHAR(80),
    puesto VARCHAR(20),
    id_tienda INT,
    FOREIGN KEY (id_tienda) REFERENCES tiendas(id_tienda)
);
CREATE TABLE categorias (
    id_categoria INT PRIMARY KEY,
    nombre_categoria VARCHAR(50)
);
CREATE TABLE productos (
    id_producto INT PRIMARY KEY,
    nombre_producto VARCHAR(50),
    precio DECIMAL(10, 2),
    stock INT,
    id_categoria INT,
    FOREIGN KEY (id_categoria) REFERENCES categorias(id_categoria)
);
CREATE TABLE clientes (
    id_cliente INT PRIMARY KEY,
    first_name VARCHAR(50),
    last_name VARCHAR(50),
    email VARCHAR(100),
    codigo_postal VARCHAR(5)
);
CREATE TABLE ordenes (
    id_orden INT PRIMARY KEY,
    id_cliente INT,
    id_empleado INT,
    fecha_orden DATE,
    metodo_pago ENUM('Tarjeta', 'Efectivo'),
    FOREIGN KEY (id_cliente) REFERENCES clientes(id_cliente),
    FOREIGN KEY (id_empleado) REFERENCES empleados(id_empleado)
);
CREATE TABLE detalle_orden (
    id_orden INT,
    id_detalle INT,
    id_producto INT,
    cantidad INT,
    precio_unitario DECIMAL(10, 2),
    descuento DECIMAL(10, 2),
    PRIMARY KEY (id_orden, id_detalle),
    FOREIGN KEY (id_orden) REFERENCES ordenes(id_orden),
    FOREIGN KEY (id_producto) REFERENCES productos(id_producto)
);
"""

In [5]:
try:
    conexion = con.connect(
    host="localhost",
    port= "3306",
    user= "root",
    password= "admin"
    )
    cursor = conexion.cursor()
    # Ejecutar el script SQL
    for statement in sql.split(';'):
        if statement.strip():
            cursor.execute(statement)

    conexion.commit()
except con.Error as error:
    print(f"Ha ocurrido un error: {error}")
    if conexion:
       conexion.rollback()
finally:
    if cursor: 
        cursor.close()
    if conexion:
        conexion.close()
# Cerrar la conexión
print("La base de datos y las tablas se han creado exitosamente.")


La base de datos y las tablas se han creado exitosamente.


### 2. Generar datos demo desde Python (33%)

* Generar datos aleatorios en listas con Python similar los realizados en clase.
    * Uso de datetime, timedelta, random para generar datos aleatorios
* Pasar los datos a DataFrames de Pandas
* Pasar los DataFrames de Pandas a MySQL usando la función to_sql de Pandas con SQLAlchemy o usando MySQL Connector con sentencias INSERT.

tiendas

* id_tienda: valores enteros consecutivos (por ejemplo, 1, 2, 3...).
* nombre_tienda: nombres ficticios o genéricos (p. ej. "Tienda Centro", "Super Norte", "Super Sur").
* direccion: direcciones simples (p. ej. “Calle Falsa 123”).
* ciudad: usar nombres de ciudades ficticias o reales (p. ej. “Madrid”, “Barcelona”, “México DF”, etc.).

En total 5 o 10 tiendas.


In [6]:
# Funciones para generar datos aleatorios
def random_date(start, end):
    return start + timedelta(days=random.randint(0, (end - start).days))

In [7]:
# Generar datos para tiendas
tiendas = []
for i in range(1, 11):
    tiendas.append({
        'id_tienda': i,
        'nombre_tienda': f'Tienda {i}',
        'direccion': f'Calle falsa {random.randint(1, 100)}',
        'ciudad': random.choice(['Madrid', 'Barcelona', 'A Coruña', 'Valencia', 'Sevilla'])
    })

df_tiendas = pd.DataFrame(tiendas)
df_tiendas

Unnamed: 0,id_tienda,nombre_tienda,direccion,ciudad
0,1,Tienda 1,Calle falsa 38,Madrid
1,2,Tienda 2,Calle falsa 55,Madrid
2,3,Tienda 3,Calle falsa 17,Sevilla
3,4,Tienda 4,Calle falsa 36,Valencia
4,5,Tienda 5,Calle falsa 74,Madrid
5,6,Tienda 6,Calle falsa 100,Sevilla
6,7,Tienda 7,Calle falsa 16,Sevilla
7,8,Tienda 8,Calle falsa 34,Sevilla
8,9,Tienda 9,Calle falsa 64,Valencia
9,10,Tienda 10,Calle falsa 56,A Coruña


empleados

* id_empleado: valores enteros consecutivos (1, 2, 3...).
* nombre_empleado: nombres y apellidos ficticios (p. ej. “Laura Gutiérrez”, “Juan Pérez”).
* puesto: limitarse a un conjunto reducido de valores (p. ej. {‘Cajero’, ‘Gerente’, ‘Reponedor’, ‘Vendedor’}).
* id_tienda: debe hacer referencia a una tienda existente (por ejemplo, un número entre 1 y 3 si solo tienes 3 tiendas).

En total 20 empleados por tienda.

In [8]:
# Listas de nombres y apellidos 
nombres = ['Carlos', 'María', 'Juan', 'Laura', 'José', 'Ana', 'Luis', 'Carmen', 'Miguel', 'Lucía'] 
apellidos = ['García', 'Martínez', 'López', 'Sánchez', 'Pérez', 'González', 'Rodríguez', 'Fernández', 'Gómez', 'Ruiz']
# # Generar datos para empleados
empleados = []
numero_empleado = 0
for tienda in tiendas:
    for i in range(1, 21): 
        numero_empleado += 1
        empleados.append({
            'id_empleado': numero_empleado,
            'nombre_empleado': f'{random.choice(nombres)} {random.choice(apellidos)}',
            'puesto': random.choice(['Cajero', 'Gerente', 'Reponedor', 'Vendedor']),
            'id_tienda': tienda['id_tienda']
        })



In [9]:
df_empleados = pd.DataFrame(empleados)
df_empleados

Unnamed: 0,id_empleado,nombre_empleado,puesto,id_tienda
0,1,Juan García,Gerente,1
1,2,José Pérez,Gerente,1
2,3,Miguel Ruiz,Reponedor,1
3,4,Juan Gómez,Vendedor,1
4,5,María Rodríguez,Vendedor,1
...,...,...,...,...
195,196,Lucía Gómez,Reponedor,10
196,197,Luis Fernández,Reponedor,10
197,198,Luis García,Reponedor,10
198,199,José González,Reponedor,10


categorias

* id_categoria: valores enteros consecutivos (1, 2, 3...).
* nombre_categoria: selección de categorías (p. ej. “Lácteos”, “Carnes”, “Frutas”, “Verduras”, “Bebidas”, “Snacks”).

En total 10 categorías.


In [10]:
categorias_productos = [ 'Lácteos', 'Carnes', 'Frutas', 'Verduras', 'Bebidas', 'Snacks', 'Panadería', 'Congelados', 'Dulces', 'Cereales' ]

In [11]:
# Generar datos para categorías

categorias = []
numero_categotia = 0
for categoria in categorias_productos:
    numero_categotia += 1
    categorias.append({
        'id_categoria': numero_categotia,
        'nombre_categoria': categoria
    })

In [12]:
df_categorias = pd.DataFrame(categorias)
df_categorias

Unnamed: 0,id_categoria,nombre_categoria
0,1,Lácteos
1,2,Carnes
2,3,Frutas
3,4,Verduras
4,5,Bebidas
5,6,Snacks
6,7,Panadería
7,8,Congelados
8,9,Dulces
9,10,Cereales


productos

* id_producto: valores enteros consecutivos (1, 2, 3...).
nombre_producto: nombres como “Leche Entera”, “Manzana Roja”, “Refresco de Cola”, etc.
* precio: valores DECIMAL entre 0.50 y 50.00, por ejemplo.
* stock: valores INT entre 0 y 500 (o el rango que quieras).
* id_categoria: debe hacer referencia a las categorías que hayas definido (1, 2, 3, etc.).

En total 4 productos de cada categoría.

In [13]:
productos_por_categoria = {
    'Lácteos': ['Leche Entera', 'Yogur Natural', 'Queso Manchego', 'Mantequilla'],
    'Carnes': ['Filete de Ternera', 'Pechuga de Pollo', 'Chuleta de Cerdo', 'Salchichas'],
    'Frutas': ['Manzana Roja', 'Plátano', 'Naranja', 'Uvas'],
    'Verduras': ['Zanahoria', 'Espinacas', 'Brócoli', 'Lechuga'],
    'Bebidas': ['Refresco de Cola', 'Jugo de Naranja', 'Agua Mineral', 'Té Helado'],
    'Snacks': ['Papas Fritas', 'Galletas de Chocolate', 'Barrita de Granola', 'Palomitas de Maíz'],
    'Panadería': ['Pan de Molde', 'Croissant', 'Pan Integral', 'Baguette'],
    'Congelados': ['Pizza Congelada', 'Helado de Vainilla', 'Guisantes Congelados', 'Patatas Fritas Congeladas'],
    'Dulces': ['Chocolate con Leche', 'Caramelos', 'Galletas de Mantequilla', 'Chicles'],
    'Cereales': ['Corn Flakes', 'Muesli', 'Avena', 'Arroz Inflado']
}

In [14]:
id_producto = 0
productos = []

# Generar productos
for id_categoria, nombre_categoria in enumerate(categorias_productos, start=1):
    for nombre_producto in productos_por_categoria[nombre_categoria]:
        id_producto += 1
        productos.append({
            'id_producto': id_producto,
            'nombre_producto': nombre_producto,
            'precio': round(random.uniform(0.50, 50.00), 2),
            'stock': random.randint(0, 500),
            'id_categoria': id_categoria
        })

In [15]:
df_productos = pd.DataFrame(productos)
df_productos

Unnamed: 0,id_producto,nombre_producto,precio,stock,id_categoria
0,1,Leche Entera,46.44,352,1
1,2,Yogur Natural,0.99,230,1
2,3,Queso Manchego,40.14,353,1
3,4,Mantequilla,12.08,482,1
4,5,Filete de Ternera,27.27,201,2
5,6,Pechuga de Pollo,28.21,125,2
6,7,Chuleta de Cerdo,31.82,27,2
7,8,Salchichas,11.33,275,2
8,9,Manzana Roja,27.4,309,3
9,10,Plátano,34.83,460,3


clientes

* id_cliente: valores enteros consecutivos (1, 2, 3...).
* nombre_cliente: nombres y apellidos ficticios (p. ej. “Carlos López”, “María Gil”).
* email: podrías generar correos ficticios (p. ej. “carlos.lopez@test.com”).
* telefono: número de 9 o 10 dígitos (dependiendo del país).
* direccion: calles y números ficticios (p. ej. “Av. Siempre Viva 742”).

En total: 2000.

In [16]:
nombres1 = [
    'Carlos', 'María', 'Juan', 'Laura', 'José', 'Ana', 'Luis', 'Carmen', 'Miguel', 'Lucía',
    'Antonio', 'Isabel', 'Francisco', 'Teresa', 'David', 'Elena', 'Javier', 'Marta', 'Manuel', 'Patricia',
    'Pablo', 'Rosa', 'Álvaro', 'Silvia', 'Sergio', 'Raquel', 'Alejandro', 'Beatriz', 'Fernando', 'Clara',
    'Ramón', 'Julia', 'Andrés', 'Alicia', 'Roberto', 'Sonia', 'Vicente', 'Lorena', 'Adrián', 'Gloria',
    'Joaquín', 'Sandra', 'Jesús', 'Irene', 'Tomás', 'Pilar', 'Ignacio', 'Eva', 'Guillermo', 'Nuria'
]

# Listas de apellidos de clientes
apellidos1 = [
    'García', 'Martínez', 'López', 'Sánchez', 'Pérez', 'González', 'Rodríguez', 'Fernández', 'Gómez', 'Ruiz',
    'Díaz', 'Álvarez', 'Morales', 'Ortega', 'Castillo', 'Romero', 'Vega', 'Torres', 'Flores', 'Ramos',
    'Castro', 'Silva', 'Rojas', 'Mendoza', 'Molina', 'Herrera', 'Vargas', 'Delgado', 'Paredes', 'Cabrera',
    'Gallardo', 'Núñez', 'Aguirre', 'Valdez', 'Peña', 'Salazar', 'Fuentes', 'Mora', 'Méndez', 'Jiménez',
    'Espinoza', 'Pacheco', 'León', 'Soto', 'Reyes', 'Campos', 'Carrillo', 'Navarrete', 'Bustamante', 'Serrano'
]


In [17]:
clientes = []
for i in range(1, 2001):
    nombre = random.choice(nombres1)
    apellido = random.choice(apellidos1)
    nombre_sin_acento = unidecode(nombre).lower()
    apellido_sin_acento = unidecode(apellido).lower()
    clientes.append({
        'id_cliente': i,
        'first_name': nombre,
        'last_name': apellido,
        'email': f'{nombre_sin_acento}.{apellido_sin_acento}@test.com',
        'codigo_postal': ''.join(random.choices(string.digits, k=5))
    })

In [18]:
df_clientes = pd.DataFrame(clientes)
df_clientes

Unnamed: 0,id_cliente,first_name,last_name,email,codigo_postal
0,1,Lorena,Álvarez,lorena.alvarez@test.com,79923
1,2,Sonia,Rojas,sonia.rojas@test.com,13745
2,3,Carmen,Aguirre,carmen.aguirre@test.com,74346
3,4,Patricia,Ortega,patricia.ortega@test.com,34849
4,5,Juan,Flores,juan.flores@test.com,47539
...,...,...,...,...,...
1995,1996,Ignacio,Paredes,ignacio.paredes@test.com,76323
1996,1997,Pablo,Mendoza,pablo.mendoza@test.com,40360
1997,1998,Guillermo,Herrera,guillermo.herrera@test.com,23231
1998,1999,Pablo,Martínez,pablo.martinez@test.com,37658


ordenes

* id_orden: valores enteros consecutivos (1, 2, 3...).
* id_cliente: haz referencia a los IDs existentes de la tabla clientes.
* id_empleado: haz referencia a los IDs existentes de la tabla empleados.
* fecha_orden: genera fechas aleatorias o secuenciales (p. ej. entre ‘2024-01-01’ y ‘2025-01-01’).
* metodo_pago: escoge entre {‘Tarjeta’, ‘Efectivo’}.

En total: 10000.


In [19]:
# Generar datos para órdenes
ordenes = []
for i in range(1, 10001):
    ordenes.append({
        'id_orden': i,
        'id_cliente': random.randint(1, 2000),
        'id_empleado': random.randint(1, 200),
        'fecha_orden': random_date(datetime(2024, 1, 1), datetime(2025, 1, 1)),
        'metodo_pago': random.choices(['Tarjeta', 'Efectivo'], weights=[0.70, 0.30])[0]
    })

In [20]:
df_ordenes = pd.DataFrame(ordenes)
df_ordenes

Unnamed: 0,id_orden,id_cliente,id_empleado,fecha_orden,metodo_pago
0,1,1247,10,2024-07-24,Efectivo
1,2,1930,24,2024-09-02,Tarjeta
2,3,1832,20,2024-12-10,Tarjeta
3,4,801,64,2024-10-14,Tarjeta
4,5,851,44,2024-03-27,Tarjeta
...,...,...,...,...,...
9995,9996,544,32,2024-10-27,Tarjeta
9996,9997,990,56,2024-04-21,Tarjeta
9997,9998,1784,132,2024-09-21,Tarjeta
9998,9999,218,105,2024-01-08,Tarjeta


detalle_orden

* id_orden: referencia al ID de alguna orden válida.
* id_detalle: para cada orden de id_orden generar un numero aleatorio de id_detalles de entre 5 y 15
* id_producto: referencia al ID de algún producto válido.
* cantidad: valores entre 1 y 20, por ejemplo.
* precio_unitario: usar el mismo precio que está en la tabla productos o uno ligeramente distinto si quieres simular ofertas.
* descuento: valores DECIMAL bajos (p. ej. 0.00, 1.00, 2.50) o NULL.



In [21]:

detalle_orden = []
for id_orden in df_ordenes['id_orden']:
    num_detalles = random.randint(5, 15)
    for id_detalle in range(1, num_detalles + 1):
        id_producto = random.randint(1, 40)
        detalle_orden.append({
            'id_orden': id_orden,
            'id_detalle': id_detalle,
            'id_producto': id_producto,
            'cantidad': random.randint(1, 20),
            'precio_unitario': round(random.uniform(0.5, 50.0), 2),
            'descuento': round(random.uniform(0.0, 5.0), 2)
        })

In [22]:
df_detalle_orden = pd.DataFrame(detalle_orden)
df_detalle_orden

Unnamed: 0,id_orden,id_detalle,id_producto,cantidad,precio_unitario,descuento
0,1,1,12,8,1.97,4.01
1,1,2,17,19,10.46,3.57
2,1,3,19,18,1.62,2.11
3,1,4,24,13,7.46,2.60
4,1,5,7,3,5.25,1.15
...,...,...,...,...,...,...
99778,10000,8,11,19,5.17,4.42
99779,10000,9,4,10,29.46,4.30
99780,10000,10,26,1,32.64,3.93
99781,10000,11,20,8,41.41,1.86


In [23]:
user = "root"
password = "admin"
database = "supermercado"

# Crear la conexión
engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

In [24]:
df_tiendas.to_sql('tiendas', con=engine, if_exists='append', index=False)
df_empleados.to_sql('empleados', con=engine, if_exists='append', index=False)
df_categorias.to_sql('categorias', con=engine, if_exists='append', index=False)
df_productos.to_sql('productos', con=engine, if_exists='append', index=False)
df_clientes.to_sql('clientes', con=engine, if_exists='append', index=False)
df_ordenes.to_sql('ordenes', con=engine, if_exists='append', index=False)
df_detalle_orden.to_sql('detalle_orden', con=engine, if_exists='append', index=False)


99783

### 3. Consultas SQL (34%)

Opcional: añadir alguna consulta con subconsultas o algo que no se abarque en las anteriores consulta.


1. Listado de órdenes con detalles de cliente y empleado
* Muestra el ID de la orden, la fecha, el nombre del cliente, el nombre del empleado que atendió la compra y el método de pago.
* Utiliza un JOIN entre las tablas ordenes, clientes y empleados.


In [25]:
query1 = """
SELECT o.id_orden, o.fecha_orden, CONCAT( c.first_name, ' ', c.last_name) AS nombre_cliente, e.nombre_empleado, o.metodo_pago
FROM ordenes o
JOIN clientes c ON o.id_cliente = c.id_cliente
JOIN empleados e ON o.id_empleado = e.id_empleado;
"""
with engine.connect() as connection:
    # Ejecutar y mostrar resultados para cada consulta
    result1 = connection.execute(text(query1)).fetchall()
result1

[(176, datetime.date(2024, 4, 17), 'Alejandro Méndez', 'Juan García', 'Efectivo'),
 (252, datetime.date(2024, 5, 15), 'Fernando Bustamante', 'Juan García', 'Tarjeta'),
 (383, datetime.date(2024, 7, 17), 'Pablo Núñez', 'Juan García', 'Efectivo'),
 (764, datetime.date(2024, 12, 7), 'Pablo Reyes', 'Juan García', 'Tarjeta'),
 (765, datetime.date(2024, 3, 6), 'Lorena Salazar', 'Juan García', 'Tarjeta'),
 (922, datetime.date(2024, 10, 29), 'Álvaro Álvarez', 'Juan García', 'Tarjeta'),
 (939, datetime.date(2024, 10, 4), 'Laura Serrano', 'Juan García', 'Tarjeta'),
 (1076, datetime.date(2024, 5, 16), 'Irene Serrano', 'Juan García', 'Tarjeta'),
 (1531, datetime.date(2024, 9, 23), 'Irene Peña', 'Juan García', 'Tarjeta'),
 (2018, datetime.date(2024, 4, 12), 'Teresa Álvarez', 'Juan García', 'Efectivo'),
 (2057, datetime.date(2024, 7, 15), 'María Bustamante', 'Juan García', 'Tarjeta'),
 (2093, datetime.date(2024, 2, 2), 'Julia Serrano', 'Juan García', 'Tarjeta'),
 (2236, datetime.date(2024, 4, 5), 'R

2. Productos con stock bajo
* Filtra aquellos productos cuyo stock sea menor a 10.
* Muestra nombre del producto, categoría y stock.

In [26]:
query2 = """
SELECT p.nombre_producto, c.nombre_categoria, p.stock
FROM productos p
JOIN categorias c ON p.id_categoria = c.id_categoria
WHERE p.stock < 10;
"""
with engine.connect() as connection:
    result2 = connection.execute(text(query2)).fetchall()
result2

[('Brócoli', 'Verduras', 2), ('Chocolate con Leche', 'Dulces', 5)]

3. Ventas totales por categoría
* Muestra el nombre de la categoría y la suma total de las ventas (ej.: multiplicando cantidad * precio_unitario) para cada categoría.
* Realiza el JOIN con detalle_orden, productos y categorias.
* Utiliza agrupación (GROUP BY).

In [27]:
query3 = """
SELECT c.nombre_categoria, SUM(d.cantidad * d.precio_unitario) AS total_ventas
FROM detalle_orden d
JOIN productos p ON d.id_producto = p.id_producto
JOIN categorias c ON p.id_categoria = c.id_categoria
GROUP BY c.nombre_categoria;
"""
with engine.connect() as connection:
    result3 = connection.execute(text(query3)).fetchall()
result3

[('Lácteos', Decimal('2645869.59')),
 ('Carnes', Decimal('2689054.84')),
 ('Frutas', Decimal('2652353.11')),
 ('Verduras', Decimal('2640660.40')),
 ('Bebidas', Decimal('2656636.56')),
 ('Snacks', Decimal('2587923.85')),
 ('Panadería', Decimal('2641722.36')),
 ('Congelados', Decimal('2623763.00')),
 ('Dulces', Decimal('2595986.28')),
 ('Cereales', Decimal('2654937.73'))]

4. Clientes con mayores gastos acumulados
* Muestra el nombre del cliente y el monto total que ha gastado (suma de todas sus órdenes).
* Asegúrate de tener en cuenta posibles descuentos (descuento) si se ha definido. Por ejemplo, la fórmula podría ser (cantidad * precio_unitario) - descuento.
* Ordena el resultado de mayor a menor gasto acumulado.


In [28]:
query4 = """
SELECT CONCAT(c.first_name,' ', c.last_name) AS nombre_cliente, SUM(d.cantidad * d.precio_unitario - d.descuento) AS gasto_acumulado
FROM clientes c
JOIN ordenes o ON c.id_cliente = o.id_cliente
JOIN detalle_orden d ON o.id_orden = d.id_orden
GROUP BY c.id_cliente
ORDER BY gasto_acumulado DESC;
"""
with engine.connect() as connection:
    result4 = connection.execute(text(query4)).fetchall()
result4

[('David Pérez', Decimal('54526.78')),
 ('Miguel Mendoza', Decimal('40272.85')),
 ('Tomás Vega', Decimal('39707.78')),
 ('Gloria Castro', Decimal('38359.25')),
 ('Andrés Jiménez', Decimal('34691.95')),
 ('Luis Paredes', Decimal('34120.55')),
 ('Adrián Serrano', Decimal('33700.45')),
 ('Carlos García', Decimal('33366.62')),
 ('Rosa Núñez', Decimal('32983.83')),
 ('María Soto', Decimal('32931.93')),
 ('Lucía Torres', Decimal('32694.39')),
 ('Vicente Torres', Decimal('32483.50')),
 ('Eva Pérez', Decimal('32397.30')),
 ('Sandra Méndez', Decimal('31190.75')),
 ('María Navarrete', Decimal('31107.98')),
 ('Carlos Pacheco', Decimal('31051.21')),
 ('Pilar Soto', Decimal('30967.21')),
 ('Nuria Carrillo', Decimal('30692.98')),
 ('Silvia Martínez', Decimal('30539.61')),
 ('Marta Fernández', Decimal('30185.86')),
 ('Joaquín Romero', Decimal('29999.51')),
 ('Raquel Herrera', Decimal('29806.32')),
 ('Teresa Reyes', Decimal('29576.38')),
 ('David Pérez', Decimal('29478.38')),
 ('Fernando Gallardo', De

5. Empleados y número de órdenes gestionadas
* Muestra el nombre del empleado, el puesto y la cantidad de órdenes que ha gestionado.
* Utiliza GROUP BY y COUNT.


In [29]:
query5 = """
SELECT e.nombre_empleado, e.puesto, COUNT(o.id_orden) AS ordenes_gestionadas
FROM empleados e
JOIN ordenes o ON e.id_empleado = o.id_empleado
GROUP BY e.id_empleado;
"""
with engine.connect() as connection:
    result5 = connection.execute(text(query5)).fetchall()
result5

[('Juan García', 'Gerente', 52),
 ('José Pérez', 'Gerente', 47),
 ('Miguel Ruiz', 'Reponedor', 38),
 ('Juan Gómez', 'Vendedor', 56),
 ('María Rodríguez', 'Vendedor', 53),
 ('José González', 'Vendedor', 32),
 ('Miguel Rodríguez', 'Gerente', 44),
 ('Lucía Rodríguez', 'Vendedor', 50),
 ('Carlos Gómez', 'Vendedor', 32),
 ('Carmen Rodríguez', 'Reponedor', 59),
 ('María López', 'Vendedor', 51),
 ('Carmen Ruiz', 'Reponedor', 50),
 ('Miguel Martínez', 'Cajero', 46),
 ('Carmen González', 'Reponedor', 46),
 ('Luis Pérez', 'Reponedor', 46),
 ('Ana López', 'Reponedor', 52),
 ('José Rodríguez', 'Gerente', 55),
 ('Carmen Martínez', 'Reponedor', 55),
 ('Luis González', 'Gerente', 55),
 ('Luis Ruiz', 'Reponedor', 60),
 ('Laura González', 'Gerente', 54),
 ('Ana López', 'Cajero', 42),
 ('Laura López', 'Vendedor', 54),
 ('Juan Sánchez', 'Gerente', 49),
 ('Carlos Gómez', 'Reponedor', 47),
 ('María González', 'Cajero', 60),
 ('Miguel García', 'Cajero', 45),
 ('Carlos Martínez', 'Reponedor', 58),
 ('Lucía G

6. Ordenes filtradas por fecha y tienda
* Muestra todas las órdenes que se realizaron en un rango de fechas determinado (ej.: del 1 de diciembre de 2024 al 31 de diciembre de 2024) y en una tienda específica.
* Incluye datos de la tienda y del cliente.

In [30]:
query6 = """
SELECT o.id_orden, o.fecha_orden, CONCAT(c.first_name, ' ', c.last_name) AS nombre_cliente, t.nombre_tienda, t.direccion
FROM ordenes o
JOIN clientes c ON o.id_cliente = c.id_cliente
JOIN empleados e ON o.id_empleado = e.id_empleado
JOIN tiendas t ON e.id_tienda = t.id_tienda
WHERE o.fecha_orden BETWEEN '2024-12-01' AND '2024-12-31'
AND t.id_tienda = :id_tienda;
"""
id_tienda = 3  
# Ejecutar la consulta y mostrar resultados
with engine.connect() as connection:
    result6 = connection.execute(text(query6), {'id_tienda': id_tienda}).fetchall()
result6

[(745, datetime.date(2024, 12, 14), 'Manuel Paredes', 'Tienda 3', 'Calle falsa 17'),
 (4173, datetime.date(2024, 12, 25), 'Julia Mendoza', 'Tienda 3', 'Calle falsa 17'),
 (6929, datetime.date(2024, 12, 12), 'Carlos Molina', 'Tienda 3', 'Calle falsa 17'),
 (956, datetime.date(2024, 12, 22), 'Rosa Núñez', 'Tienda 3', 'Calle falsa 17'),
 (4643, datetime.date(2024, 12, 3), 'Irene López', 'Tienda 3', 'Calle falsa 17'),
 (5360, datetime.date(2024, 12, 23), 'Álvaro Espinoza', 'Tienda 3', 'Calle falsa 17'),
 (7883, datetime.date(2024, 12, 7), 'Luis Ramos', 'Tienda 3', 'Calle falsa 17'),
 (8531, datetime.date(2024, 12, 24), 'Adrián Herrera', 'Tienda 3', 'Calle falsa 17'),
 (2654, datetime.date(2024, 12, 4), 'Alicia Álvarez', 'Tienda 3', 'Calle falsa 17'),
 (5288, datetime.date(2024, 12, 23), 'Eva Campos', 'Tienda 3', 'Calle falsa 17'),
 (7746, datetime.date(2024, 12, 23), 'Carlos Ortega', 'Tienda 3', 'Calle falsa 17'),
 (9195, datetime.date(2024, 12, 23), 'Roberto Navarrete', 'Tienda 3', 'Calle

7. Ranking de productos más vendidos en cada tienda
* Para cada tienda, muestra los 3 productos más vendidos (en términos de cantidad total).
* Tendrás que unir tiendas, empleados, ordenes y detalle_orden, además de productos.
* Usa GROUP BY y ordena por la cantidad sumada (y opcionalmente, un LIMIT 3).


In [31]:
query7 = """
SELECT t.id_tienda, t.nombre_tienda, p.nombre_producto, SUM(d.cantidad) AS cantidad_vendida
FROM tiendas t
JOIN empleados e ON t.id_tienda = e.id_tienda
JOIN ordenes o ON e.id_empleado = o.id_empleado
JOIN detalle_orden d ON o.id_orden = d.id_orden
JOIN productos p ON d.id_producto = p.id_producto
GROUP BY t.id_tienda, p.nombre_producto
ORDER BY t.id_tienda, cantidad_vendida DESC
"""

# Ejecutar la consulta y convertir los resultados a un DataFrame
with engine.connect() as connection:
    result7 = connection.execute(text(query7)).fetchall()

df_result7 = pd.DataFrame(result7, columns=['id_tienda','nombre_tienda', 'nombre_producto', 'cantidad_vendida'])

# Obtener los 3 productos más vendidos por tienda
top3_productos = df_result7.groupby('id_tienda').head(3)

# Mostrar los resultados
print(top3_productos)


     id_tienda nombre_tienda       nombre_producto cantidad_vendida
0            1      Tienda 1               Lechuga             2883
1            1      Tienda 1          Pan Integral             2859
2            1      Tienda 1           Mantequilla             2804
40           2      Tienda 2              Baguette             2929
41           2      Tienda 2               Chicles             2826
42           2      Tienda 2             Zanahoria             2803
80           3      Tienda 3               Brócoli             2941
81           3      Tienda 3      Refresco de Cola             2902
82           3      Tienda 3             Té Helado             2896
120          4      Tienda 4          Agua Mineral             2952
121          4      Tienda 4          Manzana Roja             2925
122          4      Tienda 4      Chuleta de Cerdo             2879
160          5      Tienda 5                Muesli             2987
161          5      Tienda 5          Pan Integr

Extra. Ranking de pedidos con mas detalles  en cada tienda
* Para cada tienda, muestra los pedidos con mas lineas(en términos de cantidad de detalles mayor que 6).
* Tendrás que unir tiendas, empleados, ordenes y detalle_orden, 
* Usa GROUP BY y ordena por la detalles (y opcionalmente, un LIMIT ).

In [32]:
query8 = """
SELECT t.id_tienda, t.nombre_tienda, o.id_orden, o.fecha_orden, CONCAT( c.first_name, ' ', c.last_name ) AS nombre_cliente, 
    COUNT(d.id_detalle) AS numero_detalles
FROM ordenes o 
JOIN clientes c ON o.id_cliente = c.id_cliente 
JOIN empleados e ON o.id_empleado = e.id_empleado 
JOIN tiendas t ON e.id_tienda = t.id_tienda 
JOIN detalle_orden d ON o.id_orden = d.id_orden
WHERE o.id_orden IN 
	( SELECT id_orden 
    FROM detalle_orden 
    GROUP BY id_orden 
    HAVING COUNT(*) > 6 )
GROUP BY t.nombre_tienda, o.id_orden, o.fecha_orden
ORDER BY  t.id_tienda, numero_detalles desc
"""

# Ejecutar la consulta y convertir los resultados a un DataFrame
with engine.connect() as connection:
    result8 = connection.execute(text(query8)).fetchall()

df_result8 = pd.DataFrame(result8, columns=['id_tienda', 'nombre_tienda', 'id_orden', 'fecha_orden', 'nombre_cliente', 'numero_detalles'])

# Obtener los 3 productos más vendidos por tienda
top3_pedidos = df_result8.groupby('id_tienda').head(3)

# Mostrar los resultados
top3_pedidos


Unnamed: 0,id_tienda,nombre_tienda,id_orden,fecha_orden,nombre_cliente,numero_detalles
0,1,Tienda 1,765,2024-03-06,Lorena Salazar,15
1,1,Tienda 1,922,2024-10-29,Álvaro Álvarez,15
2,1,Tienda 1,939,2024-10-04,Laura Serrano,15
803,2,Tienda 2,6239,2024-02-22,Raquel Herrera,15
804,2,Tienda 2,9042,2024-03-15,Roberto Gómez,15
805,2,Tienda 2,9696,2024-02-28,Francisco Romero,15
1578,3,Tienda 3,745,2024-12-14,Manuel Paredes,15
1579,3,Tienda 3,2154,2024-08-28,Juan Pacheco,15
1580,3,Tienda 3,2780,2024-02-23,Francisco Espinoza,15
2418,4,Tienda 4,962,2024-04-10,Miguel Mendoza,15
