In [66]:
import pandas as pd
import random
import string
from datetime import datetime, timedelta
import mysql.connector as con
import pymysql
import sqlalchemy
from sqlalchemy import create_engine, text
from unidecode import unidecode


In [67]:
print(f"pandas=={pd.__version__}")
print(f"sqlalchemy=={sqlalchemy.__version__}")

pandas==2.2.3
sqlalchemy==2.0.37


### 1. CREAR BASE DE DATOS (33%)

* Crear con código SQL una base de datos llamada supermercado.
* Código Python con mysql connector que ejecute el SQL para borrar y generar la base de datos vacía.

![image.png](attachment:image.png)

Tablas: 7 

tiendas
- id_tienda (PRIMARY KEY)
- nombre_tienda
- direccion
- ciudad

empleados
- id_empleado (PRIMARY KEY)
- nombre_empleado
- puesto (ej.: Cajero, Gerente, Reponedor)
- id_tienda (FOREIGN KEY que hace referencia a tiendas.id_tienda)

categorias
- id_categoria (PRIMARY KEY)
- nombre_categoria

productos
- id_producto (PRIMARY KEY)
- nombre_producto
- precio
- stock
- id_categoria (FOREIGN KEY que hace referencia a categorias.id_categoria)

clientes
- id_cliente (PRIMARY KEY)
- first_name
- last_name
- email
- codigo_postal

ordenes
- id_orden (PRIMARY KEY)
- id_cliente (FOREIGN KEY que hace referencia a clientes.id_cliente)
- id_empleado (FOREIGN KEY que hace referencia a empleados.id_empleado)
- fecha_orden
- metodo_pago (una enum que solo admita tres valores Tarjeta, Efectivo)

detalle_orden
- id_orden  (PRIMARY KEY)
- id_detalle (PRIMARY KEY)
- id_orden (FOREIGN KEY que hace referencia a ordenes.id_orden) NOT NULL
- id_producto (FOREIGN KEY que hace referencia a productos.id_producto) NOT NULL
- cantidad
- precio_unitario: mismo precio que en la tabla producto
- descuento (podría ser NULL si no se aplica)



In [68]:
# Código SQL para crear la base de datos y las tablas
sql = """
DROP DATABASE IF EXISTS supermercado;
CREATE DATABASE supermercado;
USE supermercado;
CREATE TABLE tiendas (
    id_tienda INT PRIMARY KEY,
    nombre_tienda VARCHAR(50),
    direccion VARCHAR(100),
    ciudad VARCHAR(50)
);
CREATE TABLE empleados (
    id_empleado INT PRIMARY KEY,
    nombre_empleado VARCHAR(80),
    puesto VARCHAR(20),
    id_tienda INT,
    FOREIGN KEY (id_tienda) REFERENCES tiendas(id_tienda)
);
CREATE TABLE categorias (
    id_categoria INT PRIMARY KEY,
    nombre_categoria VARCHAR(50)
);
CREATE TABLE productos (
    id_producto INT PRIMARY KEY,
    nombre_producto VARCHAR(50),
    precio DECIMAL(10, 2),
    stock INT,
    id_categoria INT,
    FOREIGN KEY (id_categoria) REFERENCES categorias(id_categoria)
);
CREATE TABLE clientes (
    id_cliente INT PRIMARY KEY,
    first_name VARCHAR(50),
    last_name VARCHAR(50),
    email VARCHAR(100),
    codigo_postal VARCHAR(5)
);
CREATE TABLE ordenes (
    id_orden INT PRIMARY KEY,
    id_cliente INT,
    id_empleado INT,
    fecha_orden DATE,
    metodo_pago ENUM('Tarjeta', 'Efectivo'),
    FOREIGN KEY (id_cliente) REFERENCES clientes(id_cliente),
    FOREIGN KEY (id_empleado) REFERENCES empleados(id_empleado)
);
CREATE TABLE detalle_orden (
    id_orden INT,
    id_detalle INT,
    id_producto INT,
    cantidad INT,
    precio_unitario DECIMAL(10, 2),
    descuento DECIMAL(10, 2),
    PRIMARY KEY (id_orden, id_detalle),
    FOREIGN KEY (id_orden) REFERENCES ordenes(id_orden),
    FOREIGN KEY (id_producto) REFERENCES productos(id_producto)
);
"""

In [69]:
try:
    conexion = con.connect(
    host="localhost",
    port= "3306",
    user= "root",
    password= "admin"
    )
    cursor = conexion.cursor()
    # Ejecutar el script SQL
    for statement in sql.split(';'):
        if statement.strip():
            cursor.execute(statement)

    conexion.commit()
except con.Error as error:
    print(f"Ha ocurrido un error: {error}")
    if conexion:
       conexion.rollback()
finally:
    if cursor: 
        cursor.close()
    if conexion:
        conexion.close()
# Cerrar la conexión
print("La base de datos y las tablas se han creado exitosamente.")


La base de datos y las tablas se han creado exitosamente.


### 2. Generar datos demo desde Python (33%)

* Generar datos aleatorios en listas con Python similar los realizados en clase.
    * Uso de datetime, timedelta, random para generar datos aleatorios
* Pasar los datos a DataFrames de Pandas
* Pasar los DataFrames de Pandas a MySQL usando la función to_sql de Pandas con SQLAlchemy o usando MySQL Connector con sentencias INSERT.

tiendas

* id_tienda: valores enteros consecutivos (por ejemplo, 1, 2, 3...).
* nombre_tienda: nombres ficticios o genéricos (p. ej. "Tienda Centro", "Super Norte", "Super Sur").
* direccion: direcciones simples (p. ej. “Calle Falsa 123”).
* ciudad: usar nombres de ciudades ficticias o reales (p. ej. “Madrid”, “Barcelona”, “México DF”, etc.).

En total 5 o 10 tiendas.


In [70]:
# Funciones para generar datos aleatorios
def random_date(start, end):
    return start + timedelta(days=random.randint(0, (end - start).days))

In [71]:
# Generar datos para tiendas
tiendas = []
for i in range(1, 11):
    tiendas.append({
        'id_tienda': i,
        'nombre_tienda': f'Tienda {i}',
        'direccion': f'Calle falsa {random.randint(1, 100)}',
        'ciudad': random.choice(['Madrid', 'Barcelona', 'A Coruña', 'Valencia', 'Sevilla'])
    })

df_tiendas = pd.DataFrame(tiendas)
df_tiendas

Unnamed: 0,id_tienda,nombre_tienda,direccion,ciudad
0,1,Tienda 1,Calle falsa 56,Valencia
1,2,Tienda 2,Calle falsa 37,Madrid
2,3,Tienda 3,Calle falsa 45,Sevilla
3,4,Tienda 4,Calle falsa 43,Barcelona
4,5,Tienda 5,Calle falsa 74,Sevilla
5,6,Tienda 6,Calle falsa 20,Madrid
6,7,Tienda 7,Calle falsa 3,Barcelona
7,8,Tienda 8,Calle falsa 27,Valencia
8,9,Tienda 9,Calle falsa 43,Valencia
9,10,Tienda 10,Calle falsa 61,Madrid


empleados

* id_empleado: valores enteros consecutivos (1, 2, 3...).
* nombre_empleado: nombres y apellidos ficticios (p. ej. “Laura Gutiérrez”, “Juan Pérez”).
* puesto: limitarse a un conjunto reducido de valores (p. ej. {‘Cajero’, ‘Gerente’, ‘Reponedor’, ‘Vendedor’}).
* id_tienda: debe hacer referencia a una tienda existente (por ejemplo, un número entre 1 y 3 si solo tienes 3 tiendas).

En total 20 empleados por tienda.

In [72]:
# Listas de nombres y apellidos 
nombres = ['Carlos', 'María', 'Juan', 'Laura', 'José', 'Ana', 'Luis', 'Carmen', 'Miguel', 'Lucía'] 
apellidos = ['García', 'Martínez', 'López', 'Sánchez', 'Pérez', 'González', 'Rodríguez', 'Fernández', 'Gómez', 'Ruiz']
# # Generar datos para empleados
empleados = []
numero_empleado = 0
for tienda in tiendas:
    for i in range(1, 21): 
        numero_empleado += 1
        empleados.append({
            'id_empleado': numero_empleado,
            'nombre_empleado': f'{random.choice(nombres)} {random.choice(apellidos)}',
            'puesto': random.choice(['Cajero', 'Gerente', 'Reponedor', 'Vendedor']),
            'id_tienda': tienda['id_tienda']
        })

In [73]:
df_empleados = pd.DataFrame(empleados)
df_empleados

Unnamed: 0,id_empleado,nombre_empleado,puesto,id_tienda
0,1,Carmen Ruiz,Gerente,1
1,2,María Fernández,Reponedor,1
2,3,Lucía Rodríguez,Reponedor,1
3,4,María González,Vendedor,1
4,5,Lucía González,Gerente,1
...,...,...,...,...
195,196,Laura Sánchez,Reponedor,10
196,197,Carlos González,Vendedor,10
197,198,Luis Sánchez,Gerente,10
198,199,Carlos Rodríguez,Gerente,10


categorias

* id_categoria: valores enteros consecutivos (1, 2, 3...).
* nombre_categoria: selección de categorías (p. ej. “Lácteos”, “Carnes”, “Frutas”, “Verduras”, “Bebidas”, “Snacks”).

En total 10 categorías.


In [74]:
categorias_productos = [ 'Lácteos', 'Carnes', 'Frutas', 'Verduras', 'Bebidas', 'Snacks', 'Panadería', 'Congelados', 'Dulces', 'Cereales' ]

In [75]:
# Generar datos para categorías

categorias = []
numero_categotia = 0
for categoria in categorias_productos:
    numero_categotia += 1
    categorias.append({
        'id_categoria': numero_categotia,
        'nombre_categoria': categoria
    })

In [76]:
df_categorias = pd.DataFrame(categorias)
df_categorias

Unnamed: 0,id_categoria,nombre_categoria
0,1,Lácteos
1,2,Carnes
2,3,Frutas
3,4,Verduras
4,5,Bebidas
5,6,Snacks
6,7,Panadería
7,8,Congelados
8,9,Dulces
9,10,Cereales


productos

* id_producto: valores enteros consecutivos (1, 2, 3...).
nombre_producto: nombres como “Leche Entera”, “Manzana Roja”, “Refresco de Cola”, etc.
* precio: valores DECIMAL entre 0.50 y 50.00, por ejemplo.
* stock: valores INT entre 0 y 500 (o el rango que quieras).
* id_categoria: debe hacer referencia a las categorías que hayas definido (1, 2, 3, etc.).

En total 4 productos de cada categoría.

In [77]:
productos_por_categoria = {
    'Lácteos': ['Leche Entera', 'Yogur Natural', 'Queso Manchego', 'Mantequilla'],
    'Carnes': ['Filete de Ternera', 'Pechuga de Pollo', 'Chuleta de Cerdo', 'Salchichas'],
    'Frutas': ['Manzana Roja', 'Plátano', 'Naranja', 'Uvas'],
    'Verduras': ['Zanahoria', 'Espinacas', 'Brócoli', 'Lechuga'],
    'Bebidas': ['Refresco de Cola', 'Jugo de Naranja', 'Agua Mineral', 'Té Helado'],
    'Snacks': ['Papas Fritas', 'Galletas de Chocolate', 'Barrita de Granola', 'Palomitas de Maíz'],
    'Panadería': ['Pan de Molde', 'Croissant', 'Pan Integral', 'Baguette'],
    'Congelados': ['Pizza Congelada', 'Helado de Vainilla', 'Guisantes Congelados', 'Patatas Fritas Congeladas'],
    'Dulces': ['Chocolate con Leche', 'Caramelos', 'Galletas de Mantequilla', 'Chicles'],
    'Cereales': ['Corn Flakes', 'Muesli', 'Avena', 'Arroz Inflado']
}

In [78]:
id_producto = 0
productos = []

# Generar productos
for id_categoria, nombre_categoria in enumerate(categorias_productos, start=1):
    for nombre_producto in productos_por_categoria[nombre_categoria]:
        id_producto += 1
        productos.append({
            'id_producto': id_producto,
            'nombre_producto': nombre_producto,
            'precio': round(random.uniform(0.50, 50.00), 2),
            'stock': random.randint(0, 500),
            'id_categoria': id_categoria
        })

In [79]:
df_productos = pd.DataFrame(productos)
df_productos

Unnamed: 0,id_producto,nombre_producto,precio,stock,id_categoria
0,1,Leche Entera,1.88,222,1
1,2,Yogur Natural,0.87,316,1
2,3,Queso Manchego,42.44,203,1
3,4,Mantequilla,28.69,424,1
4,5,Filete de Ternera,31.74,106,2
5,6,Pechuga de Pollo,41.71,222,2
6,7,Chuleta de Cerdo,38.46,212,2
7,8,Salchichas,11.31,345,2
8,9,Manzana Roja,49.74,120,3
9,10,Plátano,41.13,230,3


clientes

* id_cliente: valores enteros consecutivos (1, 2, 3...).
* nombre_cliente: nombres y apellidos ficticios (p. ej. “Carlos López”, “María Gil”).
* email: podrías generar correos ficticios (p. ej. “carlos.lopez@test.com”).
* telefono: número de 9 o 10 dígitos (dependiendo del país).
* direccion: calles y números ficticios (p. ej. “Av. Siempre Viva 742”).

En total: 2000.

In [80]:
nombres1 = [
    'Carlos', 'María', 'Juan', 'Laura', 'José', 'Ana', 'Luis', 'Carmen', 'Miguel', 'Lucía',
    'Antonio', 'Isabel', 'Francisco', 'Teresa', 'David', 'Elena', 'Javier', 'Marta', 'Manuel', 'Patricia',
    'Pablo', 'Rosa', 'Álvaro', 'Silvia', 'Sergio', 'Raquel', 'Alejandro', 'Beatriz', 'Fernando', 'Clara',
    'Ramón', 'Julia', 'Andrés', 'Alicia', 'Roberto', 'Sonia', 'Vicente', 'Lorena', 'Adrián', 'Gloria',
    'Joaquín', 'Sandra', 'Jesús', 'Irene', 'Tomás', 'Pilar', 'Ignacio', 'Eva', 'Guillermo', 'Nuria'
]

# Listas de apellidos de clientes
apellidos1 = [
    'García', 'Martínez', 'López', 'Sánchez', 'Pérez', 'González', 'Rodríguez', 'Fernández', 'Gómez', 'Ruiz',
    'Díaz', 'Álvarez', 'Morales', 'Ortega', 'Castillo', 'Romero', 'Vega', 'Torres', 'Flores', 'Ramos',
    'Castro', 'Silva', 'Rojas', 'Mendoza', 'Molina', 'Herrera', 'Vargas', 'Delgado', 'Paredes', 'Cabrera',
    'Gallardo', 'Núñez', 'Aguirre', 'Valdez', 'Peña', 'Salazar', 'Fuentes', 'Mora', 'Méndez', 'Jiménez',
    'Espinoza', 'Pacheco', 'León', 'Soto', 'Reyes', 'Campos', 'Carrillo', 'Navarrete', 'Bustamante', 'Serrano'
]


In [81]:
clientes = []
for i in range(1, 2001):
    nombre = random.choice(nombres1)
    apellido = random.choice(apellidos1)
    nombre_sin_acento = unidecode(nombre).lower()
    apellido_sin_acento = unidecode(apellido).lower()
    clientes.append({
        'id_cliente': i,
        'first_name': nombre,
        'last_name': apellido,
        'email': f'{nombre_sin_acento}.{apellido_sin_acento}@test.com',
        'codigo_postal': ''.join(random.choices(string.digits, k=5))
    })

In [82]:
df_clientes = pd.DataFrame(clientes)
df_clientes

Unnamed: 0,id_cliente,first_name,last_name,email,codigo_postal
0,1,Antonio,Silva,antonio.silva@test.com,38999
1,2,Ana,Martínez,ana.martinez@test.com,73833
2,3,Laura,Gómez,laura.gomez@test.com,87894
3,4,Julia,Castillo,julia.castillo@test.com,77506
4,5,Ramón,Ramos,ramon.ramos@test.com,65251
...,...,...,...,...,...
1995,1996,Tomás,Pacheco,tomas.pacheco@test.com,49184
1996,1997,Ana,Ramos,ana.ramos@test.com,47710
1997,1998,Julia,Paredes,julia.paredes@test.com,16826
1998,1999,Isabel,Rodríguez,isabel.rodriguez@test.com,10955


ordenes

* id_orden: valores enteros consecutivos (1, 2, 3...).
* id_cliente: haz referencia a los IDs existentes de la tabla clientes.
* id_empleado: haz referencia a los IDs existentes de la tabla empleados.
* fecha_orden: genera fechas aleatorias o secuenciales (p. ej. entre ‘2024-01-01’ y ‘2025-01-01’).
* metodo_pago: escoge entre {‘Tarjeta’, ‘Efectivo’}.

En total: 10000.


In [83]:
# Generar datos para órdenes
ordenes = []
for i in range(1, 10001):
    ordenes.append({
        'id_orden': i,
        'id_cliente': random.randint(1, 2000),
        'id_empleado': random.randint(1, 200),
        'fecha_orden': random_date(datetime(2024, 1, 1), datetime(2025, 1, 1)),
        'metodo_pago': random.choices(['Tarjeta', 'Efectivo'], weights=[0.70, 0.30])[0]
    })

In [84]:
df_ordenes = pd.DataFrame(ordenes)
df_ordenes

Unnamed: 0,id_orden,id_cliente,id_empleado,fecha_orden,metodo_pago
0,1,1081,195,2024-05-02,Tarjeta
1,2,457,94,2024-03-27,Efectivo
2,3,1240,118,2024-03-05,Tarjeta
3,4,1086,131,2024-06-22,Tarjeta
4,5,1115,168,2024-01-17,Tarjeta
...,...,...,...,...,...
9995,9996,180,118,2024-08-18,Tarjeta
9996,9997,1761,146,2024-12-06,Tarjeta
9997,9998,1863,165,2024-02-04,Tarjeta
9998,9999,703,83,2024-09-06,Tarjeta


In [85]:
df_productos.head()

Unnamed: 0,id_producto,nombre_producto,precio,stock,id_categoria
0,1,Leche Entera,1.88,222,1
1,2,Yogur Natural,0.87,316,1
2,3,Queso Manchego,42.44,203,1
3,4,Mantequilla,28.69,424,1
4,5,Filete de Ternera,31.74,106,2


detalle_orden

* id_orden: referencia al ID de alguna orden válida.
* id_detalle: para cada orden de id_orden generar un numero aleatorio de id_detalles de entre 5 y 15
* id_producto: referencia al ID de algún producto válido.
* cantidad: valores entre 1 y 20, por ejemplo.
* precio_unitario: usar el mismo precio que está en la tabla productos o uno ligeramente distinto si quieres simular ofertas.
* descuento: valores DECIMAL bajos (p. ej. 0.00, 1.00, 2.50) o NULL.



In [86]:
detalle_orden = []
for id_orden in df_ordenes['id_orden']:
    num_detalles = random.randint(5, 15)
    for id_detalle in range(1, num_detalles + 1):
        id_producto = random.randint(1, 40)
        precio_base = df_productos[df_productos['id_producto'] == id_producto]['precio'].values[0]
        detalle_orden.append({
            'id_orden': id_orden,
            'id_detalle': id_detalle,
            'id_producto': id_producto,
            'cantidad': random.randint(1, 20),
            'precio_unitario': round(precio_base * (1 + random.uniform(-0.10, 0.00)), 2) if random.random() > 0.8 else round(precio_base, 2),
            'descuento': round(random.uniform(0.00, 2.50), 2) if random.random() > 0.5 else None
        })


In [87]:
df_detalle_orden = pd.DataFrame(detalle_orden)
df_detalle_orden

Unnamed: 0,id_orden,id_detalle,id_producto,cantidad,precio_unitario,descuento
0,1,1,28,10,31.69,
1,1,2,37,17,46.22,2.44
2,1,3,23,6,16.79,1.96
3,1,4,9,3,49.74,
4,1,5,31,18,42.89,
...,...,...,...,...,...,...
99484,10000,5,32,16,24.32,1.58
99485,10000,6,32,8,24.32,
99486,10000,7,22,4,19.28,2.38
99487,10000,8,2,3,0.87,


In [88]:
user = "root"
password = "admin"
database = "supermercado"

# Crear la conexión
engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

In [89]:
df_tiendas.to_sql('tiendas', con=engine, if_exists='append', index=False)
df_empleados.to_sql('empleados', con=engine, if_exists='append', index=False)
df_categorias.to_sql('categorias', con=engine, if_exists='append', index=False)
df_productos.to_sql('productos', con=engine, if_exists='append', index=False)
df_clientes.to_sql('clientes', con=engine, if_exists='append', index=False)
df_ordenes.to_sql('ordenes', con=engine, if_exists='append', index=False)
df_detalle_orden.to_sql('detalle_orden', con=engine, if_exists='append', index=False)


99489

### 3. Consultas SQL (34%)

Opcional: añadir alguna consulta con subconsultas o algo que no se abarque en las anteriores consulta.


1. Listado de órdenes con detalles de cliente y empleado
* Muestra el ID de la orden, la fecha, el nombre del cliente, el nombre del empleado que atendió la compra y el método de pago.
* Utiliza un JOIN entre las tablas ordenes, clientes y empleados.


In [90]:
query1 = """
SELECT o.id_orden, o.fecha_orden, CONCAT( c.first_name, ' ', c.last_name) AS nombre_cliente, e.nombre_empleado, o.metodo_pago
FROM ordenes o
JOIN clientes c ON o.id_cliente = c.id_cliente
JOIN empleados e ON o.id_empleado = e.id_empleado;
"""
with engine.connect() as connection:
    # Ejecutar y mostrar resultados para cada consulta
    result1 = connection.execute(text(query1)).fetchall()
result1

[(48, datetime.date(2024, 6, 12), 'Sonia Gómez', 'Carmen Ruiz', 'Tarjeta'),
 (321, datetime.date(2024, 5, 9), 'Alicia Vega', 'Carmen Ruiz', 'Tarjeta'),
 (640, datetime.date(2024, 4, 2), 'Pablo Serrano', 'Carmen Ruiz', 'Tarjeta'),
 (736, datetime.date(2024, 10, 6), 'Miguel Castro', 'Carmen Ruiz', 'Tarjeta'),
 (817, datetime.date(2024, 1, 27), 'Adrián Peña', 'Carmen Ruiz', 'Tarjeta'),
 (951, datetime.date(2024, 2, 19), 'Teresa Serrano', 'Carmen Ruiz', 'Efectivo'),
 (975, datetime.date(2024, 9, 29), 'Irene Espinoza', 'Carmen Ruiz', 'Efectivo'),
 (1556, datetime.date(2024, 3, 13), 'Ignacio Fernández', 'Carmen Ruiz', 'Tarjeta'),
 (1627, datetime.date(2024, 7, 7), 'Lucía Espinoza', 'Carmen Ruiz', 'Tarjeta'),
 (1766, datetime.date(2024, 7, 20), 'Lorena Ruiz', 'Carmen Ruiz', 'Tarjeta'),
 (2248, datetime.date(2024, 1, 2), 'Andrés Reyes', 'Carmen Ruiz', 'Tarjeta'),
 (2399, datetime.date(2024, 10, 25), 'Rosa Gómez', 'Carmen Ruiz', 'Tarjeta'),
 (2502, datetime.date(2024, 4, 28), 'Tomás López', 'Ca

2. Productos con stock bajo
* Filtra aquellos productos cuyo stock sea menor a 10.
* Muestra nombre del producto, categoría y stock.

In [91]:
query2 = """
SELECT p.nombre_producto, c.nombre_categoria, p.stock
FROM productos p
JOIN categorias c ON p.id_categoria = c.id_categoria
WHERE p.stock < 10;
"""
with engine.connect() as connection:
    result2 = connection.execute(text(query2)).fetchall()
result2

[]

3. Ventas totales por categoría
* Muestra el nombre de la categoría y la suma total de las ventas (ej.: multiplicando cantidad * precio_unitario) para cada categoría.
* Realiza el JOIN con detalle_orden, productos y categorias.
* Utiliza agrupación (GROUP BY).

In [92]:
query3 = """
SELECT c.nombre_categoria, SUM(d.cantidad * d.precio_unitario) AS total_ventas
FROM detalle_orden d
JOIN productos p ON d.id_producto = p.id_producto
JOIN categorias c ON p.id_categoria = c.id_categoria
GROUP BY c.nombre_categoria;
"""
with engine.connect() as connection:
    result3 = connection.execute(text(query3)).fetchall()
result3

[('Lácteos', Decimal('1899780.49')),
 ('Carnes', Decimal('3176586.49')),
 ('Frutas', Decimal('4163898.10')),
 ('Verduras', Decimal('2718662.23')),
 ('Bebidas', Decimal('3244096.01')),
 ('Snacks', Decimal('2635928.88')),
 ('Panadería', Decimal('2624027.75')),
 ('Congelados', Decimal('3281921.80')),
 ('Dulces', Decimal('2158233.93')),
 ('Cereales', Decimal('3541139.92'))]

4. Clientes con mayores gastos acumulados
* Muestra el nombre del cliente y el monto total que ha gastado (suma de todas sus órdenes).
* Asegúrate de tener en cuenta posibles descuentos (descuento) si se ha definido. Por ejemplo, la fórmula podría ser (cantidad * precio_unitario) - descuento.
* Ordena el resultado de mayor a menor gasto acumulado.


In [93]:
query4 = """
SELECT CONCAT(c.first_name,' ', c.last_name) AS nombre_cliente,
       SUM((d.cantidad * d.precio_unitario) * (1 - IFNULL(d.descuento, 0) / 100)) AS gasto_acumulado
FROM clientes c
JOIN ordenes o ON c.id_cliente = o.id_cliente
JOIN detalle_orden d ON o.id_orden = d.id_orden
GROUP BY c.id_cliente
ORDER BY gasto_acumulado DESC;
"""
with engine.connect() as connection:
    result4 = connection.execute(text(query4)).fetchall()
result4

[('Lucía Bustamante', Decimal('39609.54402800')),
 ('Lucía Navarrete', Decimal('39053.20016700')),
 ('Andrés Romero', Decimal('38779.33648600')),
 ('Sandra León', Decimal('38037.50172300')),
 ('Roberto León', Decimal('37239.65160500')),
 ('Lucía León', Decimal('36648.37917600')),
 ('Adrián Díaz', Decimal('36519.19391800')),
 ('Alicia Reyes', Decimal('35850.08180800')),
 ('Julia Paredes', Decimal('34807.09589800')),
 ('Lucía Delgado', Decimal('34536.43222700')),
 ('Silvia Flores', Decimal('34516.15780500')),
 ('Ana León', Decimal('34343.11246900')),
 ('Clara Serrano', Decimal('34250.71666900')),
 ('Nuria Bustamante', Decimal('34127.49790900')),
 ('David Martínez', Decimal('34004.43557300')),
 ('Eva Núñez', Decimal('33986.94989300')),
 ('Pablo Sánchez', Decimal('33945.57106200')),
 ('Roberto Rodríguez', Decimal('33356.11286700')),
 ('María Torres', Decimal('33334.26276200')),
 ('Irene Rodríguez', Decimal('32992.50898800')),
 ('Miguel Delgado', Decimal('32754.40990100')),
 ('Ramón Álvarez

5. Empleados y número de órdenes gestionadas
* Muestra el nombre del empleado, el puesto y la cantidad de órdenes que ha gestionado.
* Utiliza GROUP BY y COUNT.


In [94]:
query5 = """
SELECT e.nombre_empleado,
       e.puesto,
       COUNT(o.id_orden) AS ordenes_gestionadas
FROM empleados e
JOIN ordenes o ON e.id_empleado = o.id_empleado
GROUP BY e.id_empleado;
"""
with engine.connect() as connection:
    result5 = connection.execute(text(query5)).fetchall()
result5

[('Carmen Ruiz', 'Gerente', 41),
 ('María Fernández', 'Reponedor', 45),
 ('Lucía Rodríguez', 'Reponedor', 44),
 ('María González', 'Vendedor', 51),
 ('Lucía González', 'Gerente', 50),
 ('Juan López', 'Gerente', 48),
 ('Miguel Martínez', 'Vendedor', 62),
 ('Miguel García', 'Cajero', 34),
 ('Luis Martínez', 'Gerente', 49),
 ('Luis García', 'Cajero', 54),
 ('Ana Gómez', 'Gerente', 50),
 ('Laura Rodríguez', 'Reponedor', 53),
 ('Miguel Gómez', 'Cajero', 55),
 ('Carlos Ruiz', 'Reponedor', 65),
 ('Carlos González', 'Vendedor', 48),
 ('María Gómez', 'Reponedor', 48),
 ('Miguel López', 'Vendedor', 57),
 ('Carmen Sánchez', 'Reponedor', 57),
 ('María López', 'Gerente', 36),
 ('Carlos Fernández', 'Reponedor', 55),
 ('Laura González', 'Reponedor', 51),
 ('Lucía García', 'Vendedor', 42),
 ('Lucía Pérez', 'Cajero', 45),
 ('Lucía Martínez', 'Vendedor', 46),
 ('Carmen Pérez', 'Gerente', 49),
 ('Luis Rodríguez', 'Reponedor', 47),
 ('Miguel González', 'Vendedor', 48),
 ('Lucía González', 'Gerente', 53),


6. Ordenes filtradas por fecha y tienda
* Muestra todas las órdenes que se realizaron en un rango de fechas determinado (ej.: del 1 de diciembre de 2024 al 31 de diciembre de 2024) y en una tienda específica.
* Incluye datos de la tienda y del cliente.

In [95]:
query6 = """
SELECT o.id_orden,
       o.fecha_orden,
       CONCAT(c.first_name, ' ', c.last_name) AS nombre_cliente,
       t.nombre_tienda,
       t.direccion
FROM ordenes o
JOIN clientes c ON o.id_cliente = c.id_cliente
JOIN empleados e ON o.id_empleado = e.id_empleado
JOIN tiendas t ON e.id_tienda = t.id_tienda
WHERE o.fecha_orden BETWEEN '2024-12-01' AND '2024-12-31'
AND t.id_tienda = :id_tienda;
"""
id_tienda = 3  
# Ejecutar la consulta y mostrar resultados
with engine.connect() as connection:
    result6 = connection.execute(text(query6), {'id_tienda': id_tienda}).fetchall()
result6

[(1435, datetime.date(2024, 12, 14), 'Fernando Jiménez', 'Tienda 3', 'Calle falsa 45'),
 (5445, datetime.date(2024, 12, 6), 'Juan Serrano', 'Tienda 3', 'Calle falsa 45'),
 (6674, datetime.date(2024, 12, 26), 'Pilar Molina', 'Tienda 3', 'Calle falsa 45'),
 (7341, datetime.date(2024, 12, 11), 'Antonio Vega', 'Tienda 3', 'Calle falsa 45'),
 (498, datetime.date(2024, 12, 21), 'Gloria Gómez', 'Tienda 3', 'Calle falsa 45'),
 (3704, datetime.date(2024, 12, 17), 'Carmen Martínez', 'Tienda 3', 'Calle falsa 45'),
 (4661, datetime.date(2024, 12, 22), 'Rosa Salazar', 'Tienda 3', 'Calle falsa 45'),
 (7174, datetime.date(2024, 12, 9), 'Sonia Delgado', 'Tienda 3', 'Calle falsa 45'),
 (9726, datetime.date(2024, 12, 28), 'Ana Rojas', 'Tienda 3', 'Calle falsa 45'),
 (237, datetime.date(2024, 12, 1), 'Antonio Valdez', 'Tienda 3', 'Calle falsa 45'),
 (420, datetime.date(2024, 12, 12), 'Ana Navarrete', 'Tienda 3', 'Calle falsa 45'),
 (1294, datetime.date(2024, 12, 27), 'Luis Rojas', 'Tienda 3', 'Calle fals

7. Ranking de productos más vendidos en cada tienda
* Para cada tienda, muestra los 3 productos más vendidos (en términos de cantidad total).
* Tendrás que unir tiendas, empleados, ordenes y detalle_orden, además de productos.
* Usa GROUP BY y ordena por la cantidad sumada (y opcionalmente, un LIMIT 3).


In [96]:
query7 = """
SELECT t.id_tienda, 
       t.nombre_tienda,
       p.nombre_producto,
       SUM(d.cantidad) AS cantidad_vendida
FROM tiendas t
JOIN empleados e ON t.id_tienda = e.id_tienda
JOIN ordenes o ON e.id_empleado = o.id_empleado
JOIN detalle_orden d ON o.id_orden = d.id_orden
JOIN productos p ON d.id_producto = p.id_producto
GROUP BY t.id_tienda, p.nombre_producto
ORDER BY t.id_tienda, cantidad_vendida DESC
"""

# Ejecutar la consulta y convertir los resultados a un DataFrame
with engine.connect() as connection:
    result7 = connection.execute(text(query7)).fetchall()

df_result7 = pd.DataFrame(result7, columns=['id_tienda','nombre_tienda', 'nombre_producto', 'cantidad_vendida'])

# Obtener los 3 productos más vendidos por tienda
top3_productos = df_result7.groupby('id_tienda').head(3)

# Mostrar los resultados
print(top3_productos)


     id_tienda nombre_tienda          nombre_producto cantidad_vendida
0            1      Tienda 1                    Avena             2882
1            1      Tienda 1            Arroz Inflado             2864
2            1      Tienda 1                  Plátano             2859
40           2      Tienda 2                  Naranja             2894
41           2      Tienda 2  Galletas de Mantequilla             2759
42           2      Tienda 2          Jugo de Naranja             2749
80           3      Tienda 3         Pechuga de Pollo             2926
81           3      Tienda 3                  Naranja             2743
82           3      Tienda 3                Espinacas             2710
120          4      Tienda 4             Papas Fritas             3157
121          4      Tienda 4     Guisantes Congelados             2915
122          4      Tienda 4             Leche Entera             2879
160          5      Tienda 5         Refresco de Cola             3165
161   

Extra. Ranking de pedidos con mas detalles  en cada tienda
* Para cada tienda, muestra los pedidos con mas lineas(en términos de cantidad de detalles mayor que 6).
* Tendrás que unir tiendas, empleados, ordenes y detalle_orden, 
* Usa GROUP BY y ordena por la detalles (y opcionalmente, un LIMIT ).

In [97]:
query8 = """
SELECT t.id_tienda,
       t.nombre_tienda,
       o.id_orden,
       o.fecha_orden,
       CONCAT( c.first_name, ' ', c.last_name ) AS nombre_cliente, 
       COUNT(d.id_detalle) AS numero_detalles
FROM ordenes o 
JOIN clientes c ON o.id_cliente = c.id_cliente 
JOIN empleados e ON o.id_empleado = e.id_empleado 
JOIN tiendas t ON e.id_tienda = t.id_tienda 
JOIN detalle_orden d ON o.id_orden = d.id_orden
WHERE o.id_orden IN 
	( SELECT id_orden 
    FROM detalle_orden 
    GROUP BY id_orden 
    HAVING COUNT(*) > 6 )
GROUP BY t.nombre_tienda, o.id_orden, o.fecha_orden
ORDER BY  t.id_tienda, numero_detalles desc
"""

# Ejecutar la consulta y convertir los resultados a un DataFrame
with engine.connect() as connection:
    result8 = connection.execute(text(query8)).fetchall()

df_result8 = pd.DataFrame(result8, columns=['id_tienda', 'nombre_tienda', 'id_orden', 'fecha_orden', 'nombre_cliente', 'numero_detalles'])

# Obtener los 3 productos más vendidos por tienda
top3_pedidos = df_result8.groupby('id_tienda').head(3)

# Mostrar los resultados
top3_pedidos


Unnamed: 0,id_tienda,nombre_tienda,id_orden,fecha_orden,nombre_cliente,numero_detalles
0,1,Tienda 1,951,2024-02-19,Teresa Serrano,15
1,1,Tienda 1,2980,2024-05-19,Joaquín Pacheco,15
2,1,Tienda 1,3291,2024-10-17,Elena Romero,15
810,2,Tienda 2,2015,2024-08-03,Adrián Díaz,15
811,2,Tienda 2,3074,2024-06-06,Lorena Paredes,15
812,2,Tienda 2,3481,2024-07-27,Ana Valdez,15
1598,3,Tienda 3,1837,2024-05-26,Gloria Paredes,15
1599,3,Tienda 3,8974,2024-01-13,María Reyes,15
1600,3,Tienda 3,396,2024-09-01,Fernando Pacheco,15
2340,4,Tienda 4,399,2024-08-26,Gloria Delgado,15


Cantidad de ordenes y la media de detalles para cada tienda

In [98]:
query9 = """
SELECT 
    t.id_tienda,
    t.nombre_tienda,
    COUNT(DISTINCT o.id_orden) AS cantidad_ordenes,
    AVG(do.cantidad) AS media_detalles
FROM tiendas t
LEFT JOIN empleados e ON t.id_tienda = e.id_tienda
LEFT JOIN ordenes o ON e.id_empleado = o.id_empleado
LEFT JOIN detalle_orden do ON o.id_orden = do.id_orden
GROUP BY t.id_tienda, t.nombre_tienda;
"""
# Ejecutar la consulta y mostrar resultados
with engine.connect() as connection:
    result9 = connection.execute(text(query9)).fetchall()
result9

[(1, 'Tienda 1', 1002, Decimal('10.4766')),
 (2, 'Tienda 2', 969, Decimal('10.4763')),
 (3, 'Tienda 3', 942, Decimal('10.5391')),
 (4, 'Tienda 4', 1008, Decimal('10.4550')),
 (5, 'Tienda 5', 1083, Decimal('10.5462')),
 (6, 'Tienda 6', 985, Decimal('10.4377')),
 (7, 'Tienda 7', 1002, Decimal('10.6305')),
 (8, 'Tienda 8', 995, Decimal('10.3891')),
 (9, 'Tienda 9', 1022, Decimal('10.4901')),
 (10, 'Tienda 10', 992, Decimal('10.6042'))]