# Ejercicio Módulo 4. Bases de Datos.

## 1. Crear Base de Datos.

### 1.1. Conexión entre Python-MySQL Workbench

In [8]:
import mysql.connector

conn = mysql.connector.connect(
    host="localhost",  
    user="root",  
    password="Mariaadmin99"
)
cursor = conn.cursor()

### 1.2. Código Python de la Base de Datos Supermercado.sql

In [8]:
sql_statements = [
    "DROP DATABASE IF EXISTS supermercado;",
    "CREATE DATABASE supermercado;",
    "USE supermercado;",
    """
    CREATE TABLE tiendas (
        id_tienda INT AUTO_INCREMENT PRIMARY KEY,
        nombre_tienda VARCHAR(100),
        direccion VARCHAR(255),
        ciudad VARCHAR(100)
    );
    """,
    """
    CREATE TABLE empleados (
        id_empleado INT AUTO_INCREMENT PRIMARY KEY,
        nombre_empleado VARCHAR(100),
        puesto ENUM('Cajero', 'Gerente', 'Reponedor'),
        id_tienda INT,
        FOREIGN KEY (id_tienda) REFERENCES tiendas(id_tienda)
    );
    """,
    """
    CREATE TABLE categorias (
        id_categoria INT AUTO_INCREMENT PRIMARY KEY,
        nombre_categoria VARCHAR(100)
    );
    """,
    """
    CREATE TABLE productos (
        id_producto INT AUTO_INCREMENT PRIMARY KEY,
        nombre_producto VARCHAR(100),
        precio DECIMAL(10, 2),
        stock INT,
        id_categoria INT,
        FOREIGN KEY (id_categoria) REFERENCES categorias(id_categoria)
    );
    """,
    """
    CREATE TABLE clientes (
        id_cliente INT AUTO_INCREMENT PRIMARY KEY,
        first_name VARCHAR(100),
        last_name VARCHAR(100),
        email VARCHAR(100) UNIQUE,
        codigo_postal VARCHAR(20)
    );
    """,
    """
    CREATE TABLE ordenes (
        id_orden INT AUTO_INCREMENT PRIMARY KEY,
        id_cliente INT,
        id_empleado INT,
        fecha_orden DATE,
        metodo_pago ENUM('Tarjeta', 'Efectivo'),
        FOREIGN KEY (id_cliente) REFERENCES clientes(id_cliente),
        FOREIGN KEY (id_empleado) REFERENCES empleados(id_empleado)
    );
    """,
    """
    CREATE TABLE detalle_orden (
        id_detalle INT AUTO_INCREMENT PRIMARY KEY,
        id_orden INT NOT NULL,
        id_producto INT NOT NULL,
        cantidad INT,
        precio_unitario DECIMAL(10, 2),
        descuento DECIMAL(10, 2),
        FOREIGN KEY (id_orden) REFERENCES ordenes(id_orden),
        FOREIGN KEY (id_producto) REFERENCES productos(id_producto)
    );
    """
]

try:
    cursor.execute("SET SESSION sql_notes = 0;")  # Desactiva warnings por FOREIGN KEYS
    for statement in sql_statements:
        cursor.execute(statement)
        print(f"Ejecutado: {statement.strip().splitlines()[0]}")  # Muestra la primera línea del SQL ejecutado
except mysql.connector.Error as err:
    print(f"Error: {err}")
finally:
    cursor.close()
    conn.close()

print("Base de datos y tablas creadas correctamente.")


Ejecutado: DROP DATABASE IF EXISTS supermercado;
Ejecutado: CREATE DATABASE supermercado;
Ejecutado: USE supermercado;
Ejecutado: CREATE TABLE tiendas (
Ejecutado: CREATE TABLE empleados (
Ejecutado: CREATE TABLE categorias (
Ejecutado: CREATE TABLE productos (
Ejecutado: CREATE TABLE clientes (
Ejecutado: CREATE TABLE ordenes (
Ejecutado: CREATE TABLE detalle_orden (
Base de datos y tablas creadas correctamente.


## 2. Generar datos demo desde Python.

### *Importando las librerías necesarias*

In [55]:
import random
import pandas as pd
from datetime import datetime, timedelta
from sqlalchemy import create_engine

### *Conexión entre Python-MySQL Workbench*

In [64]:
from sqlalchemy import create_engine

user = "root"  
password = "1999maria"  
host = "localhost"  
database = "supermercado"  

engine = create_engine(f"mysql+mysqlconnector://{user}:{password}@{host}/{database}")


### 2.1. Datos demo

### 2.1.1. Tiendas

In [99]:
import random

tiendas = [5]
for i in range(1, 6):
    nombre_tienda = f"Tienda {random.choice(['Principal', 'Norte', 'Sur', 'Este', 'Oeste'])}"
    direccion = f"Calle {random.choice(['Avenida Central', 'Sol', 'Luna', 'Plaza Mayor', 'Principal'])} {random.randint(1, 100)}"
    ciudad = random.choice(['Santiago de Chile', 'Bogotá', 'México DF', 'Lima', 'Buenos Aires'])
    tiendas.append((i, nombre_tienda, direccion, ciudad))

print(tiendas)


[5, (1, 'Tienda Principal', 'Calle Principal 25', 'Santiago de Chile'), (2, 'Tienda Oeste', 'Calle Principal 77', 'Santiago de Chile'), (3, 'Tienda Oeste', 'Calle Avenida Central 41', 'Buenos Aires'), (4, 'Tienda Sur', 'Calle Principal 6', 'Lima'), (5, 'Tienda Sur', 'Calle Sol 92', 'Santiago de Chile')]


### 2.1.2. Empleados

In [58]:
empleados = [20]
puestos = ['Cajero', 'Gerente', 'Reponedor', 'Vendedor']
for i in range(1, 101): 
    nombre_empleado = f"{random.choice(['Laura', 'Juan', 'Carlos', 'María', 'Pedro'])} {random.choice(['Gutiérrez', 'Pérez', 'López', 'Gil', 'García'])}"
    puesto = random.choice(puestos)
    id_tienda = random.randint(1, 5)  
    empleados.append((i, nombre_empleado, puesto, id_tienda))

print(empleados)


[20, (1, 'María Pérez', 'Cajero', 2), (2, 'Pedro Pérez', 'Gerente', 5), (3, 'Carlos García', 'Vendedor', 4), (4, 'Carlos Gil', 'Reponedor', 1), (5, 'María López', 'Vendedor', 1), (6, 'Laura López', 'Gerente', 5), (7, 'Carlos Gil', 'Reponedor', 3), (8, 'Laura Gutiérrez', 'Reponedor', 2), (9, 'Pedro Gutiérrez', 'Reponedor', 3), (10, 'Juan Pérez', 'Reponedor', 4), (11, 'Laura Pérez', 'Cajero', 3), (12, 'Carlos López', 'Cajero', 3), (13, 'María Pérez', 'Vendedor', 2), (14, 'Juan Gil', 'Gerente', 3), (15, 'Juan García', 'Vendedor', 4), (16, 'Laura López', 'Vendedor', 2), (17, 'Laura Pérez', 'Reponedor', 4), (18, 'Juan García', 'Vendedor', 2), (19, 'Laura Gutiérrez', 'Gerente', 4), (20, 'Laura Gutiérrez', 'Gerente', 3), (21, 'María Gutiérrez', 'Vendedor', 5), (22, 'Laura López', 'Vendedor', 1), (23, 'Laura Gutiérrez', 'Gerente', 2), (24, 'Laura Pérez', 'Reponedor', 3), (25, 'Carlos Gil', 'Cajero', 3), (26, 'Carlos Gil', 'Vendedor', 2), (27, 'Carlos Gil', 'Reponedor', 4), (28, 'María Gutiérre

### 2.1.3. Categorías 

In [71]:
categorias = [10]
categorias_nombres = ['Lácteos', 'Carnes', 'Frutas', 'Verduras', 'Bebidas', 'Snacks', 'Panadería', 'Congelados', 'Básicos', 'Cereales']
for i, nombre in enumerate(categorias_nombres, 1):
    categorias.append((i, nombre))

print(categorias)


[10, (1, 'Lácteos'), (2, 'Carnes'), (3, 'Frutas'), (4, 'Verduras'), (5, 'Bebidas'), (6, 'Snacks'), (7, 'Panadería'), (8, 'Congelados'), (9, 'Básicos'), (10, 'Cereales')]


### 2.1.4. Productos

In [77]:
import random

productos_por_categoria = {
    1: ["Leche Entera", "Yogur Natural", "Queso Cheddar", "Mantequilla"],
    2: ["Pollo", "Carne Picada", "Pavo", "Costillas de Cerdo"],
    3: ["Manzana Roja", "Banana", "Naranja", "Fresa"],
    4: ["Zanahoria", "Espinaca", "Tomate", "Pepino"],
    5: ["Coca-Cola", "Agua Mineral", "Zumo de Naranja", "Cerveza"],
    6: ["Patatas Fritas", "Chocolates", "Galletas", "Barra de Granola"],
    7: ["Pan Blanco", "Pan Integral", "Croissant", "Pan de Centeno"],
    8: ["Pizza Congelada", "Helado de Vainilla", "Nuggets", "Verdura Congeladas"],
    9: ["Sal", "Pimienta", "Azúcar", "Aceite de Oliva"],
    10: ["Cereal de Maíz", "Avena", "Granola", "Cereales de Chocolate"]
}

productos = [40]
id_producto = 1

for id_categoria, nombres in productos_por_categoria.items():
    for nombre in nombres:
        precio = round(random.uniform(0.50, 50.00), 2)
        stock = random.randint(0, 500)
        productos.append((id_producto, nombre, precio, stock, id_categoria))
        id_producto += 1

for prod in productos:
    print(prod)


40
(1, 'Leche Entera', 17.07, 314, 1)
(2, 'Yogur Natural', 19.31, 198, 1)
(3, 'Queso Cheddar', 9.14, 142, 1)
(4, 'Mantequilla', 44.64, 464, 1)
(5, 'Pollo', 19.94, 65, 2)
(6, 'Carne Picada', 24.83, 280, 2)
(7, 'Pavo', 48.62, 424, 2)
(8, 'Costillas de Cerdo', 42.97, 239, 2)
(9, 'Manzana Roja', 7.07, 388, 3)
(10, 'Banana', 45.5, 429, 3)
(11, 'Naranja', 35.09, 380, 3)
(12, 'Fresa', 36.3, 307, 3)
(13, 'Zanahoria', 23.16, 315, 4)
(14, 'Espinaca', 26.3, 77, 4)
(15, 'Tomate', 42.72, 381, 4)
(16, 'Pepino', 14.42, 202, 4)
(17, 'Coca-Cola', 7.93, 208, 5)
(18, 'Agua Mineral', 43.39, 265, 5)
(19, 'Zumo de Naranja', 49.96, 490, 5)
(20, 'Cerveza', 14.19, 380, 5)
(21, 'Patatas Fritas', 16.27, 25, 6)
(22, 'Chocolates', 35.53, 37, 6)
(23, 'Galletas', 11.48, 394, 6)
(24, 'Barra de Granola', 8.14, 256, 6)
(25, 'Pan Blanco', 41.09, 445, 7)
(26, 'Pan Integral', 30.94, 234, 7)
(27, 'Croissant', 40.24, 27, 7)
(28, 'Pan de Centeno', 15.25, 11, 7)
(29, 'Pizza Congelada', 49.4, 58, 8)
(30, 'Helado de Vainilla', 

### 2.1.5. Clientes

In [61]:
clientes = [2000]
for i in range(1, 2001): 
    nombre_cliente = f"{random.choice(['Carlos', 'María', 'Pedro', 'Laura', 'José'])} {random.choice(['López', 'García', 'Pérez', 'Gil', 'Martínez'])}"
    email = f"{nombre_cliente.replace(' ', '.').lower()}@test.com"
    telefono = f"{random.randint(600000000, 699999999)}"  
    direccion = f"Calle {random.choice(['Primavera', 'Falsa', 'Sol'])} {random.randint(1, 100)}"
    clientes.append((i, nombre_cliente, email, telefono, direccion))

print(clientes)


[2000, (1, 'María Gil', 'maría.gil@test.com', '671995085', 'Calle Falsa 42'), (2, 'José Gil', 'josé.gil@test.com', '623354348', 'Calle Primavera 46'), (3, 'Laura García', 'laura.garcía@test.com', '605698642', 'Calle Sol 39'), (4, 'Pedro López', 'pedro.lópez@test.com', '616508518', 'Calle Primavera 98'), (5, 'María Martínez', 'maría.martínez@test.com', '646064418', 'Calle Primavera 67'), (6, 'Pedro Martínez', 'pedro.martínez@test.com', '698078943', 'Calle Falsa 13'), (7, 'José López', 'josé.lópez@test.com', '601702385', 'Calle Primavera 27'), (8, 'Carlos García', 'carlos.garcía@test.com', '694962185', 'Calle Sol 69'), (9, 'Pedro García', 'pedro.garcía@test.com', '626650671', 'Calle Sol 86'), (10, 'Carlos Gil', 'carlos.gil@test.com', '622990007', 'Calle Primavera 2'), (11, 'José García', 'josé.garcía@test.com', '609508649', 'Calle Sol 57'), (12, 'Laura Martínez', 'laura.martínez@test.com', '653843246', 'Calle Sol 58'), (13, 'Carlos López', 'carlos.lópez@test.com', '693358781', 'Calle Fal

### 2.1.6. Órdenes

In [62]:
ordenes = [1000]
for i in range(1, 10001):  
    id_cliente = random.randint(1, 2000)  
    id_empleado = random.randint(1, 100)  
    fecha_orden = (datetime.now() - timedelta(days=random.randint(1, 365))).date()  
    metodo_pago = random.choice(['Tarjeta', 'Efectivo'])
    ordenes.append((i, id_cliente, id_empleado, fecha_orden, metodo_pago))

print(ordenes)

[1000, (1, 288, 58, datetime.date(2024, 7, 27), 'Efectivo'), (2, 1299, 64, datetime.date(2024, 1, 25), 'Tarjeta'), (3, 1363, 15, datetime.date(2024, 7, 7), 'Efectivo'), (4, 398, 43, datetime.date(2024, 11, 3), 'Tarjeta'), (5, 756, 32, datetime.date(2024, 7, 29), 'Efectivo'), (6, 751, 2, datetime.date(2024, 1, 28), 'Efectivo'), (7, 1780, 20, datetime.date(2024, 5, 31), 'Efectivo'), (8, 432, 24, datetime.date(2024, 7, 25), 'Efectivo'), (9, 1386, 80, datetime.date(2024, 11, 19), 'Efectivo'), (10, 1639, 45, datetime.date(2024, 4, 29), 'Efectivo'), (11, 988, 98, datetime.date(2024, 6, 30), 'Efectivo'), (12, 45, 58, datetime.date(2024, 3, 27), 'Tarjeta'), (13, 1317, 83, datetime.date(2024, 5, 3), 'Tarjeta'), (14, 1480, 47, datetime.date(2024, 8, 20), 'Tarjeta'), (15, 840, 79, datetime.date(2025, 1, 21), 'Efectivo'), (16, 783, 94, datetime.date(2024, 3, 26), 'Tarjeta'), (17, 624, 96, datetime.date(2025, 1, 16), 'Tarjeta'), (18, 712, 41, datetime.date(2025, 1, 21), 'Tarjeta'), (19, 625, 36, da

### 2.1.7. Detalles de las Órdenes

In [14]:
import random

productos = [
    (1, 'Leche Entera', 1.50, 100, 1), 
    (2, 'Yogur Natural', 1.20, 200, 1),
    (3, 'Queso Cheddar', 2.50, 150, 1),
]

detalles_orden = [30000]

num_ordenes = 1000  
for id_orden in range(1, num_ordenes + 1):
    num_productos = random.randint(1, 5)
    for _ in range(num_productos):
        id_producto = random.randint(1, len(productos))
        cantidad = random.randint(1, 10)
        precio_unitario = next(prod[2] for prod in productos if prod[0] == id_producto)
        descuento = round(random.uniform(0.0, 5.0), 2)  # Descuento entre 0.0 y 5.0
        detalles_orden.append((len(detalles_orden) + 1, id_orden, id_producto, cantidad, precio_unitario, descuento))

print("Tabla: Detalles de Órdenes")

Tabla: Detalles de Órdenes


### 2.2. Conversión de los datos a DataFrames de Pandas


### 2.2.1. Tiendas

In [101]:
import pandas as pd

tiendas = [
     (1, 'Tienda Principal', 'Calle Principal 25', 'Santiago de Chile'),
    (2, 'Tienda Oeste', 'Calle Principal 77', 'Santiago de Chile'),
    (3, 'Tienda Oeste', 'Avenida Central 41', 'Buenos Aires'),
    (4, 'Tienda Sur', 'Calle Principal 6', 'Lima'),
    (5, 'Tienda Sur', 'Calle Sol 92', 'Santiago de Chile'),
]

df_tiendas = pd.DataFrame(tiendas, columns=['id_tienda', 'nombre_tienda', 'direccion', 'ciudad'])
display(df_tiendas)

Unnamed: 0,id_tienda,nombre_tienda,direccion,ciudad
0,1,Tienda Principal,Calle Principal 25,Santiago de Chile
1,2,Tienda Oeste,Calle Principal 77,Santiago de Chile
2,3,Tienda Oeste,Avenida Central 41,Buenos Aires
3,4,Tienda Sur,Calle Principal 6,Lima
4,5,Tienda Sur,Calle Sol 92,Santiago de Chile


### 2.2.2. Empleados

In [103]:
# Empleados
empleados = [
    (1, 'María Pérez', 'Cajero', 2),
    (2, 'Pedro Pérez', 'Gerente', 5),
    (3, 'Carlos García', 'Vendedor', 4),
    (4, 'Carlos Gil', 'Reponedor', 1),
    (5, 'María López', 'Vendedor', 1),
    (6, 'Laura López', 'Gerente', 5),
    (7, 'Carlos Gil', 'Reponedor', 3),
    (8, 'Laura Gutiérrez', 'Reponedor', 2),
    (9, 'Pedro Gutiérrez', 'Reponedor', 3),
    (10, 'Juan Pérez', 'Reponedor', 4),
    (11, 'Laura Pérez', 'Cajero', 3),
    (12, 'Carlos López', 'Cajero', 3),
    (13, 'María Pérez', 'Vendedor', 2),
    (14, 'Juan Gil', 'Gerente', 3),
    (15, 'Juan García', 'Vendedor', 4),
    (16, 'Laura López', 'Vendedor', 2),
    (17, 'Laura Pérez', 'Reponedor', 4),
    (18, 'Juan García', 'Vendedor', 2),
    (19, 'Laura Gutiérrez', 'Gerente', 4),
    (20, 'Laura Gutiérrez', 'Gerente', 3),
]
df_empleados = pd.DataFrame(empleados, columns=['id_empleado', 'nombre', 'cargo', 'id_tienda'])
print("\nEmpleados:")
display(df_empleados)


Empleados:


Unnamed: 0,id_empleado,nombre,cargo,id_tienda
0,1,María Pérez,Cajero,2
1,2,Pedro Pérez,Gerente,5
2,3,Carlos García,Vendedor,4
3,4,Carlos Gil,Reponedor,1
4,5,María López,Vendedor,1
5,6,Laura López,Gerente,5
6,7,Carlos Gil,Reponedor,3
7,8,Laura Gutiérrez,Reponedor,2
8,9,Pedro Gutiérrez,Reponedor,3
9,10,Juan Pérez,Reponedor,4


### 2.2.3. Categorías

In [107]:
import pandas as pd

categorias = [
    (1, 'Lácteos'),
    (2, 'Carnes'),
    (3, 'Frutas'),
    (4, 'Verduras'),
    (5, 'Bebidas'),
    (6, 'Snacks'),
    (7, 'Panadería'),
    (8, 'Congelados'),
    (9, 'Básicos'),
    (10, 'Cereales'),
]

df_categorias = pd.DataFrame(categorias, columns=['id_categoria', 'nombre_categoria'])
display(df_categorias)


Unnamed: 0,id_categoria,nombre_categoria
0,1,Lácteos
1,2,Carnes
2,3,Frutas
3,4,Verduras
4,5,Bebidas
5,6,Snacks
6,7,Panadería
7,8,Congelados
8,9,Básicos
9,10,Cereales


### 2.2.4. Productos

In [109]:
import pandas as pd

productos = [
    (1, 'Leche Entera', 17.07, 314, 1),
    (2, 'Yogur Natural', 19.31, 198, 1),
    (3, 'Queso Cheddar', 9.14, 142, 1),
    (4, 'Mantequilla', 44.64, 464, 1),
    (5, 'Pollo', 19.94, 65, 2),
    (6, 'Carne Picada', 24.83, 280, 2),
    (7, 'Pavo', 48.62, 424, 2),
    (8, 'Costillas de Cerdo', 42.97, 239, 2),
    (9, 'Manzana Roja', 7.07, 388, 3),
    (10, 'Banana', 45.5, 429, 3),
    (11, 'Naranja', 35.09, 380, 3),
    (12, 'Fresa', 36.3, 307, 3),
    (13, 'Zanahoria', 23.16, 315, 4),
    (14, 'Espinaca', 26.3, 77, 4),
    (15, 'Tomate', 42.72, 381, 4),
    (16, 'Pepino', 14.42, 202, 4),
    (17, 'Coca-Cola', 7.93, 208, 5),
    (18, 'Agua Mineral', 43.39, 265, 5),
    (19, 'Zumo de Naranja', 49.96, 490, 5),
    (20, 'Cerveza', 14.19, 380, 5),
    (21, 'Patatas Fritas', 16.27, 25, 6),
    (22, 'Chocolates', 35.53, 37, 6),
    (23, 'Galletas', 11.48, 394, 6),
    (24, 'Barra de Granola', 8.14, 256, 6),
    (25, 'Pan Blanco', 41.09, 445, 7),
    (26, 'Pan Integral', 30.94, 234, 7),
    (27, 'Croissant', 40.24, 27, 7),
    (28, 'Pan de Centeno', 15.25, 11, 7),
    (29, 'Pizza Congelada', 49.4, 58, 8),
    (30, 'Helado de Vainilla', 10.92, 71, 8),
    (31, 'Nuggets', 27.07, 239, 8),
    (32, 'Verdura Congeladas', 13.4, 32, 8),
    (33, 'Sal', 11.5, 281, 9),
    (34, 'Pimienta', 27.05, 443, 9),
    (35, 'Azúcar', 20.24, 144, 9),
    (36, 'Aceite de Oliva', 46.24, 37, 9),
    (37, 'Cereal de Maíz', 48.48, 301, 10),
    (38, 'Avena', 14.92, 34, 10),
    (39, 'Granola', 10.13, 428, 10),
    (40, 'Cereales de Chocolate', 27.26, 129, 10),
]

df_productos = pd.DataFrame(productos, columns=['id_producto', 'nombre_producto', 'precio', 'stock', 'id_categoria'])
display(df_productos)

Unnamed: 0,id_producto,nombre_producto,precio,stock,id_categoria
0,1,Leche Entera,17.07,314,1
1,2,Yogur Natural,19.31,198,1
2,3,Queso Cheddar,9.14,142,1
3,4,Mantequilla,44.64,464,1
4,5,Pollo,19.94,65,2
5,6,Carne Picada,24.83,280,2
6,7,Pavo,48.62,424,2
7,8,Costillas de Cerdo,42.97,239,2
8,9,Manzana Roja,7.07,388,3
9,10,Banana,45.5,429,3


### 2.2.5. Clientes

In [111]:
import pandas as pd

clientes = [
    (1, 'Juan Pérez', 'juan.perez@email.com', '123456789', 'Calle A'),
    (2, 'María López', 'maria.lopez@email.com', '987654321', 'Calle B'),
    (3, 'Carlos García', 'carlos.garcia@email.com', '456123789', 'Calle C'),
    (4, 'Laura Gutiérrez', 'laura.gutierrez@email.com', '321456987', 'Calle D'),
    (5, 'Pedro Martínez', 'pedro.martinez@email.com', '654789321', 'Calle E'),
    (6, 'Ana Rodríguez', 'ana.rodriguez@email.com', '789321654', 'Calle F'),
    (7, 'Luis Fernández', 'luis.fernandez@email.com', '987123654', 'Calle G'),
    (8, 'Marta Sánchez', 'marta.sanchez@email.com', '123789456', 'Calle H'),
    (9, 'Sofía Gómez', 'sofia.gomez@email.com', '456789123', 'Calle I'),
    (10, 'Diego Torres', 'diego.torres@email.com', '789456123', 'Calle J')
]

# Crear DataFrame
df_clientes = pd.DataFrame(clientes, columns=['id_cliente', 'nombre', 'email', 'telefono', 'direccion'])

display(df_clientes)

Unnamed: 0,id_cliente,nombre,email,telefono,direccion
0,1,Juan Pérez,juan.perez@email.com,123456789,Calle A
1,2,María López,maria.lopez@email.com,987654321,Calle B
2,3,Carlos García,carlos.garcia@email.com,456123789,Calle C
3,4,Laura Gutiérrez,laura.gutierrez@email.com,321456987,Calle D
4,5,Pedro Martínez,pedro.martinez@email.com,654789321,Calle E
5,6,Ana Rodríguez,ana.rodriguez@email.com,789321654,Calle F
6,7,Luis Fernández,luis.fernandez@email.com,987123654,Calle G
7,8,Marta Sánchez,marta.sanchez@email.com,123789456,Calle H
8,9,Sofía Gómez,sofia.gomez@email.com,456789123,Calle I
9,10,Diego Torres,diego.torres@email.com,789456123,Calle J


### 2.2.6. Órdenes

In [128]:

ordenes = [(i, random.randint(1, 2000),  
            random.choice([1, 2, 3, 4, 5]), 
            random.uniform(20.0, 1000.0),  
            fake.date_this_year(),  
            random.choice([1, 2, 3, 4, 5])) 
           for i in range(1, 1001)]

df_ordenes = pd.DataFrame(ordenes, columns=['id_orden', 'id_cliente', 'id_tienda', 'total', 'fecha', 'id_empleado'])

display(df_ordenes)

Unnamed: 0,id_orden,id_cliente,id_tienda,total,fecha,id_empleado
0,1,320,5,684.309029,2025-01-01,4
1,2,335,2,656.190934,2025-01-20,3
2,3,387,5,145.513569,2025-01-16,1
3,4,1827,2,86.825132,2025-01-01,1
4,5,1816,1,160.784712,2025-01-01,2
...,...,...,...,...,...,...
995,996,1487,2,726.912661,2025-01-07,5
996,997,1383,3,836.041340,2025-01-19,4
997,998,81,2,830.649060,2025-01-08,4
998,999,1173,3,549.155835,2025-01-20,5


### 2.2.7. Detalles de Órdenes

In [123]:
detalles_ordenes = []
for orden_id in range(1, 3001):
    num_productos = random.randint(1, 5)  
    for _ in range(num_productos):
        producto_id = random.randint(1, 40)  
        cantidad = random.randint(1, 5)  
        precio = random.uniform(5.0, 50.0)  
        detalles_ordenes.append((orden_id, producto_id, cantidad, precio))

df_detalles_ordenes = pd.DataFrame(detalles_ordenes, columns=['id_orden', 'id_producto', 'cantidad', 'precio'])
display(df_detalles_ordenes)


Unnamed: 0,id_orden,id_producto,cantidad,precio
0,1,14,5,14.632313
1,1,15,2,40.177353
2,2,40,5,45.582834
3,2,36,5,37.519997
4,3,15,4,39.633131
...,...,...,...,...
8941,3000,23,5,9.727021
8942,3000,16,1,38.087515
8943,3000,36,5,9.292061
8944,3000,28,2,30.262538


### 2.3. Conversión de los DataFrames de Pandas a MySQL.

In [27]:
import pandas as pd
from sqlalchemy import create_engine

usuario = "root"
contraseña = "Mariaadmin99"
host = "localhost"
base_de_datos = "Supermercado"

engine = create_engine(f"mysql+pymysql://{usuario}:{contraseña}@{host}/{base_de_datos}")

In [29]:
import pandas as pd
from sqlalchemy import create_engine

usuario = "root"
contraseña = "Mariaadmin99"
host = "localhost"
base_de_datos = "Supermercado"

engine = create_engine(f"mysql+pymysql://{usuario}:{contraseña}@{host}/{base_de_datos}")

df_tiendas = pd.DataFrame({
    'id_tienda': [1, 2, 3],
    'nombre_tienda': ['Tienda A', 'Tienda B', 'Tienda C'],
    'direccion': ['Calle Falsa 123', 'Avenida Real 456', 'Calle Principal 789'],
    'ciudad': ['Madrid', 'Barcelona', 'Valencia']
})

df_empleados = pd.DataFrame({
    'id_empleado': [1, 2, 3],
    'nombre_empleado': ['Carlos', 'Ana', 'Luis'],
    'puesto': ['Cajero', 'Gerente', 'Reponedor'],
    'id_tienda': [1, 2, 3]  # Relacionado con la tabla 'tiendas'
})

df_categorias = pd.DataFrame({
    'id_categoria': [1, 2, 3],
    'nombre_categoria': ['Electrónica', 'Ropa', 'Alimentos']
})

df_productos = pd.DataFrame({
    'id_producto': [1, 2, 3],
    'nombre_producto': ['Televisor', 'Camiseta', 'Leche'],
    'precio': [300, 20, 1.5],
    'stock': [10, 50, 100],
    'id_categoria': [1, 2, 3]  

df_clientes = pd.DataFrame({
    'id_cliente': [1, 2, 3],
    'first_name': ['Carlos', 'Ana', 'Luis'],
    'last_name': ['Gómez', 'Pérez', 'Fernández'],
    'email': ['carlos@email.com', 'ana@email.com', 'luis@email.com'],
    'codigo_postal': ['28001', '08002', '41003']
})

df_ordenes = pd.DataFrame({
    'id_orden': [1, 2, 3],
    'id_cliente': [1, 2, 3],  
    'id_empleado': [1, 2, 3], 
    'fecha_orden': ['2025-01-01', '2025-01-02', '2025-01-03'],
    'metodo_pago': ['Tarjeta', 'Efectivo', 'Tarjeta']
})

df_detalle_orden = pd.DataFrame({
    'id_detalle': [1, 2, 3],
    'id_orden': [1, 2, 3],  
    'id_producto': [1, 2, 3], 
    'cantidad': [1, 2, 3],
    'precio_unitario': [300, 20, 1.5],  
    'descuento': [0, 0, None]
})

In [None]:
df_tiendas.to_sql('tiendas', con=engine, if_exists='append', index=False)
df_empleados.to_sql('empleados', con=engine, if_exists='append', index=False)
df_categorias.to_sql('categorias', con=engine, if_exists='append', index=False)
df_productos.to_sql('productos', con=engine, if_exists='append', index=False)
df_clientes.to_sql('clientes', con=engine, if_exists='append', index=False)
df_ordenes.to_sql('ordenes', con=engine, if_exists='append', index=False)
df_detalle_orden.to_sql('detalle_orden', con=engine, if_exists='append', index=False)

print("Datos insertados correctamente en MySQL.")


Datos insertados correctamente en MySQL.


## 3. Consultas con SQL.

In [32]:
import mysql.connector

conn = mysql.connector.connect(
    host='localhost',
    user='root',
    password='Mariaadmin99',
    database='Supermercado'
)
cursor = conn.cursor()

### 3.1. Listado de órdenes con detalles de cliente y empleado.




In [33]:
cursor.execute("""
    SELECT o.id_orden, o.fecha_orden, 
           c.first_name AS nombre_cliente, c.last_name AS apellido_cliente,
           e.nombre_empleado, o.metodo_pago
    FROM ordenes o
    JOIN clientes c ON o.id_cliente = c.id_cliente
    JOIN empleados e ON o.id_empleado = e.id_empleado;
""")
resultados = cursor.fetchall()
print("Listado de órdenes con detalles de cliente y empleado:")
for fila in resultados:
    print(fila)

Listado de órdenes con detalles de cliente y empleado:
(1, datetime.datetime(2025, 1, 1, 0, 0), 'Carlos', 'Gómez', 'Carlos', 'Tarjeta')
(2, datetime.datetime(2025, 1, 2, 0, 0), 'Ana', 'Pérez', 'Ana', 'Efectivo')
(3, datetime.datetime(2025, 1, 3, 0, 0), 'Luis', 'Fernández', 'Luis', 'Tarjeta')


### 3.2. Productos con stock bajo.

In [34]:
cursor.execute("""
    SELECT p.nombre_producto, c.nombre_categoria, p.stock
    FROM productos p
    JOIN categorias c ON p.id_categoria = c.id_categoria
    WHERE p.stock < 10;
""")
resultados = cursor.fetchall()
print("\nProductos con stock bajo:")
for fila in resultados:
    print(fila)


Productos con stock bajo:


### 3.3. Ventas totales por categoría. 

In [35]:
cursor.execute("""
    SELECT c.nombre_categoria, SUM(d.cantidad * d.precio_unitario) AS ventas_totales
    FROM detalle_orden d
    JOIN productos p ON d.id_producto = p.id_producto
    JOIN categorias c ON p.id_categoria = c.id_categoria
    GROUP BY c.id_categoria;
""")
resultados = cursor.fetchall()
print("\nVentas totales por categoría:")
for fila in resultados:
    print(fila)


Ventas totales por categoría:
('Electrónica', Decimal('300.00'))
('Ropa', Decimal('40.00'))
('Alimentos', Decimal('4.50'))


### 3.4. Clientes con mayores gastos acumulados. 

In [36]:

cursor.execute("""
    SELECT c.first_name, c.last_name,
           SUM(d.cantidad * d.precio_unitario - IFNULL(d.descuento, 0)) AS gasto_total
    FROM clientes c
    JOIN ordenes o ON c.id_cliente = o.id_cliente
    JOIN detalle_orden d ON o.id_orden = d.id_orden
    GROUP BY c.id_cliente
    ORDER BY gasto_total DESC;
""")
resultados = cursor.fetchall()
print("\nClientes con mayores gastos acumulados:")
for fila in resultados:
    print(fila)


Clientes con mayores gastos acumulados:
('Carlos', 'Gómez', Decimal('300.00'))
('Ana', 'Pérez', Decimal('40.00'))
('Luis', 'Fernández', Decimal('4.50'))


### 3.5. Empleados y número de órdenes gestionadas.

In [37]:
cursor.execute("""
    SELECT e.nombre_empleado, e.puesto, COUNT(o.id_orden) AS numero_ordenes
    FROM empleados e
    JOIN ordenes o ON e.id_empleado = o.id_empleado
    GROUP BY e.id_empleado;
""")
resultados = cursor.fetchall()
print("\nEmpleados y número de órdenes gestionadas:")
for fila in resultados:
    print(fila)


Empleados y número de órdenes gestionadas:
('Carlos', 'Cajero', 1)
('Ana', 'Gerente', 1)
('Luis', 'Reponedor', 1)


### 3.6. ÓRdenes filtradas por fecha y tienda.

In [None]:
cursor.execute("""
    SELECT o.id_orden, o.fecha_orden, t.nombre_tienda, c.first_name, c.last_name
    FROM ordenes o
    JOIN tiendas t ON o.id_tienda = t.id_tienda
    JOIN clientes c ON o.id_cliente = c.id_cliente
    WHERE o.fecha_orden BETWEEN '2025-01-01' AND '2025-01-31'
    AND t.id_tienda = 1;  -- Cambia 1 por la tienda que deseas filtrar
""")
resultados = cursor.fetchall()
print("\nÓrdenes filtradas por fecha y tienda:")
for fila in resultados:
    print(fila)

### 3.7. Ranking de productos más vendidos en cada tienda.

In [None]:
# Consulta 7: Ranking de productos más vendidos en cada tienda
cursor.execute("""
    SELECT t.nombre_tienda, p.nombre_producto, SUM(d.cantidad) AS total_vendido
    FROM detalle_orden d
    JOIN ordenes o ON d.id_orden = o.id_orden
    JOIN tiendas t ON o.id_tienda = t.id_tienda
    JOIN productos p ON d.id_producto = p.id_producto
    GROUP BY t.id_tienda, p.id_producto
    ORDER BY t.id_tienda, total_vendido DESC
    LIMIT 3;  -- Para obtener los 3 más vendidos por tienda
""")
resultados = cursor.fetchall()
print("\nRanking de productos más vendidos en cada tienda:")
for fila in resultados:
    print(fila)
