# ENUNCIADO EJERCICIO

## 1. CREAR BASE DE DATOS (33%)

- **Crear con c√≥digo SQL una base de datos** llamada `supermercado`.
- **C√≥digo Python con mysql connector** que ejecute el SQL para **borrar** y **generar la base de datos vac√≠a**.

---


In [25]:
import mysql.connector as con
from mysql.connector import Error

try:
    # Conectamos con la base de datos MySQL
    print("Conectando a MySQL...")
    connection = con.connect(
        host='localhost',
        port='3306',
        user='root',
        password='admin'
    )

    # Creamos un cursor para ejecutar las sentencias SQL
    cursor = connection.cursor()

    # Eliminamos la base de datos si ya existe
    cursor.execute('DROP DATABASE IF EXISTS supermercado;')

    # Se crea la base de datos
    cursor.execute('''
                   CREATE SCHEMA supermercado
                   DEFAULT CHARACTER SET utf8;
                   ''')
    print("Base de datos 'supermercado' creada correctamente.")

    # Hacemos commit de los cambios
    connection.commit()

except Error as e:
    print(f"Error al conectar o ejecutar la consulta: {e}")

finally:
    # Cerrar el cursor y la conexi√≥n
    if cursor:
        cursor.close()
    if connection:
        connection.close()
    print("Conexi√≥n cerrada.")

Conectando a MySQL...
Base de datos 'supermercado' creada correctamente.
Conexi√≥n cerrada.



### Tablas: 7

#### 1. **tiendas**
- **id_tienda** (PRIMARY KEY)
- **nombre_tienda**
- **direccion**
- **ciudad**


In [26]:
# Conexi√≥n a la base de datos MySQL
print("Conectando a MySQL...")
connection = con.connect(
    host='localhost',
    port='3306',
    user='root',
    password='admin',
    database='supermercado'  # Aseg√∫rate de estar conectado a la base de datos correcta
)

try:
    # Crear un cursor para ejecutar las sentencias SQL
    cursor = connection.cursor()

    # SQL para crear la tabla 'tiendas'
    crear_tabla_sql = '''
    CREATE TABLE IF NOT EXISTS tiendas (
    id_tienda INT AUTO_INCREMENT PRIMARY KEY,
    nombre_tienda VARCHAR(100) NOT NULL,
    direccion VARCHAR(255) NOT NULL,
    ciudad VARCHAR(100) NOT NULL
    );
    '''

    # Ejecutar la consulta para crear la tabla
    cursor.execute(crear_tabla_sql)
    print("Tabla 'tiendas' creada correctamente.")

    # Hacer commit de los cambios
    connection.commit()

except Error as e:
    print(f"Error al crear la tabla: {e}")

finally:
    # Cerrar el cursor y la conexi√≥n
    if cursor:
        cursor.close()
    if connection:
        connection.close()
    print("Conexi√≥n cerrada.")

Conectando a MySQL...
Tabla 'tiendas' creada correctamente.
Conexi√≥n cerrada.


#### 2. **empleados**
- **id_empleado** (PRIMARY KEY)
- **nombre_empleado**
- **puesto** (Ejemplo: Cajero, Gerente, Reponedor)
- **id_tienda** (FOREIGN KEY que hace referencia a `tiendas.id_tienda`)

---



In [27]:
# Conexi√≥n a la base de datos MySQL
print("Conectando a MySQL...")
connection = con.connect(
    host='localhost',
    port='3306',
    user='root',
    password='admin',
    database='supermercado'  # Aseg√∫rate de estar conectado a la base de datos correcta
)

try:
    # Crear un cursor para ejecutar las sentencias SQL
    cursor = connection.cursor()

    # SQL para crear la tabla 'tiendas'
    crear_tabla_sql = '''
    CREATE TABLE IF NOT EXISTS empleados (
    id_empleado INT AUTO_INCREMENT PRIMARY KEY,
    nombre_empleado VARCHAR(100) NOT NULL,
    puesto ENUM('Cajero', 'Gerente', 'Reponedor') NOT NULL,
    id_tienda INT NOT NULL,
    FOREIGN KEY (id_tienda) REFERENCES tiendas(id_tienda)
        ON DELETE CASCADE
        ON UPDATE CASCADE
    );
    '''

    # Ejecutar la consulta para crear la tabla
    cursor.execute(crear_tabla_sql)
    print("Tabla 'empleados' creada correctamente.")

    # Hacer commit de los cambios
    connection.commit()

except Error as e:
    print(f"Error al crear la tabla: {e}")

finally:
    # Cerrar el cursor y la conexi√≥n
    if cursor:
        cursor.close()
    if connection:
        connection.close()
    print("Conexi√≥n cerrada.")

Conectando a MySQL...
Tabla 'empleados' creada correctamente.
Conexi√≥n cerrada.


> ### üí° **Sobre el uso de `ENUM`**
>
> En el campo `puesto` de la tabla `empleados`, usamos un `ENUM` porque nos permite limitar los valores posibles a solo tres opciones: `'Cajero'`, `'Gerente'` y `'Reponedor'`. 
>
> #### **¬øPor qu√© `ENUM`?**
> - Es pr√°ctico: No necesitas validar manualmente en el c√≥digo si el valor que insertas es v√°lido, la base de datos lo hace por ti.
> - Ahorra espacio: MySQL almacena estos valores como n√∫meros internos, lo que es m√°s eficiente que guardar texto completo.
> - Es directo: Si ya sabes que los valores posibles no van a cambiar mucho es mejor hacerlo de esta forma.
>
> #### **Dato a tener en cuenta**:
> Si en el futuro se decide que es necesario agregar m√°s puestos (como `Supervisor` o `Jefe Supremo`), se tendr√° que modificar la estructura de la tabla.
>
> ---
>
> #### **¬øC√≥mo se hace?**
> Si se necesita agregar m√°s valores al `ENUM`, se puede hace con un comando `ALTER TABLE`. Por ejemplo, para agregar `Supervisor`, ejecutar√≠as:
>
> ```sql
> ALTER TABLE empleados 
> MODIFY puesto ENUM('Cajero', 'Gerente', 'Reponedor', 'Supervisor') NOT NULL;
> ```
>
> Esto actualiza el tipo `ENUM` para incluir el nuevo valor, sin necesidad de borrar ni recrear la tabla.
>
> ---
>
> Fuente [documentaci√≥n oficial](https://dev.mysql.com/doc/refman/8.4/en/enum.html).

#### 3. **categorias**
- **id_categoria** (PRIMARY KEY)
- **nombre_categoria**

---



In [28]:
# Conexi√≥n a la base de datos MySQL
print("Conectando a MySQL...")
connection = con.connect(
    host='localhost',
    port='3306',
    user='root',
    password='admin',
    database='supermercado'  # Aseg√∫rate de estar conectado a la base de datos correcta
)

try:
    # Crear un cursor para ejecutar las sentencias SQL
    cursor = connection.cursor()

    # SQL para crear la tabla 'tiendas'
    crear_tabla_sql = '''
    CREATE TABLE IF NOT EXISTS categorias (
    id_categoria INT AUTO_INCREMENT PRIMARY KEY,
    nombre_categoria VARCHAR(100) NOT NULL UNIQUE
    );
    '''

    # Ejecutar la consulta para crear la tabla
    cursor.execute(crear_tabla_sql)
    print("Tabla 'categorias' creada correctamente.")

    # Hacer commit de los cambios
    connection.commit()

except Error as e:
    print(f"Error al crear la tabla: {e}")

finally:
    # Cerrar el cursor y la conexi√≥n
    if cursor:
        cursor.close()
    if connection:
        connection.close()
    print("Conexi√≥n cerrada.")

Conectando a MySQL...
Tabla 'categorias' creada correctamente.
Conexi√≥n cerrada.


#### 4. **productos**
- **id_producto** (PRIMARY KEY)
- **nombre_producto**
- **precio**
- **stock**
- **id_categoria** (FOREIGN KEY que hace referencia a `categorias.id_categoria`)

---


In [29]:
# Conexi√≥n a la base de datos MySQL
print("Conectando a MySQL...")
connection = con.connect(
    host='localhost',
    port='3306',
    user='root',
    password='admin',
    database='supermercado'  # Aseg√∫rate de estar conectado a la base de datos correcta
)

try:
    # Crear un cursor para ejecutar las sentencias SQL
    cursor = connection.cursor()

    # SQL para crear la tabla 'tiendas'
    crear_tabla_sql = '''
    CREATE TABLE IF NOT EXISTS productos (
    id_producto INT AUTO_INCREMENT PRIMARY KEY,
    nombre_producto VARCHAR(150) NOT NULL,
    precio DECIMAL(10, 2) NOT NULL CHECK (precio >= 0),
    stock INT NOT NULL CHECK (stock >= 0),
    id_categoria INT NOT NULL,
    FOREIGN KEY (id_categoria) REFERENCES categorias(id_categoria)
        ON DELETE CASCADE
        ON UPDATE CASCADE
    );
    '''

    # Ejecutar la consulta para crear la tabla
    cursor.execute(crear_tabla_sql)
    print("Tabla 'productos' creada correctamente.")

    # Hacer commit de los cambios
    connection.commit()

except Error as e:
    print(f"Error al crear la tabla: {e}")

finally:
    # Cerrar el cursor y la conexi√≥n
    if cursor:
        cursor.close()
    if connection:
        connection.close()
    print("Conexi√≥n cerrada.")

Conectando a MySQL...
Tabla 'productos' creada correctamente.
Conexi√≥n cerrada.


> ### üí° **SOBRE EL USO DEL `CHECK`**
>
> En la tabla `productos`, he decidido poner `CHECK` para asegurarme de que los datos tengan sentido. Por ejemplo:
>
> - **`CHECK(precio >= 0)`**: Porque no tendr√≠a sentido que algo cueste menos de 0.
> - **`CHECK(stock >= 0)`**: Por la misma l√≥gica, no puede haber menos de 0 productos en stock.
>
> B√°sicamente, el `CHECK` es como poner un guardia de seguridad en tu base de datos: si el dato no cumple las reglas, no entra. 
>
> ---
>
> Fuente [documentaci√≥n oficial de MySQL sobre `CHECK`](https://dev.mysql.com/doc/refman/8.0/en/create-table-check-constraints.html).


#### 5. **clientes**
- **id_cliente** (PRIMARY KEY)
- **first_name**
- **last_name**
- **email**
- **codigo_postal**

---


In [30]:
# Conexi√≥n a la base de datos MySQL
print("Conectando a MySQL...")
connection = con.connect(
    host='localhost',
    port='3306',
    user='root',
    password='admin',
    database='supermercado'  # Aseg√∫rate de estar conectado a la base de datos correcta
)

try:
    # Crear un cursor para ejecutar las sentencias SQL
    cursor = connection.cursor()

    # SQL para crear la tabla 'tiendas'
    crear_tabla_sql = '''
    CREATE TABLE IF NOT EXISTS clientes (
    id_cliente INT AUTO_INCREMENT PRIMARY KEY,
    first_name VARCHAR(100) NOT NULL,
    last_name VARCHAR(100) NOT NULL,
    email VARCHAR(255) NOT NULL UNIQUE,
    codigo_postal VARCHAR(20) NOT NULL
    );
    '''

    # Ejecutar la consulta para crear la tabla
    cursor.execute(crear_tabla_sql)
    print("Tabla 'clientes' creada correctamente.")

    # Hacer commit de los cambios
    connection.commit()

except Error as e:
    print(f"Error al crear la tabla: {e}")

finally:
    # Cerrar el cursor y la conexi√≥n
    if cursor:
        cursor.close()
    if connection:
        connection.close()
    print("Conexi√≥n cerrada.")

Conectando a MySQL...
Tabla 'clientes' creada correctamente.
Conexi√≥n cerrada.



#### 6. **ordenes**
- **id_orden** (PRIMARY KEY)
- **id_cliente** (FOREIGN KEY que hace referencia a `clientes.id_cliente`)
- **id_empleado** (FOREIGN KEY que hace referencia a `empleados.id_empleado`)
- **fecha_orden**
- **metodo_pago** (una enum que solo admita tres valores: `Tarjeta`, `Efectivo`)

---


In [31]:
# Conexi√≥n a la base de datos MySQL
print("Conectando a MySQL...")
connection = con.connect(
    host='localhost',
    port='3306',
    user='root',
    password='admin',
    database='supermercado'  # Aseg√∫rate de estar conectado a la base de datos correcta
)

try:
    # Crear un cursor para ejecutar las sentencias SQL
    cursor = connection.cursor()

    # SQL para crear la tabla 'tiendas'
    crear_tabla_sql = '''
    CREATE TABLE IF NOT EXISTS ordenes (
    id_orden INT AUTO_INCREMENT PRIMARY KEY,
    id_cliente INT NOT NULL,
    id_empleado INT NOT NULL,
    fecha_orden DATETIME NOT NULL,
    metodo_pago ENUM('Tarjeta', 'Efectivo') NOT NULL,
    FOREIGN KEY (id_cliente) REFERENCES clientes(id_cliente)
        ON DELETE CASCADE
        ON UPDATE CASCADE,
    FOREIGN KEY (id_empleado) REFERENCES empleados(id_empleado)
        ON DELETE CASCADE
        ON UPDATE CASCADE
    );
    '''

    # Ejecutar la consulta para crear la tabla
    cursor.execute(crear_tabla_sql)
    print("Tabla 'ordenes' creada correctamente.")

    # Hacer commit de los cambios
    connection.commit()

except Error as e:
    print(f"Error al crear la tabla: {e}")

finally:
    # Cerrar el cursor y la conexi√≥n
    if cursor:
        cursor.close()
    if connection:
        connection.close()
    print("Conexi√≥n cerrada.")

Conectando a MySQL...
Tabla 'ordenes' creada correctamente.
Conexi√≥n cerrada.



#### 7. **detalle_orden**
- **id_detalle** (PRIMARY KEY)
- **id_orden** (FOREIGN KEY que hace referencia a `ordenes.id_orden`) NOT NULL
- **id_producto** (FOREIGN KEY que hace referencia a `productos.id_producto`) NOT NULL
- **cantidad**
- **precio_unitario**: mismo precio que en la tabla `producto`
- **descuento** (podr√≠a ser NULL si no se aplica)

In [32]:
# Conexi√≥n a la base de datos MySQL
print("Conectando a MySQL...")
connection = con.connect(
    host='localhost',
    port='3306',
    user='root',
    password='admin',
    database='supermercado'  # Aseg√∫rate de estar conectado a la base de datos correcta
)

try:
    # Crear un cursor para ejecutar las sentencias SQL
    cursor = connection.cursor()

    # SQL para crear la tabla 'tiendas'
    crear_tabla_sql = '''
    CREATE TABLE IF NOT EXISTS detalle_orden (
    id_detalle INT AUTO_INCREMENT PRIMARY KEY,
    id_orden INT NOT NULL,
    id_producto INT NOT NULL,
    cantidad INT NOT NULL CHECK (cantidad > 0),
    precio_unitario DECIMAL(10, 2) NOT NULL,
    descuento DECIMAL(10, 2) NULL,
    FOREIGN KEY (id_orden) REFERENCES ordenes(id_orden)
        ON DELETE CASCADE
        ON UPDATE CASCADE,
    FOREIGN KEY (id_producto) REFERENCES productos(id_producto)
        ON DELETE CASCADE
        ON UPDATE CASCADE
    );
    '''

    # Ejecutar la consulta para crear la tabla
    cursor.execute(crear_tabla_sql)
    print("Tabla 'detalle_orden' creada correctamente.")

    # Hacer commit de los cambios
    connection.commit()

except Error as e:
    print(f"Error al crear la tabla: {e}")

finally:
    # Cerrar el cursor y la conexi√≥n
    if cursor:
        cursor.close()
    if connection:
        connection.close()
    print("Conexi√≥n cerrada.")

Conectando a MySQL...
Tabla 'detalle_orden' creada correctamente.
Conexi√≥n cerrada.


### 2. **Generar datos demo desde Python (33%)**

#### * Generar datos aleatorios en listas con Python similar a los realizados en clase.
  - Uso de las librer√≠as **`datetime`**, **`timedelta`** y **`random`** para generar datos aleatorios.
  
#### * Pasar los datos a **DataFrames** de **Pandas**.
  
#### * Pasar los **DataFrames** de **Pandas** a **MySQL** usando la funci√≥n **`to_sql`** de **Pandas** con **SQLAlchemy** o usando **MySQL Connector** con sentencias **`INSERT`**.

---

#### **tiendas**

- **id_tienda**: valores enteros consecutivos (por ejemplo, 1, 2, 3...).
- **nombre_tienda**: nombres ficticios o gen√©ricos (p. ej. "Tienda Centro", "Super Norte", "Super Sur").
- **direccion**: direcciones simples (p. ej. ‚ÄúCalle Falsa 123‚Äù).
- **ciudad**: usar nombres de ciudades ficticias o reales (p. ej. ‚ÄúMadrid‚Äù, ‚ÄúBarcelona‚Äù, ‚ÄúM√©xico DF‚Äù, etc.).

En total: **5 o 10 tiendas**.

---



In [33]:
import pandas as pd
from sqlalchemy import create_engine

# Datos √∫nicos para las tiendas, ciudades y direcciones
nombres_tienda = ["Tienda Centro", "Super Norte", "Super Sur", "Tienda Express", "Mega Tienda"]
ciudades = ["Madrid", "Barcelona", "M√©xico DF", "Valencia", "Lima"]
direcciones = ["Calle Falsa 123", "Avenida Siempre Viva 742", "Calle Real 456", "Avenida Libertad 100", "Calle del Sol 89"]

# Creamos las tiendas sin repeticiones
tiendas_data = []
for i, (nombre, ciudad, direccion) in enumerate(zip(nombres_tienda, ciudades, direcciones), start=1):
    tienda = {
        "id_tienda": i,
        "nombre_tienda": nombre,
        "direccion": direccion,
        "ciudad": ciudad
    }
    tiendas_data.append(tienda)

# Convertimos a DataFrame
df_tiendas = pd.DataFrame(tiendas_data)

# Mostramos los datos generados
print(df_tiendas)

# Conectamos a la base de datos MySQL usando SQLAlchemy
user = "root"
password = "admin"
database = "supermercado"

engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

# Insertamos el DataFrame en la tabla 'tiendas' de MySQL, reemplazando la tabla si ya existe
df_tiendas.to_sql('tiendas', con=engine, if_exists='append', index=False)

   id_tienda   nombre_tienda                 direccion     ciudad
0          1   Tienda Centro           Calle Falsa 123     Madrid
1          2     Super Norte  Avenida Siempre Viva 742  Barcelona
2          3       Super Sur            Calle Real 456  M√©xico DF
3          4  Tienda Express      Avenida Libertad 100   Valencia
4          5     Mega Tienda          Calle del Sol 89       Lima


5

># **Nota sobre la Desactivaci√≥n Temporal de Claves For√°neas para Pruebas**
>
>Cuando trabajamos con bases de datos, las claves for√°neas son esenciales para garantizar que los datos en una tabla est√©n correctamente relacionados con otras tablas. Sin embargo, durante las pruebas o cuando necesitamos hacer grandes modificaciones en las tablas, a veces es necesario desactivar temporalmente estas restricciones. Esto nos ayuda a evitar errores que podr√≠an surgir debido a relaciones entre tablas.
>
>### **¬øPor qu√© desactivar las claves for√°neas?**
>
>Deshabilitar las claves for√°neas tiene sentido cuando estamos haciendo pruebas o realizando operaciones espec√≠ficas, como las siguientes:
>
>1. **Reemplazo de Tablas:**
>   Si estamos reemplazando una tabla completa (por ejemplo, la tabla `ordenes`), las claves for√°neas pueden generar problemas si hay registros en otras tablas que dependen de esa tabla. Esto es algo com√∫n cuando estamos cargando nuevos datos o limpiando tablas antes de hacer nuevas inserciones.
>
>2. **Evitar Errores de Integridad:**
>   Las restricciones de claves for√°neas pueden impedir ciertas operaciones si los registros referenciados todav√≠a existen en otras tablas. Esto puede resultar en errores al intentar eliminar o actualizar una tabla que est√° siendo utilizada por otras.
>
>3. **Facilitar las Pruebas:**
>   Durante las pruebas de datos o migraciones, desactivar temporalmente las claves for√°neas puede facilitarnos la manipulaci√≥n de los datos sin que las restricciones interrumpan el proceso. Esto es especialmente √∫til cuando estamos depurando o cargando grandes vol√∫menes de datos.


#### **empleados**

- **id_empleado**: valores enteros consecutivos (1, 2, 3...).
- **nombre_empleado**: nombres y apellidos ficticios (p. ej. ‚ÄúLaura Guti√©rrez‚Äù, ‚ÄúJuan P√©rez‚Äù).
- **puesto**: limitarse a un conjunto reducido de valores (p. ej. {‚ÄòCajero‚Äô, ‚ÄòGerente‚Äô, ‚ÄòReponedor‚Äô, ‚ÄòVendedor‚Äô}).
- **id_tienda**: debe hacer referencia a una tienda existente (por ejemplo, un n√∫mero entre 1 y 3 si solo tienes 3 tiendas).

En total: **20 empleados por tienda**.

---



In [34]:
from sqlalchemy import create_engine
import pandas as pd
import random

# Definimos los datos de ejemplo
nombres_empleado = ["Laura Guti√©rrez", "Juan P√©rez", "Carlos L√≥pez", "Mar√≠a Gil", "Pedro Rodr√≠guez", "Ana Ruiz", "Luis Fern√°ndez", "Beatriz Mart√≠nez", "Jorge Garc√≠a", "Carmen L√≥pez"]
puestos = ["Cajero", "Gerente", "Reponedor"]
num_tiendas = 5  # Hacemos esto porque tenemos 5 tiendas

# Se genera la lista de empleados con datos aleatorios
empleados_data = []
for tienda_id in range(1, num_tiendas + 1):  # Para cada tienda
    for i in range(1, 21):  # Para 20 empleados por tienda
        empleado = {
            "id_empleado": (tienda_id - 1) * 20 + i,  # ID √∫nico secuencial para cada tienda
            "nombre_empleado": random.choice(nombres_empleado),
            "puesto": random.choice(puestos),
            "id_tienda": tienda_id
        }
        empleados_data.append(empleado)

# Convertimos a DataFrame
df_empleados = pd.DataFrame(empleados_data)

# Mostramos los datos generados
print(df_empleados)

# Conectamos a la base de datos MySQL usando SQLAlchemy
user = "root"
password = "admin"
database = "supermercado"

engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

# Se inserta el DataFrame en la tabla 'empleados' de MySQL
df_empleados.to_sql('empleados', con=engine, if_exists='append', index=False)

    id_empleado   nombre_empleado     puesto  id_tienda
0             1      Carlos L√≥pez     Cajero          1
1             2      Jorge Garc√≠a     Cajero          1
2             3      Carlos L√≥pez     Cajero          1
3             4  Beatriz Mart√≠nez     Cajero          1
4             5          Ana Ruiz  Reponedor          1
..          ...               ...        ...        ...
95           96   Pedro Rodr√≠guez    Gerente          5
96           97  Beatriz Mart√≠nez    Gerente          5
97           98        Juan P√©rez     Cajero          5
98           99      Carmen L√≥pez    Gerente          5
99          100      Carlos L√≥pez    Gerente          5

[100 rows x 4 columns]


100

#### **categorias**

- **id_categoria**: valores enteros consecutivos (1, 2, 3...).
- **nombre_categoria**: selecci√≥n de categor√≠as (p. ej. ‚ÄúL√°cteos‚Äù, ‚ÄúCarnes‚Äù, ‚ÄúFrutas‚Äù, ‚ÄúVerduras‚Äù, ‚ÄúBebidas‚Äù, ‚ÄúSnacks‚Äù).

En total: **10 categor√≠as**.

---



In [35]:
from sqlalchemy import create_engine
import pandas as pd
import random

# Definimos las categor√≠as de productos
categorias = ["L√°cteos", "Carnes", "Frutas", "Verduras", "Bebidas", "Snacks", "Congelados", "Panader√≠a", "Cereales", "Dulces"]

# Generamos una lista de categor√≠as con datos al igual que con el resto de tablas
categorias_data = []
for i, categoria in enumerate(categorias, start=1):
    categoria_data = {
        "id_categoria": i,
        "nombre_categoria": categoria
    }
    categorias_data.append(categoria_data)

# Convertimos a DataFrame
df_categorias = pd.DataFrame(categorias_data)

# Mostramos los datos generados
print(df_categorias)

# Conectamos a la base de datos MySQL usando SQLAlchemy
user = "root"
password = "admin"
database = "supermercado"

engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

# Insertamos el DataFrame en la tabla 'categorias' de MySQL
df_categorias.to_sql('categorias', con=engine, if_exists='append', index=False)


   id_categoria nombre_categoria
0             1          L√°cteos
1             2           Carnes
2             3           Frutas
3             4         Verduras
4             5          Bebidas
5             6           Snacks
6             7       Congelados
7             8        Panader√≠a
8             9         Cereales
9            10           Dulces


10

#### **productos**

- **id_producto**: valores enteros consecutivos (1, 2, 3...).
- **nombre_producto**: nombres como ‚ÄúLeche Entera‚Äù, ‚ÄúManzana Roja‚Äù, ‚ÄúRefresco de Cola‚Äù, etc.
- **precio**: valores **DECIMAL** entre 0.50 y 50.00, por ejemplo.
- **stock**: valores **INT** entre 0 y 500 (o el rango que quieras).
- **id_categoria**: debe hacer referencia a las categor√≠as que hayas definido (1, 2, 3, etc.).

En total: **4 productos de cada categor√≠a**.

---



In [36]:
from sqlalchemy import create_engine
import pandas as pd
import random

# Definimos los productos por categor√≠a
productos = {
    1: ["Leche Entera", "Yogur Natural", "Mantequilla", "Queso Fresco"],  # L√°cteos
    2: ["Carne de Res", "Pollo", "Pechuga de Pavo", "Cerdo"],  # Carnes
    3: ["Manzana Roja", "Pl√°tano", "Naranja", "Uva"],  # Frutas
    4: ["Lechuga", "Tomate", "Espinaca", "Pepino"],  # Verduras
    5: ["Agua Mineral", "Refresco de Cola", "Jugo de Naranja", "Cerveza"],  # Bebidas
    6: ["Papitas", "Galletas", "Chocolates", "Barritas de Cereales"],  # Snacks
    7: ["Pizza Congelada", "Pechugas de Pollo Congeladas", "Verduras Congeladas", "Helado"],  # Congelados
    8: ["Pan Integral", "Pan de Molde", "Pan de Ajo", "Pan de Pita"],  # Panader√≠a
    9: ["Cereal Integral", "Avena", "Cornflakes", "Choco Krispies"],  # Cereales
    10: ["Caramelos", "Chicles", "Galletas Dulces", "Chocolate de Leche"]  # Dulces
}

# Inicializar ID consecutivo para los productos
id_producto_consecutivo = 1

# Se genera la lista de productos con datos
productos_data = []
for categoria_id, lista_productos in productos.items():
    for nombre_producto in lista_productos:
        producto_data = {
            "id_producto": id_producto_consecutivo,  # ID consecutivo
            "nombre_producto": nombre_producto,
            "precio": round(random.uniform(0.50, 50.00), 2),
            "stock": random.randint(0, 500),
            "id_categoria": categoria_id
        }
        productos_data.append(producto_data)
        id_producto_consecutivo += 1  # Incrementar el ID para el siguiente producto

# Convertimos a DataFrame
df_productos = pd.DataFrame(productos_data)

# Mostramos los datos generados
print(df_productos)

# Conectamos a la base de datos MySQL usando SQLAlchemy
user = "root"
password = "admin"
database = "supermercado"

engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

# Insertamos el DataFrame en la tabla 'productos' de MySQL
df_productos.to_sql('productos', con=engine, if_exists='append', index=False)

    id_producto               nombre_producto  precio  stock  id_categoria
0             1                  Leche Entera   32.06    114             1
1             2                 Yogur Natural   43.56    162             1
2             3                   Mantequilla   16.34    355             1
3             4                  Queso Fresco    6.15    331             1
4             5                  Carne de Res   36.29     67             2
5             6                         Pollo    1.92    136             2
6             7               Pechuga de Pavo   12.74    245             2
7             8                         Cerdo   38.36    466             2
8             9                  Manzana Roja   42.22     87             3
9            10                       Pl√°tano   38.16    152             3
10           11                       Naranja   33.37    284             3
11           12                           Uva   48.71    376             3
12           13         

40

>### üí° **Generaci√≥n de Productos por Categor√≠a**
>
>Lo que he hecho fue organizar los productos por categor√≠as. Para evitar tener que escribir todos los datos a mano, usamos un **diccionario** donde cada clave es el ID de la categor√≠a, y cada valor es una lista de productos correspondientes a esa categor√≠a. 
>
>Ejemplo:
>- La categor√≠a "L√°cteos" tiene productos como "Leche Entera", "Yogur Natural", etc.
>- La categor√≠a "Carnes" tiene "Carne de Res", "Pollo", y otros productos.
>
>---
>
>**Creaci√≥n de datos:**
>
>1. He creado una lista vac√≠a llamada `productos_data` donde se ir√°n agregando los productos.
>2. Para cada categor√≠a y producto:
 >   - Se calcula un **`id_producto`** creando una variable id_producto_consecutivo que empieza en 1 y se incrementa cada vez que se agrega un producto a la lista.
>    - Se genera un **`precio`** aleatorio entre 0.50 y 50.00 para hacerlo m√°s realista.
>    - Se genera un **`stock`** aleatorio entre 0 y 500, para simular la cantidad disponible de cada producto.
>    - Se asigna el **`id_categoria`**, que es el ID de la categor√≠a a la que pertenece el producto.
>
>As√≠, cada producto tiene su ID, nombre, precio, stock y categor√≠a.
>
>---
>
>**¬øPor qu√© hacerlo as√≠?**
>
>Lo he hecho aa√≠ esta para que todo fuera m√°s flexible y r√°pido. En lugar de agregar cada producto a mano, podemos generar miles de productos de forma sencilla y automatizada. Adem√°s, al organizarlos por categor√≠as, me aseguro de que cada producto est√© bien categorizado, lo que facilita luego la gesti√≥n de estos datos.


#### **clientes**

- **id_cliente**: valores enteros consecutivos (1, 2, 3...).
- **first_name**: nombres ficticios generados secuencialmente (p. ej. ‚Äúfirst_name00‚Äù, ‚Äúfirst_name01‚Äù).
- **last_name**: apellidos ficticios generados secuencialmente (p. ej. ‚Äúlast_name00‚Äù, ‚Äúlast_name01‚Äù).
- **email**: correos electr√≥nicos generados como `first_nameXX.last_nameXX@python.com` (p. ej. "first_name00.last_name00@python.com").
- **codigo_postal**: c√≥digos postales aleatorios asignados a los clientes de una lista predefinida de 20 c√≥digos postales diferentes.

En total: **2000 clientes** generados.

---

In [37]:
import random

# Lista para almacenar los datos de clientes
clientes_data = []

# Generamos 20 c√≥digos postales aleatorios
codigos_postales = [random.randint(2000, 5000) for _ in range(20)]

# Creamos 2000 clientes
for i in range(2000):
    # Se genera el nombre y apellido
    first_name = f"first_name{i:02d}" 
    last_name = f"last_name{i:02d}"  
    
    # Generamos el email
    email = f"{first_name}.{last_name}@python.com"
     
    # Asignamos un c√≥digo postal aleatorio de los 20 generados
    codigo_postal = random.choice(codigos_postales)

    # Creamos el diccionario para cada cliente
    cliente_data = {
        "id_cliente": i + 1,  # id_cliente de 1 a 2000
        "first_name": first_name,
        "last_name": last_name,
        "email": email,
        "codigo_postal": codigo_postal
    }

    # Se agrega el cliente a la lista
    clientes_data.append(cliente_data)
    
# Convertimos a DataFrame
df_clientes = pd.DataFrame(clientes_data)

# Mostramos los datos generados
print(df_clientes)

# Conectamos a la base de datos MySQL usando SQLAlchemy
user = "root"
password = "admin"
database = "supermercado"

engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

# Insertamos el DataFrame en la tabla 'clientes' de MySQL
df_clientes.to_sql('clientes', con=engine, if_exists='append', index=False)

      id_cliente      first_name      last_name  \
0              1    first_name00    last_name00   
1              2    first_name01    last_name01   
2              3    first_name02    last_name02   
3              4    first_name03    last_name03   
4              5    first_name04    last_name04   
...          ...             ...            ...   
1995        1996  first_name1995  last_name1995   
1996        1997  first_name1996  last_name1996   
1997        1998  first_name1997  last_name1997   
1998        1999  first_name1998  last_name1998   
1999        2000  first_name1999  last_name1999   

                                        email  codigo_postal  
0         first_name00.last_name00@python.com           3512  
1         first_name01.last_name01@python.com           2423  
2         first_name02.last_name02@python.com           4059  
3         first_name03.last_name03@python.com           4810  
4         first_name04.last_name04@python.com           3953  
...      

2000

#### **ordenes**

- **id_orden**: valores enteros consecutivos (1, 2, 3...).
- **id_cliente**: haz referencia a los IDs existentes de la tabla clientes.
- **id_empleado**: haz referencia a los IDs existentes de la tabla empleados.
- **fecha_orden**: genera fechas aleatorias o secuenciales (p. ej. entre ‚Äò2024-01-01‚Äô y ‚Äò2025-01-01‚Äô).
- **metodo_pago**: escoge entre {‚ÄòTarjeta‚Äô, ‚ÄòEfectivo‚Äô}.

En total: **10000 √≥rdenes**.

---


In [38]:
import random
import pandas as pd
from datetime import datetime, timedelta

# Definimos el n√∫mero total de √≥rdenes
total_ordenes = 10000

# Se obtenienen los IDs de clientes y empleados
clientes_ids = list(range(1, 2001))  # Para 2000 clientes
empleados_ids = list(range(1, 101))  # Para 100 empleados si tienes 5 tiendas y 20 empleados por tienda

# He creado esta funci√≥n para generar una fecha aleatoria entre dos fechas
def generar_fecha_orden(start_date, end_date):
    time_between_dates = end_date - start_date
    random_number_of_days = random.randrange(time_between_dates.days)
    return start_date + timedelta(days=random_number_of_days)

# Se establece el rango de fechas
start_date = datetime(2024, 1, 1)
end_date = datetime(2025, 1, 1)

# Definimos los m√©todos de pago posibles
metodos_pago = ['Tarjeta', 'Efectivo']

# Creamos una lista para almacenar las √≥rdenes
ordenes_data = []

# Generamos las √≥rdenes
for i in range(1, total_ordenes + 1):
    id_cliente = random.choice(clientes_ids)
    id_empleado = random.choice(empleados_ids)  # Ahora seleccionamos entre todos los empleados
    fecha_orden = generar_fecha_orden(start_date, end_date)
    metodo_pago = random.choice(metodos_pago)

    # Creamos un diccionario para la orden
    orden_data = {
        "id_orden": i,
        "id_cliente": id_cliente,
        "id_empleado": id_empleado,
        "fecha_orden": fecha_orden.strftime('%Y-%m-%d'),
        "metodo_pago": metodo_pago
    }
    
    # Se a√±ade la orden a la lista
    ordenes_data.append(orden_data)

# Creamos el DataFrame
df_ordenes = pd.DataFrame(ordenes_data)

# Mostramos las primeras filas del DataFrame
print(df_ordenes.head())

# Conectamos a la base de datos MySQL usando SQLAlchemy
user = "root"
password = "admin"
database = "supermercado"

engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

# Insertamos el DataFrame en la tabla 'ordenes' de MySQL
df_ordenes.to_sql('ordenes', con=engine, if_exists='append', index=False)


   id_orden  id_cliente  id_empleado fecha_orden metodo_pago
0         1        1376           78  2024-10-09     Tarjeta
1         2         121           89  2024-06-05     Tarjeta
2         3        1035           68  2024-02-06    Efectivo
3         4        1356            6  2024-03-24     Tarjeta
4         5        1487            2  2024-10-09     Tarjeta


10000

#### **detalle_orden**

- **id_detalle**: valores enteros consecutivos (1, 2, 3...).
- **id_orden**: referencia al ID de alguna orden v√°lida.
- **id_producto**: referencia al ID de alg√∫n producto v√°lido.
- **cantidad**: valores entre 1 y 20, por ejemplo.
- **precio_unitario**: usar el mismo precio que est√° en la tabla productos o uno ligeramente distinto si quieres simular ofertas.
- **descuento**: valores **DECIMAL** bajos (p. ej. 0.00, 1.00, 2.50) o **NULL**.

En total: **30000 detalles de orden**.

---

In [39]:
import random
import pandas as pd
from sqlalchemy import create_engine

# Conectamos a la base de datos
user = "root"
password = "admin"
database = "supermercado"
engine = create_engine(f"mysql+pymysql://{user}:{password}@localhost/{database}")

# Traemos los precios reales de productos 
productos = pd.read_sql('SELECT id_producto, precio FROM productos', engine)
precios_reales = dict(zip(productos['id_producto'], productos['precio']))

# Configuraciones b√°sicas
total_detalles = 30000
ordenes_ids = list(range(1, 10001))  # IDs de 1 a 10000
productos_ids = list(precios_reales.keys())  # Usamos los IDs reales de productos

# 4. Generamos los detalles de √≥rdenes
detalles = []
for i in range(1, total_detalles + 1):
  
    orden = random.choice(ordenes_ids)
    producto = random.choice(productos_ids)
    
    precio_base = precios_reales[producto]
    
    descuento = random.choice([0.0, 1.00, 2.50, None])
    precio_final = round(precio_base - (descuento if descuento else 0), 2)
    
    precio_final = max(precio_final, 0.01)
    
    detalles.append({
        "id_detalle": i,
        "id_orden": orden,
        "id_producto": producto,
        "cantidad": random.randint(1, 20),
        "precio_unitario": precio_final,
        "descuento": descuento
    })

# Convertimos a DataFrame y subimos a MySQL
df = pd.DataFrame(detalles)
df.to_sql('detalle_orden', engine, if_exists='append', index=False)

print("¬°Detalles generados exitosamente!")
print(df.head())  # Mostramos un preview

¬°Detalles generados exitosamente!
   id_detalle  id_orden  id_producto  cantidad  precio_unitario  descuento
0           1      4816           13        15             3.02        2.5
1           2       624           27        16            14.46        0.0
2           3      2809           14        20            34.57        1.0
3           4      8132           30        14            20.46        0.0
4           5      4060            6         9             1.92        0.0


># üõí Generaci√≥n de Datos de Detalles de √ìrdenes:
>
>**Objetivo:** Crear datos realistas de compras en un supermercado virtual, asegurando que los precios y relaciones entre tablas sean consistentes.
>
>---
>
>## üîç ¬øC√≥mo funciona?
>
>### 1. **Precios Reales desde la Base de Datos**
>   - **Qu√© hace:**  
>     Usa los precios **aut√©nticos** de los productos almacenados en la tabla `productos`.  
>     *(No inventa precios, los toma directamente de lo que ya tienes guardado)*.
>   - **Ejemplo Pr√°ctico:**  
>     Si en la DB el pan cuesta 2.50‚Ç¨ y el queso 5.00‚Ç¨, el c√≥digo usar√° exactamente esos valores.
>
>### 2. **Aplicaci√≥n de Descuentos**
>   > - **Qu√© hace:**  
>   >   Genera descuentos aleatorios sobre los precios reales:
>   >   - Opciones: `0.00` (sin descuento), `1.00‚Ç¨`, `2.50‚Ç¨` o `NULL` (sin descuento).  
>   >   - **Regla importante:** El precio final nunca ser√° negativo.  
>   >     *(Si el descuento es mayor al precio, se ajusta autom√°ticamente a 0.01‚Ç¨)*.
>
>### 3. üé≤ Aleatoriedad Controlada
>Para que los datos parezcan compras reales, se generan **comportamientos aleatorios** en:
>
>#### a) **Selecci√≥n de √ìrdenes**  
>   > - Elige al azar √≥rdenes existentes (de 1 a 10,000).  
>   > *Ejemplo: La orden #589 y #7,542 tendr√°n productos asociados aleatoriamente*.
>
>#### b) **Selecci√≥n de Productos**  
>   > - Escoge cualquier producto de tu cat√°logo (40 productos en total).  
>   > *Ejemplo: Un cliente podr√≠a comprar manzanas y detergente en la misma orden*.
>
>#### c) **Cantidad Comprada**  
>   > - Simula cantidades razonables: entre 1 y 20 unidades por producto.  
>   > *Ejemplo: 5 latas de refresco o 2 paquetes de arroz*.
>
>#### d) **Aplicaci√≥n de Descuentos**  
>   > - No todos los productos tienen descuento:  
>   >   - 25% de probabilidad de aplicar 1.00‚Ç¨ o 2.50‚Ç¨.  
>   >   - 25% de probabilidad de no aplicar descuento (`NULL`).
>
>---
>
>## üß© Ejemplo Visual de una L√≠nea de Compra
>| ID Orden | Producto       | Precio Real | Descuento | Precio Final | Cantidad | Total L√≠nea |
>|----------|----------------|-------------|-----------|--------------|----------|-------------|
>| 342      | Leche Entera   | 1.50‚Ç¨       | 0.50‚Ç¨     | 1.00‚Ç¨        | 3        | 3.00‚Ç¨       |
>| 342      | Chocolate      | 3.00‚Ç¨       | NULL      | 3.00‚Ç¨        | 2        | 6.00‚Ç¨       |
>| 7891     | Pan Integral   | 2.00‚Ç¨       | 2.50‚Ç¨     | 0.01‚Ç¨*       | 1        | 0.01‚Ç¨       |
>
>**Nota:** El pan tuvo un descuento mayor a su precio, por eso se ajust√≥ a 0.01‚Ç¨.
>
>---
>
>## ‚öôÔ∏è ¬øPor qu√© es importante este enfoque?
>- **Consistencia:** Los precios siempre coinciden con tu cat√°logo real.  
>- **Realismo:** Los descuentos y cantidades reflejan comportamientos de compra t√≠picos.  
>- **Flexibilidad:** Puedes ajustar f√°cilmente los rangos (ej: cambiar m√°ximo de cantidad a 50).


### 3. Consultas SQL (34%)

1. **Listado de √≥rdenes con detalles de cliente y empleado**
   * Muestra el ID de la orden, la fecha, el nombre del cliente, el nombre del empleado que atendi√≥ la compra y el m√©todo de pago.
   * Utiliza un JOIN entre las tablas `ordenes`, `clientes` y `empleados`.



In [40]:
import mysql.connector

# Se establece la conexi√≥n
conexion = mysql.connector.connect(
    host="localhost",
    user="root",
    password="admin",
    database="supermercado"
)

# Creamos el cursor
cursor = conexion.cursor()

# Consulta SQL 
query = """
SELECT 
    o.id_orden, 
    o.fecha_orden, 
    c.first_name AS nombre_cliente, 
    e.nombre_empleado AS nombre_empleado,
    o.metodo_pago
FROM 
    ordenes o
JOIN 
    clientes c ON o.id_cliente = c.id_cliente
JOIN 
    empleados e ON o.id_empleado = e.id_empleado;
"""

# Ejecutamos la consulta
cursor.execute(query)

# Obtenemos los resultados
resultados = cursor.fetchall()

# Convertimos los resultados a un DataFrame de pandas para mejor visualizaci√≥n
df_resultados = pd.DataFrame(resultados, columns=['ID Orden', 'Fecha Orden', 'Nombre Cliente', 'Nombre Empleado', 'M√©todo de Pago'])

# Mostramos los resultados
print(df_resultados)

# Cerramos la conexi√≥n
cursor.close()
conexion.close()

      ID Orden Fecha Orden  Nombre Cliente   Nombre Empleado M√©todo de Pago
0            1  2024-10-09  first_name1375          Ana Ruiz        Tarjeta
1            2  2024-06-05   first_name120         Mar√≠a Gil        Tarjeta
2            3  2024-02-06  first_name1034      Carmen L√≥pez       Efectivo
3            4  2024-03-24  first_name1355         Mar√≠a Gil        Tarjeta
4            5  2024-10-09  first_name1486      Jorge Garc√≠a        Tarjeta
...        ...         ...             ...               ...            ...
9995      9996  2024-12-31  first_name1230          Ana Ruiz        Tarjeta
9996      9997  2024-12-23   first_name892         Mar√≠a Gil        Tarjeta
9997      9998  2024-12-20   first_name100          Ana Ruiz       Efectivo
9998      9999  2024-08-14  first_name1898          Ana Ruiz        Tarjeta
9999     10000  2024-03-25   first_name742  Beatriz Mart√≠nez        Tarjeta

[10000 rows x 5 columns]


2. **Productos con stock bajo**
   * Filtra aquellos productos cuyo stock sea menor a 10.
   * Muestra el nombre del producto, categor√≠a y stock.



In [41]:
import mysql.connector

# Se establece la conexi√≥n
conexion = mysql.connector.connect(
    host="localhost",
    user="root",
    password="admin",
    database="supermercado"
)

# Creamos el cursor
cursor = conexion.cursor()

# Consulta SQL 
query = """
SELECT 
    p.nombre_producto, 
    c.nombre_categoria, 
    p.stock
FROM 
    productos p
JOIN 
    categorias c ON p.id_categoria = c.id_categoria
WHERE 
    p.stock < 10;
"""

# Ejecutamos la consulta
cursor.execute(query)

# Obtenemos los resultados
resultados = cursor.fetchall()

# Convertimos los resultados a un DataFrame de pandas para mejor visualizaci√≥n
df_resultados = pd.DataFrame(resultados, columns=['Nombre Producto', 'Categor√≠a', 'Stock'])

# Mostramos los resultados
print(df_resultados)

# Cerramos la conexi√≥n
cursor.close()
conexion.close()

Empty DataFrame
Columns: [Nombre Producto, Categor√≠a, Stock]
Index: []


3. **Ventas totales por categor√≠a**
   * Muestra el nombre de la categor√≠a y la suma total de las ventas (ej.: multiplicando `cantidad` * `precio_unitario`) para cada categor√≠a.
   * Realiza el JOIN con `detalle_orden`, `productos` y `categorias`.
   * Utiliza agrupaci√≥n (`GROUP BY`).



In [42]:
import mysql.connector

# Establecemos conexi√≥n
conexion = mysql.connector.connect(
    host="localhost",
    user="root",
    password="admin",
    database="supermercado"
)

# Creamos el cursor
cursor = conexion.cursor()

# Consultamos el SQL para ventas totales por categor√≠a
query = """
SELECT 
    c.nombre_categoria AS Categoria,
    SUM(d.cantidad * d.precio_unitario) AS Ventas_Totales
FROM 
    detalle_orden d
JOIN 
    productos p ON d.id_producto = p.id_producto
JOIN 
    categorias c ON p.id_categoria = c.id_categoria
GROUP BY 
    c.nombre_categoria;
"""

# Ejecutamos la consulta
cursor.execute(query)

# Obtenemos los resultados
resultados = cursor.fetchall()

# Convertimos los resultados a un DataFrame de pandas para mejor visualizaci√≥n
df_resultados = pd.DataFrame(resultados, columns=['Categor√≠a', 'Ventas Totales'])

# Se muestran los resultados
print(df_resultados)

# Cerramos la conexi√≥n
cursor.close()
conexion.close()

    Categor√≠a Ventas Totales
0    Verduras      502741.66
1  Congelados      883051.45
2   Panader√≠a      870955.44
3      Carnes      692520.59
4    Cereales      554914.52
5     L√°cteos      756042.17
6      Snacks      962294.15
7     Bebidas     1256807.41
8      Dulces      554738.57
9      Frutas     1268146.44


4. **Clientes con mayores gastos acumulados**
   * Muestra el nombre del cliente y el monto total que ha gastado (suma de todas sus √≥rdenes).
   * Aseg√∫rate de tener en cuenta posibles descuentos (`descuento`) si se ha definido. Por ejemplo, la f√≥rmula podr√≠a ser `(cantidad * precio_unitario) - descuento`.
   * Ordena el resultado de mayor a menor gasto acumulado.



In [43]:
import mysql.connector

# Establecemos conexi√≥n
conexion = mysql.connector.connect(
    host="localhost",
    user="root",
    password="admin",
    database="supermercado"
)

# Creamos el cursor
cursor = conexion.cursor()

# Consultamos el SQL para ventas totales por categor√≠a
query = """
SELECT 
    CONCAT(c.first_name, ' ', c.last_name) AS Nombre_Cliente,
    SUM(d.cantidad * d.precio_unitario - IFNULL(d.descuento, 0)) AS Gasto_Total
FROM 
    clientes c
JOIN 
    ordenes o ON c.id_cliente = o.id_cliente
JOIN 
    detalle_orden d ON o.id_orden = d.id_orden
GROUP BY 
    c.id_cliente
ORDER BY 
    Gasto_Total DESC;
"""

# Ejecutamos la consulta
cursor.execute(query)

# Obtenemos los resultados
resultados = cursor.fetchall()

# Convertimos los resultados a un DataFrame de pandas para mejor visualizaci√≥n
df_resultados = pd.DataFrame(resultados, columns=['Nombre Cliente', 'Gasto Total'])

# Se muestran los resultados
print(df_resultados)

# Cerramos la conexi√≥n
cursor.close()
conexion.close()

                    Nombre Cliente Gasto Total
0     first_name1635 last_name1635    14744.88
1     first_name1772 last_name1772    14387.13
2     first_name1365 last_name1365    13963.44
3       first_name536 last_name536    13963.26
4       first_name410 last_name410    13100.71
...                            ...         ...
1976    first_name893 last_name893       72.30
1977    first_name905 last_name905       52.32
1978  first_name1809 last_name1809       21.66
1979  first_name1557 last_name1557       10.69
1980  first_name1911 last_name1911        8.82

[1981 rows x 2 columns]


># üß† Nota sobre el `IFNULL`
>
>**Situaci√≥n:** Estaba haciendo un c√°lculo en SQL tipo:  
>`precio * cantidad - descuento`...  
>¬°Pero pens√© en que si algunos datos fueran `NULL` podr√≠a fallar o no sacar los datos de manera correcta!
>
>## üí• El Problema
>- Si intentas hacer: `10 - NULL`, SQL te devuelve un None*.  
>- Resultado: ¬°Habr√°n clientes que en vez de devolverte el total, te devolver√° None! 
>
>---
>
>## ‚ú® Qu√© hace `IFNULL`
>Funci√≥n:  
>*"Si el descuento es NULL, lo que hace es que lo trata como cero"*.
>
>**As√≠ queda:**  
>```sql
>precio * cantidad - IFNULL(descuento, 0)

5. **Empleados y n√∫mero de √≥rdenes gestionadas**
   * Muestra el nombre del empleado, el puesto y la cantidad de √≥rdenes que ha gestionado.
   * Utiliza `GROUP BY` y `COUNT`.


In [44]:
import mysql.connector

# Establecemos conexi√≥n
conexion = mysql.connector.connect(
    host="localhost",
    user="root",
    password="admin",
    database="supermercado"
)

# Creamos el cursor
cursor = conexion.cursor()

# Consultamos el SQL para ventas totales por categor√≠a
query = """
SELECT 
    e.nombre_empleado AS Nombre_Empleado,
    e.puesto AS Puesto,
    COUNT(o.id_orden) AS Numero_Ordenes
FROM 
    empleados e
LEFT JOIN 
    ordenes o ON e.id_empleado = o.id_empleado
GROUP BY 
    e.id_empleado
ORDER BY 
    Numero_Ordenes DESC;
"""

# Ejecutamos la consulta
cursor.execute(query)

# Obtenemos los resultados
resultados = cursor.fetchall()

# Convertimos los resultados a un DataFrame de pandas para mejor visualizaci√≥n
df_resultados = pd.DataFrame(resultados, columns=['Nombre Empleado', 'Puesto', 'N√∫mero de √ìrdenes'])

# Se muestran los resultados
print(df_resultados)

# Cerramos la conexi√≥n
cursor.close()
conexion.close()

    Nombre Empleado     Puesto  N√∫mero de √ìrdenes
0      Jorge Garc√≠a    Gerente                127
1        Juan P√©rez  Reponedor                126
2      Carlos L√≥pez     Cajero                125
3        Juan P√©rez  Reponedor                123
4      Jorge Garc√≠a     Cajero                120
..              ...        ...                ...
95     Carlos L√≥pez     Cajero                 81
96  Laura Guti√©rrez  Reponedor                 81
97  Pedro Rodr√≠guez     Cajero                 75
98       Juan P√©rez  Reponedor                 74
99     Jorge Garc√≠a     Cajero                 72

[100 rows x 3 columns]



6. **√ìrdenes filtradas por fecha y tienda**
   * Muestra todas las √≥rdenes que se realizaron en un rango de fechas determinado (ej.: del 1 de enero de 2025 al 31 de enero de 2025) y en una tienda espec√≠fica.
   * Incluye datos de la tienda y del cliente.



In [45]:
import mysql.connector

# Establecemos conexi√≥n
conexion = mysql.connector.connect(
    host="localhost",
    user="root",
    password="admin",
    database="supermercado"
)

# Creamos el cursor
cursor = conexion.cursor()

# Consultamos el SQL para ventas totales por categor√≠a
query = """
SELECT 
     o.id_orden AS ID_Orden,
    o.fecha_orden AS Fecha_Orden,
    c.first_name AS Nombre_Cliente,
    c.last_name AS Apellido_Cliente,
    t.nombre_tienda AS Nombre_Tienda,
    t.direccion AS Direccion_Tienda,
    t.ciudad AS Ciudad_Tienda,
    o.metodo_pago AS Metodo_Pago
FROM ordenes o
INNER JOIN empleados e ON o.id_empleado = e.id_empleado
INNER JOIN tiendas t ON e.id_tienda = t.id_tienda
INNER JOIN clientes c ON o.id_cliente = c.id_cliente
WHERE o.fecha_orden BETWEEN '2024-01-01' AND '2024-10-31'
    AND t.id_tienda = 5  -- Aqu√≠ se pone el ID de la tienda que quieras sacar
ORDER BY o.fecha_orden;
"""

# Ejecutamos la consulta
cursor.execute(query)

# Obtenemos los resultados
resultados = cursor.fetchall()

# Convertimos los resultados a un DataFrame de pandas para mejor visualizaci√≥n
df_resultados = pd.DataFrame(resultados, columns=[
    'ID Orden', 'Fecha Orden', 'Nombre Cliente', 'Apellido Cliente', 
    'Nombre Tienda', 'Direccion Tienda', 'Ciudad Tienda', 'M√©todo de Pago'
])

# Se muestran los resultados
print(df_resultados)

# Cerramos la conexi√≥n
cursor.close()
conexion.close()

      ID Orden Fecha Orden  Nombre Cliente Apellido Cliente Nombre Tienda  \
0          804  2024-01-01   first_name731     last_name731   Mega Tienda   
1         2323  2024-01-01   first_name145     last_name145   Mega Tienda   
2         2661  2024-01-01   first_name911     last_name911   Mega Tienda   
3         6900  2024-01-02  first_name1619    last_name1619   Mega Tienda   
4         7112  2024-01-02   first_name806     last_name806   Mega Tienda   
...        ...         ...             ...              ...           ...   
1661      2273  2024-10-30   first_name563     last_name563   Mega Tienda   
1662      3039  2024-10-30   first_name406     last_name406   Mega Tienda   
1663      6803  2024-10-30  first_name1334    last_name1334   Mega Tienda   
1664      8839  2024-10-30   first_name556     last_name556   Mega Tienda   
1665      2958  2024-10-31  first_name1518    last_name1518   Mega Tienda   

      Direccion Tienda Ciudad Tienda M√©todo de Pago  
0     Calle del Sol 

7. **Ranking de productos m√°s vendidos en cada tienda**
   * Para cada tienda, muestra los 3 productos m√°s vendidos (en t√©rminos de cantidad total).
   * Tendr√°s que unir `tiendas`, `empleados`, `ordenes` y `detalle_orden`, adem√°s de `productos`.
   * Usa `GROUP BY` y ordena por la cantidad sumada (y opcionalmente, un `LIMIT 3`).



In [46]:
import mysql.connector

# Establecemos conexi√≥n
conexion = mysql.connector.connect(
    host="localhost",
    user="root",
    password="admin",
    database="supermercado"
)

# Creamos el cursor
cursor = conexion.cursor()

# Consultamos el SQL para ventas totales por categor√≠a
query = """
SELECT nombre_tienda, nombre_producto, total_vendido
FROM (
    SELECT 
        t.nombre_tienda,
        p.nombre_producto,
        SUM(do.cantidad) as total_vendido,
        DENSE_RANK() OVER (PARTITION BY t.nombre_tienda ORDER BY SUM(do.cantidad) DESC) as ranking
    FROM tiendas t
    INNER JOIN empleados e ON t.id_tienda = e.id_tienda
    INNER JOIN ordenes o ON e.id_empleado = o.id_empleado
    INNER JOIN detalle_orden do ON o.id_orden = do.id_orden
    INNER JOIN productos p ON do.id_producto = p.id_producto
    GROUP BY t.nombre_tienda, p.nombre_producto
) as ranked
WHERE ranking <= 3
ORDER BY nombre_tienda, total_vendido DESC;
"""

# Ejecutamos la consulta
cursor.execute(query)

# Obtenemos los resultados
resultados = cursor.fetchall()

# Convertimos los resultados a un DataFrame de pandas para mejor visualizaci√≥n
df_resultados = pd.DataFrame(resultados, columns=[ 
    'Nombre Tienda', 'Nombre Producto', 'Cantidad Vendida'
])

# Se muestran los resultados
print(df_resultados)

# Cerramos la conexi√≥n
cursor.close()
conexion.close()

     Nombre Tienda  Nombre Producto Cantidad Vendida
0      Mega Tienda      Pan de Pita             1863
1      Mega Tienda     Carne de Res             1774
2      Mega Tienda              Uva             1756
3      Super Norte     Manzana Roja             1853
4      Super Norte           Pepino             1757
5      Super Norte    Yogur Natural             1748
6        Super Sur  Cereal Integral             1845
7        Super Sur        Caramelos             1794
8        Super Sur     Carne de Res             1794
9        Super Sur          Chicles             1761
10   Tienda Centro    Yogur Natural             1819
11   Tienda Centro          Naranja             1796
12   Tienda Centro  Pechuga de Pavo             1726
13  Tienda Express           Pepino             1892
14  Tienda Express  Cereal Integral             1858
15  Tienda Express  Jugo de Naranja             1849


**Opcional:** A√±adir alguna consulta con subconsultas o algo que no se abarque en las anteriores consultas.

# Consulta con Subconsultas: Productos M√°s Vendidos por Tienda

## Objetivo

El objetivo de esta consulta es obtener los **productos m√°s vendidos** de cada tienda, mostrando el nombre de la tienda, el nombre del producto y la cantidad total vendida de cada uno de estos productos. Para ello, se hace uso de **subconsultas**, las cuales nos permiten obtener una lista de productos que han sido vendidos m√°s de 100 veces, y luego realizar un desglose por tienda.

## Descripci√≥n

1. **Subconsulta Interna**:
   - La subconsulta selecciona los `id_producto` de los productos que han sido vendidos m√°s de 100 veces. Para ello, se utiliza la funci√≥n `SUM()` en la tabla `detalle_orden` y se agrupan los resultados por `id_producto`. La condici√≥n `HAVING SUM(cantidad) > 100` filtra aquellos productos cuya cantidad total vendida sea mayor a 100.

2. **Consulta Principal**:
   - La consulta principal hace uso de varias tablas para obtener la informaci√≥n solicitada:
     - **Tienda**: Se hace un `JOIN` entre la tabla `tiendas` y `empleados` para identificar qu√© tienda est√° asociada a cada empleado.
     - **Empleado ‚Üí Orden**: Se hace un `JOIN` con la tabla `ordenes` para obtener las √≥rdenes realizadas por cada empleado.
     - **Orden ‚Üí Detalle de la Orden**: Se hace otro `JOIN` con la tabla `detalle_orden` para obtener los productos de cada orden.
     - **Detalle de la Orden ‚Üí Producto**: Finalmente, se hace un `JOIN` con la tabla `productos` para obtener el nombre del producto vendido.

3. **Filtros**:
   - La cl√°usula `WHERE` utiliza la subconsulta para filtrar los productos que cumplen con la condici√≥n de haber sido vendidos m√°s de 100 veces.

4. **Agrupamiento**:
   - Los resultados se agrupan por `id_tienda` y `id_producto` para obtener la cantidad total vendida por cada producto en cada tienda.

5. **Ordenamiento**:
   - Los resultados son ordenados por `nombre_tienda` y `total_vendido` en orden descendente, de forma que los productos m√°s vendidos aparezcan primero.


In [47]:
import mysql.connector

# Establecemos conexi√≥n
conexion = mysql.connector.connect(
    host="localhost",
    user="root",
    password="admin",
    database="supermercado"
)

# Creamos el cursor
cursor = conexion.cursor()

# Consultamos el SQL para ventas totales por categor√≠a
query = """
SELECT t.nombre_tienda, p.nombre_producto, SUM(do.cantidad) AS total_vendido
FROM tiendas t
JOIN empleados e ON t.id_tienda = e.id_tienda
JOIN ordenes o ON e.id_empleado = o.id_empleado
JOIN detalle_orden do ON o.id_orden = do.id_orden
JOIN productos p ON do.id_producto = p.id_producto
WHERE do.id_producto IN (
    SELECT id_producto
    FROM detalle_orden
    GROUP BY id_producto
    HAVING SUM(cantidad) > 100 -- Solo productos vendidos m√°s de 100 veces
)
GROUP BY t.id_tienda, p.id_producto
ORDER BY t.nombre_tienda, total_vendido DESC;
"""

# Ejecutamos la consulta
cursor.execute(query)

# Obtenemos los resultados
resultados = cursor.fetchall()

# Convertimos los resultados a un DataFrame de pandas para mejor visualizaci√≥n
df_resultados = pd.DataFrame(resultados, columns=[ 
    'Nombre Tienda', 'Nombre Producto', 'Cantidad Vendida'
])

# Se muestran los resultados
print(df_resultados)

# Cerramos la conexi√≥n
cursor.close()
conexion.close()

      Nombre Tienda     Nombre Producto Cantidad Vendida
0       Mega Tienda         Pan de Pita             1863
1       Mega Tienda        Carne de Res             1774
2       Mega Tienda                 Uva             1756
3       Mega Tienda  Chocolate de Leche             1748
4       Mega Tienda    Refresco de Cola             1715
..              ...                 ...              ...
195  Tienda Express             Cerveza             1508
196  Tienda Express             Pl√°tano             1455
197  Tienda Express             Naranja             1415
198  Tienda Express        Pan Integral             1358
199  Tienda Express         Mantequilla             1230

[200 rows x 3 columns]


# Consulta: Categor√≠as M√°s Rentables por Tienda

Esta consulta tiene como objetivo encontrar las categor√≠as de productos que generan los mayores ingresos en cada tienda. Para hacerlo, usamos subconsultas y combinamos varias tablas relacionadas con productos, categor√≠as, √≥rdenes y empleados. Aqu√≠ te explico c√≥mo funciona paso a paso:

## Pasos que sigue la consulta:

1. **C√°lculo de ingresos por categor√≠a y tienda**  
   La consulta principal comienza calculando los ingresos totales por cada combinaci√≥n de tienda y categor√≠a.  
   - Los ingresos se calculan con la f√≥rmula: `(cantidad * precio_unitario) - descuento`.  
   - Este c√°lculo se agrupa por tienda (`id_tienda`) y categor√≠a (`id_categoria`).

2. **Identificar la categor√≠a m√°s rentable en cada tienda**  
   Usamos una subconsulta que compara los ingresos de cada categor√≠a con el ingreso m√°ximo dentro de esa misma tienda. As√≠, filtramos para quedarnos solo con la categor√≠a m√°s rentable por tienda.

3. **Unimos con las tablas de categor√≠as y tiendas**  
   Una vez identificadas las categor√≠as m√°s rentables, se realiza un `JOIN` con las tablas de categor√≠as y tiendas para obtener el nombre de la categor√≠a y el nombre de la tienda. Esto hace que los resultados sean m√°s legibles.

4. **Ordenar los resultados**  
   Finalmente, los resultados se ordenan por el nombre de la tienda y los ingresos de forma descendente, para que sea m√°s f√°cil identificar cu√°les son las categor√≠as m√°s rentables.

## ¬øQu√© devuelve la consulta?  
Por cada tienda, esta consulta muestra:  
- El nombre de la **categor√≠a** m√°s rentable.  
- El nombre de la **tienda** correspondiente.  
- Los **ingresos totales** generados por esa categor√≠a en esa tienda.

In [48]:
import mysql.connector

# Establecemos conexi√≥n
conexion = mysql.connector.connect(
    host="localhost",
    user="root",
    password="admin",
    database="supermercado"
)

# Creamos el cursor
cursor = conexion.cursor()

# Consultamos el SQL para ventas totales por categor√≠a
query = """
SELECT 
    c.nombre_categoria AS categoria,
    t.nombre_tienda AS tienda,
    ingresos_por_categoria.total_ingresos AS ingresos_totales
FROM 
    (
        SELECT 
            e.id_tienda,
            p.id_categoria,
            SUM(do.cantidad * do.precio_unitario - do.descuento) AS total_ingresos
        FROM detalle_orden do
        JOIN productos p ON do.id_producto = p.id_producto
        JOIN ordenes o ON do.id_orden = o.id_orden
        JOIN empleados e ON o.id_empleado = e.id_empleado
        GROUP BY e.id_tienda, p.id_categoria
    ) AS ingresos_por_categoria
JOIN categorias c ON ingresos_por_categoria.id_categoria = c.id_categoria
JOIN tiendas t ON ingresos_por_categoria.id_tienda = t.id_tienda
WHERE 
    ingresos_por_categoria.total_ingresos = (
        SELECT 
            MAX(sub_ingresos.total_ingresos)
        FROM (
            SELECT 
                e.id_tienda,
                p.id_categoria,
                SUM(do.cantidad * do.precio_unitario - do.descuento) AS total_ingresos
            FROM detalle_orden do
            JOIN productos p ON do.id_producto = p.id_producto
            JOIN ordenes o ON do.id_orden = o.id_orden
            JOIN empleados e ON o.id_empleado = e.id_empleado
            GROUP BY e.id_tienda, p.id_categoria
        ) AS sub_ingresos
        WHERE 
            sub_ingresos.id_tienda = ingresos_por_categoria.id_tienda
    )
ORDER BY tienda, ingresos_totales DESC;
"""

# Ejecutamos la consulta
cursor.execute(query)

# Obtenemos los resultados
resultados = cursor.fetchall()

# Convertimos los resultados a un DataFrame de pandas para mejor visualizaci√≥n
df_resultados = pd.DataFrame(resultados, columns=[ 
    'Categoria', 'Tienda', 'Ingresos totales'
])

# Se muestran los resultados
print(df_resultados)

# Cerramos la conexi√≥n
cursor.close()
conexion.close()

  Categoria          Tienda Ingresos totales
0    Frutas     Mega Tienda        199911.27
1   Bebidas     Super Norte        188777.06
2   Bebidas       Super Sur        187394.16
3    Frutas   Tienda Centro        188414.06
4   Bebidas  Tienda Express        204349.08
