In [None]:
# 💡 RESPUESTAS CUESTIONARIO RÁPIDO - NIVEL BÁSICO

print("=" * 60)
print("💡 RESPUESTAS CORRECTAS - CUESTIONARIO BÁSICO")
print("=" * 60)

print("\n❓ PREGUNTA 1: Diferencia entre LIKE '%texto%' y LIKE 'texto%'")
print("✅ RESPUESTA:")
print("   • '%texto%' busca 'texto' en CUALQUIER parte de la cadena")
print("   • 'texto%' busca cadenas que EMPIECEN con 'texto'")
print("   • Ejemplo: '%gmail%' encuentra 'usuario@gmail.com'")
print("   • Ejemplo: 'Ana%' encuentra 'Ana López' pero no 'María Ana'")

print("\n❓ PREGUNTA 2: ¿Por qué usar alias de tabla (e, d)?")
print("✅ RESPUESTA:")
print("   • LEGIBILIDAD: Hace el código más fácil de leer")
print("   • EFICIENCIA: Menos escritura en consultas largas")
print("   • CLARIDAD: Especifica de qué tabla viene cada columna")
print("   • OBLIGATORIO: Cuando hay columnas con el mismo nombre")

print("\n❓ PREGUNTA 3: ¿Cuándo usar BETWEEN vs IN?")
print("✅ RESPUESTA:")
print("   • BETWEEN: Para RANGOS continuos (fechas, números)")
print("   • IN: Para VALORES ESPECÍFICOS no relacionados")
print("   • Ejemplo BETWEEN: salario BETWEEN 50000 AND 80000")
print("   • Ejemplo IN: departamento IN ('Ingeniería', 'Calidad')")

print("\n❓ PREGUNTA 4: Diferencia entre AND y OR")
print("✅ RESPUESTA:")
print("   • AND: TODAS las condiciones deben ser verdaderas")
print("   • OR: AL MENOS UNA condición debe ser verdadera")
print("   • AND es más restrictivo (menos resultados)")
print("   • OR es más permisivo (más resultados)")

print("\n" + "="*60)
print("🎯 ¡CONTINÚA AL NIVEL INTERMEDIO CUANDO DOMINES ESTOS CONCEPTOS!")
print("="*60)

# 🗄️ MÓDULO 3.1: BASES DE DATOS CON SQL
## 📊 Maestría en Python - Fase 3: Gestión de Datos

---

### 🎯 OBJETIVOS DE APRENDIZAJE

Al completar este módulo serás capaz de:
- ✅ Entender los conceptos fundamentales de bases de datos relacionales
- ✅ Escribir consultas SQL eficientes y optimizadas
- ✅ Diseñar esquemas de bases de datos normalizados
- ✅ Implementar restricciones y validaciones de datos
- ✅ Manejar transacciones y garantizar integridad de datos
- ✅ Optimizar consultas usando índices apropiados

### 📋 TEMARIO DETALLADO

1. **Fundamentos de Bases de Datos** (Conceptos, tipos, terminología)
2. **SQL Básico** (DDL, DML, DQL)
3. **Tipos de Datos y Restricciones** (Integridad referencial)
4. **Consultas Avanzadas** (JOINs, subconsultas, agregaciones)
5. **Índices y Optimización** (Rendimiento, EXPLAIN)
6. **Transacciones** (ACID, concurrencia)
7. **SQLite Específico** (Características únicas)
8. **Mejores Prácticas** (Diseño, seguridad, patrones)

---

## 📚 1. FUNDAMENTOS DE BASES DE DATOS

### 🤔 ¿Qué es una Base de Datos?

Una **base de datos** es un sistema organizado para almacenar, gestionar y recuperar información de manera eficiente. Piensa en ella como una biblioteca digital super organizada donde cada libro (dato) tiene su lugar específico y puedes encontrarlo rápidamente.

### 🏗️ Estructura Jerárquica

```
📊 BASE DE DATOS
├── 📋 TABLA 1 (ej: usuarios)
│   ├── 📄 FILA 1 (Juan Pérez, 25 años, Madrid)
│   ├── 📄 FILA 2 (María García, 30 años, Barcelona)
│   └── 📄 FILA N...
├── 📋 TABLA 2 (ej: productos)
└── 📋 TABLA N...
```

### 🔑 Terminología Esencial

- **Tabla**: Colección de datos relacionados (como una hoja de Excel)
- **Fila/Registro**: Una entrada individual de datos
- **Columna/Campo**: Un atributo específico (nombre, edad, etc.)
- **Clave Primaria**: Identificador único de cada fila
- **Clave Foránea**: Referencia que conecta con otra tabla

In [None]:
# Configuración inicial para trabajar con SQLite
import sqlite3
import pandas as pd
from datetime import datetime, date
import os

# Crear conexión a una base de datos SQLite
# Si el archivo no existe, se crea automáticamente
conn = sqlite3.connect('ejemplo_aprendizaje.db')
cursor = conn.cursor()

print("✅ Conexión a SQLite establecida exitosamente")
print(f"📁 Base de datos creada en: {os.path.abspath('ejemplo_aprendizaje.db')}")

## 🛠️ 2. SQL BÁSICO - DDL (Data Definition Language)

DDL son los comandos para **definir la estructura** de la base de datos.

### 🏗️ CREATE TABLE - Crear Tablas

In [None]:
# Crear nuestra primera tabla: empleados
cursor.execute('''
CREATE TABLE IF NOT EXISTS empleados (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    nombre TEXT NOT NULL,
    apellido TEXT NOT NULL,
    edad INTEGER CHECK (edad >= 18 AND edad <= 100),
    salario REAL CHECK (salario > 0),
    departamento TEXT NOT NULL,
    fecha_ingreso DATE NOT NULL,
    activo BOOLEAN DEFAULT 1
);
''')

# Crear tabla de departamentos con relación
cursor.execute('''
CREATE TABLE IF NOT EXISTS departamentos (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    nombre TEXT NOT NULL UNIQUE,
    presupuesto REAL CHECK (presupuesto > 0),
    jefe_id INTEGER,
    FOREIGN KEY (jefe_id) REFERENCES empleados(id)
);
''')

conn.commit()
print("✅ Tablas 'empleados' y 'departamentos' creadas exitosamente")

# Verificar que las tablas se crearon
cursor.execute("SELECT name FROM sqlite_master WHERE type='table';")
tablas = cursor.fetchall()
print(f"📋 Tablas en la base de datos: {[tabla[0] for tabla in tablas]}")

### 📋 Tipos de Datos en SQLite

| Tipo SQL | Descripción | Ejemplo |
|----------|-------------|----------|
| `INTEGER` | Números enteros | 42, -100, 0 |
| `REAL` | Números decimales | 3.14, 99.99 |
| `TEXT` | Cadenas de texto | 'Hola', 'Juan Pérez' |
| `BLOB` | Datos binarios | Imágenes, archivos |
| `NULL` | Valor vacío | NULL |

### 🔒 Restricciones (Constraints)

- `PRIMARY KEY`: Identificador único
- `NOT NULL`: Campo obligatorio
- `UNIQUE`: Sin duplicados
- `CHECK`: Validación personalizada
- `DEFAULT`: Valor por defecto
- `FOREIGN KEY`: Referencia a otra tabla

## 📥 3. DML (Data Manipulation Language) - Manipular Datos

### 📝 INSERT - Insertar Datos

In [None]:
# Insertar empleados de ejemplo
empleados_datos = [
    ('Juan', 'Pérez', 30, 50000, 'IT', '2023-01-15'),
    ('María', 'García', 25, 45000, 'Marketing', '2023-02-20'),
    ('Carlos', 'López', 35, 60000, 'IT', '2022-11-10'),
    ('Ana', 'Rodríguez', 28, 52000, 'Ventas', '2023-03-05'),
    ('Pedro', 'Martín', 32, 48000, 'Ventas', '2023-01-22'),
    ('Laura', 'Sánchez', 27, 55000, 'IT', '2022-12-18'),
    ('Diego', 'Fernández', 29, 47000, 'Marketing', '2023-02-28'),
    ('Carmen', 'Torres', 31, 53000, 'IT', '2022-10-15')
]

# Insertar múltiples registros
cursor.executemany('''
INSERT INTO empleados (nombre, apellido, edad, salario, departamento, fecha_ingreso)
VALUES (?, ?, ?, ?, ?, ?)
''', empleados_datos)

# Insertar departamentos
departamentos_datos = [
    ('IT', 300000),
    ('Marketing', 150000),
    ('Ventas', 200000),
    ('Recursos Humanos', 100000)
]

cursor.executemany('''
INSERT INTO departamentos (nombre, presupuesto)
VALUES (?, ?)
''', departamentos_datos)

conn.commit()
print(f"✅ Insertados {len(empleados_datos)} empleados y {len(departamentos_datos)} departamentos")

# Verificar la inserción
cursor.execute("SELECT COUNT(*) FROM empleados")
total_empleados = cursor.fetchone()[0]
print(f"📊 Total de empleados en la base de datos: {total_empleados}")

### 🔍 SELECT - Consultar Datos

SELECT es el comando más importante y versátil de SQL.

In [None]:
# Consulta básica: todos los empleados
print("📋 TODOS LOS EMPLEADOS:")
cursor.execute("SELECT * FROM empleados")
empleados = cursor.fetchall()

# Mostrar de forma organizada
for empleado in empleados[:3]:  # Solo los primeros 3 para no saturar
    print(f"ID: {empleado[0]}, Nombre: {empleado[1]} {empleado[2]}, Edad: {empleado[3]}, Salario: ${empleado[4]:,.2f}")

print(f"\n... y {len(empleados)-3} empleados más")

In [None]:
# Consultas con filtros específicos
print("🔍 EMPLEADOS DEL DEPARTAMENTO IT:")
cursor.execute("""
SELECT nombre, apellido, salario 
FROM empleados 
WHERE departamento = 'IT'
ORDER BY salario DESC
""")

empleados_it = cursor.fetchall()
for emp in empleados_it:
    print(f"• {emp[0]} {emp[1]}: ${emp[2]:,.2f}")

print(f"\n📊 Total de empleados en IT: {len(empleados_it)}")

In [None]:
# Consultas con rangos y condiciones múltiples
print("💰 EMPLEADOS CON SALARIO ENTRE $45,000 Y $55,000:")
cursor.execute("""
SELECT nombre, apellido, salario, departamento
FROM empleados 
WHERE salario BETWEEN 45000 AND 55000
ORDER BY salario DESC
""")

empleados_rango = cursor.fetchall()
for emp in empleados_rango:
    print(f"• {emp[0]} {emp[1]} ({emp[3]}): ${emp[2]:,.2f}")

# Búsqueda con LIKE (patrones)
print("\n🔎 EMPLEADOS CUYO NOMBRE EMPIEZA CON 'M':")
cursor.execute("""
SELECT nombre, apellido, departamento
FROM empleados 
WHERE nombre LIKE 'M%'
""")

empleados_m = cursor.fetchall()
for emp in empleados_m:
    print(f"• {emp[0]} {emp[1]} - {emp[2]}")

### 🔧 UPDATE - Actualizar Datos

In [None]:
# Actualizar salario de un empleado específico
print("💡 ACTUALIZANDO SALARIO DE JUAN PÉREZ...")

# Mostrar salario actual
cursor.execute("SELECT nombre, apellido, salario FROM empleados WHERE nombre = 'Juan' AND apellido = 'Pérez'")
juan_antes = cursor.fetchone()
print(f"Salario actual de {juan_antes[0]} {juan_antes[1]}: ${juan_antes[2]:,.2f}")

# Actualizar salario (aumento del 10%)
cursor.execute("""
UPDATE empleados 
SET salario = salario * 1.10
WHERE nombre = 'Juan' AND apellido = 'Pérez'
""")

# Verificar la actualización
cursor.execute("SELECT nombre, apellido, salario FROM empleados WHERE nombre = 'Juan' AND apellido = 'Pérez'")
juan_despues = cursor.fetchone()
print(f"Nuevo salario de {juan_despues[0]} {juan_despues[1]}: ${juan_despues[2]:,.2f}")

aumento = juan_despues[2] - juan_antes[2]
print(f"🎉 Aumento aplicado: ${aumento:,.2f}")

conn.commit()

In [None]:
# Actualización masiva: aumento para todo el departamento IT
print("🚀 AUMENTO MASIVO PARA EL DEPARTAMENTO IT (5%):")

# Mostrar salarios antes
cursor.execute("SELECT nombre, apellido, salario FROM empleados WHERE departamento = 'IT' ORDER BY salario")
it_antes = cursor.fetchall()
print("\nSalarios antes del aumento:")
for emp in it_antes:
    print(f"• {emp[0]} {emp[1]}: ${emp[2]:,.2f}")

# Aplicar aumento del 5%
cursor.execute("""
UPDATE empleados 
SET salario = salario * 1.05
WHERE departamento = 'IT'
""")

# Mostrar salarios después
cursor.execute("SELECT nombre, apellido, salario FROM empleados WHERE departamento = 'IT' ORDER BY salario")
it_despues = cursor.fetchall()
print("\nSalarios después del aumento:")
for emp in it_despues:
    print(f"• {emp[0]} {emp[1]}: ${emp[2]:,.2f}")

# Calcular impacto total
total_antes = sum(emp[2] for emp in it_antes)
total_despues = sum(emp[2] for emp in it_despues)
impacto_total = total_despues - total_antes

print(f"\n💰 Impacto total del aumento: ${impacto_total:,.2f}")
print(f"👥 Empleados beneficiados: {len(it_despues)}")

conn.commit()

## 📊 4. FUNCIONES DE AGREGACIÓN

Las funciones de agregación nos permiten realizar cálculos sobre conjuntos de datos.

In [None]:
# Estadísticas generales de empleados
print("📈 ESTADÍSTICAS GENERALES DE EMPLEADOS:")
print("=" * 50)

# Múltiples agregaciones en una consulta
cursor.execute("""
SELECT 
    COUNT(*) as total_empleados,
    AVG(salario) as salario_promedio,
    MIN(salario) as salario_minimo,
    MAX(salario) as salario_maximo,
    SUM(salario) as nomina_total,
    AVG(edad) as edad_promedio
FROM empleados
""")

stats = cursor.fetchone()
print(f"👥 Total de empleados: {stats[0]}")
print(f"💰 Salario promedio: ${stats[1]:,.2f}")
print(f"📉 Salario mínimo: ${stats[2]:,.2f}")
print(f"📈 Salario máximo: ${stats[3]:,.2f}")
print(f"💸 Nómina total: ${stats[4]:,.2f}")
print(f"🎂 Edad promedio: {stats[5]:.1f} años")

In [None]:
# GROUP BY: Estadísticas por departamento
print("\n🏢 ESTADÍSTICAS POR DEPARTAMENTO:")
print("=" * 60)

cursor.execute("""
SELECT 
    departamento,
    COUNT(*) as num_empleados,
    AVG(salario) as salario_promedio,
    MIN(salario) as salario_min,
    MAX(salario) as salario_max,
    SUM(salario) as costo_total
FROM empleados 
GROUP BY departamento
ORDER BY salario_promedio DESC
""")

stats_depto = cursor.fetchall()
for stat in stats_depto:
    print(f"\n🏷️  {stat[0]}:")
    print(f"   👥 Empleados: {stat[1]}")
    print(f"   💰 Promedio: ${stat[2]:,.2f}")
    print(f"   📊 Rango: ${stat[3]:,.2f} - ${stat[4]:,.2f}")
    print(f"   💸 Costo total: ${stat[5]:,.2f}")

In [None]:
# HAVING: Filtrar después de GROUP BY
print("\n🎯 DEPARTAMENTOS CON SALARIO PROMEDIO > $50,000:")
print("=" * 55)

cursor.execute("""
SELECT 
    departamento,
    COUNT(*) as empleados,
    AVG(salario) as salario_promedio
FROM empleados 
GROUP BY departamento
HAVING AVG(salario) > 50000
ORDER BY salario_promedio DESC
""")

deptos_alto_salario = cursor.fetchall()
for depto in deptos_alto_salario:
    print(f"• {depto[0]}: {depto[1]} empleados, promedio ${depto[2]:,.2f}")

if not deptos_alto_salario:
    print("No hay departamentos con salario promedio mayor a $50,000")

## 🔗 5. SUBCONSULTAS (SUBQUERIES)

Las subconsultas son consultas dentro de otras consultas, muy útiles para análisis complejos.

In [None]:
# Empleados que ganan más que el promedio general
print("⭐ EMPLEADOS QUE GANAN MÁS QUE EL PROMEDIO GENERAL:")
print("=" * 60)

# Primero vemos el promedio general
cursor.execute("SELECT AVG(salario) FROM empleados")
promedio_general = cursor.fetchone()[0]
print(f"💰 Salario promedio general: ${promedio_general:,.2f}")
print()

# Ahora la subconsulta
cursor.execute("""
SELECT nombre, apellido, salario, departamento,
       (salario - (SELECT AVG(salario) FROM empleados)) as diferencia
FROM empleados 
WHERE salario > (SELECT AVG(salario) FROM empleados)
ORDER BY salario DESC
""")

empleados_sobre_promedio = cursor.fetchall()
for emp in empleados_sobre_promedio:
    print(f"• {emp[0]} {emp[1]} ({emp[3]}): ${emp[2]:,.2f} (+${emp[4]:,.2f})")

print(f"\n🎯 Total de empleados sobre el promedio: {len(empleados_sobre_promedio)} de {stats[0]}")

In [None]:
# Empleados que ganan más que el promedio de SU departamento
print("🏆 EMPLEADOS QUE GANAN MÁS QUE EL PROMEDIO DE SU DEPARTAMENTO:")
print("=" * 70)

cursor.execute("""
SELECT e1.nombre, e1.apellido, e1.salario, e1.departamento,
       (SELECT AVG(salario) FROM empleados e2 WHERE e2.departamento = e1.departamento) as promedio_depto,
       (e1.salario - (SELECT AVG(salario) FROM empleados e2 WHERE e2.departamento = e1.departamento)) as diferencia
FROM empleados e1
WHERE e1.salario > (SELECT AVG(salario) FROM empleados e2 WHERE e2.departamento = e1.departamento)
ORDER BY e1.departamento, e1.salario DESC
""")

empleados_sobre_depto = cursor.fetchall()
depto_actual = ""
for emp in empleados_sobre_depto:
    if emp[3] != depto_actual:
        depto_actual = emp[3]
        print(f"\n🏷️  {depto_actual} (promedio: ${emp[4]:,.2f}):")
    print(f"   • {emp[0]} {emp[1]}: ${emp[2]:,.2f} (+${emp[5]:,.2f})")

## 📅 6. TRABAJANDO CON FECHAS

SQLite tiene funciones específicas para manejar fechas y tiempo.

In [None]:
# Análisis de antigüedad de empleados
print("📅 ANÁLISIS DE ANTIGÜEDAD DE EMPLEADOS:")
print("=" * 45)

cursor.execute("""
SELECT nombre, apellido, fecha_ingreso,
       CAST((julianday('now') - julianday(fecha_ingreso)) AS INTEGER) as dias_trabajados,
       ROUND((julianday('now') - julianday(fecha_ingreso)) / 30, 1) as meses_trabajados,
       departamento
FROM empleados 
ORDER BY fecha_ingreso
""")

antiguedad = cursor.fetchall()
for emp in antiguedad:
    print(f"• {emp[0]} {emp[1]} ({emp[5]}):")
    print(f"  📅 Ingreso: {emp[2]}")
    print(f"  ⏰ Antigüedad: {emp[3]} días ({emp[4]} meses)")
    print()

In [None]:
# Empleados por año de ingreso
print("📊 EMPLEADOS POR AÑO DE INGRESO:")
print("=" * 35)

cursor.execute("""
SELECT 
    strftime('%Y', fecha_ingreso) as año,
    COUNT(*) as empleados_ingresados,
    GROUP_CONCAT(nombre || ' ' || apellido) as nombres
FROM empleados 
GROUP BY strftime('%Y', fecha_ingreso)
ORDER BY año
""")

por_año = cursor.fetchall()
for año_data in por_año:
    print(f"\n📅 Año {año_data[0]}: {año_data[1]} empleados")
    nombres = año_data[2].split(',')
    for nombre in nombres:
        print(f"   • {nombre.strip()}")

## 📈 7. ÍNDICES Y OPTIMIZACIÓN

Los índices mejoran significativamente el rendimiento de las consultas.

In [None]:
# Crear índices para mejorar rendimiento
print("🚀 CREANDO ÍNDICES PARA OPTIMIZACIÓN:")
print("=" * 40)

# Índice en departamento (consulta frecuente)
cursor.execute("CREATE INDEX IF NOT EXISTS idx_empleados_departamento ON empleados(departamento)")
print("✅ Índice creado en 'departamento'")

# Índice en salario (para consultas de rangos)
cursor.execute("CREATE INDEX IF NOT EXISTS idx_empleados_salario ON empleados(salario)")
print("✅ Índice creado en 'salario'")

# Índice compuesto en apellido y nombre (búsquedas de empleados)
cursor.execute("CREATE INDEX IF NOT EXISTS idx_empleados_nombre_completo ON empleados(apellido, nombre)")
print("✅ Índice compuesto creado en 'apellido, nombre'")

conn.commit()

# Verificar índices creados
cursor.execute("SELECT name FROM sqlite_master WHERE type='index' AND tbl_name='empleados'")
indices = cursor.fetchall()
print(f"\n📋 Índices en tabla 'empleados': {[idx[0] for idx in indices]}")

In [None]:
# Analizar plan de ejecución de consultas
print("\n🔍 ANÁLISIS DE PLAN DE EJECUCIÓN:")
print("=" * 40)

# Consulta que debería usar el índice de departamento
cursor.execute("EXPLAIN QUERY PLAN SELECT * FROM empleados WHERE departamento = 'IT'")
plan = cursor.fetchall()

print("Plan para: SELECT * FROM empleados WHERE departamento = 'IT'")
for step in plan:
    print(f"• {step[3]}")

# Consulta que debería usar el índice de salario
print("\nPlan para: SELECT * FROM empleados WHERE salario > 50000")
cursor.execute("EXPLAIN QUERY PLAN SELECT * FROM empleados WHERE salario > 50000")
plan2 = cursor.fetchall()

for step in plan2:
    print(f"• {step[3]}")

## 🔄 8. TRANSACCIONES

Las transacciones garantizan que un conjunto de operaciones se ejecute completamente o no se ejecute en absoluto.

In [None]:
# Ejemplo de transacción: transferencia de presupuesto entre departamentos
print("💸 SIMULANDO TRANSFERENCIA DE PRESUPUESTO:")
print("=" * 45)

# Mostrar presupuestos actuales
cursor.execute("SELECT nombre, presupuesto FROM departamentos WHERE nombre IN ('IT', 'Marketing')")
presupuestos_antes = cursor.fetchall()
print("Presupuestos antes de la transferencia:")
for depto in presupuestos_antes:
    print(f"• {depto[0]}: ${depto[1]:,.2f}")

# Simular transferencia de $50,000 de Marketing a IT
cantidad_transferencia = 50000

try:
    # Iniciar transacción explícita
    cursor.execute("BEGIN TRANSACTION")
    
    # Restar del presupuesto de Marketing
    cursor.execute("""
    UPDATE departamentos 
    SET presupuesto = presupuesto - ?
    WHERE nombre = 'Marketing'
    """, (cantidad_transferencia,))
    
    # Verificar que Marketing tenga suficiente presupuesto
    cursor.execute("SELECT presupuesto FROM departamentos WHERE nombre = 'Marketing'")
    nuevo_presupuesto_marketing = cursor.fetchone()[0]
    
    if nuevo_presupuesto_marketing < 0:
        raise Exception("Presupuesto insuficiente en Marketing")
    
    # Sumar al presupuesto de IT
    cursor.execute("""
    UPDATE departamentos 
    SET presupuesto = presupuesto + ?
    WHERE nombre = 'IT'
    """, (cantidad_transferencia,))
    
    # Si todo salió bien, confirmar la transacción
    cursor.execute("COMMIT")
    print(f"\n✅ Transferencia exitosa de ${cantidad_transferencia:,.2f}")
    
except Exception as e:
    # Si algo falló, deshacer todos los cambios
    cursor.execute("ROLLBACK")
    print(f"\n❌ Error en la transacción: {e}")
    print("🔄 Todos los cambios fueron revertidos")

# Mostrar presupuestos después
cursor.execute("SELECT nombre, presupuesto FROM departamentos WHERE nombre IN ('IT', 'Marketing')")
presupuestos_despues = cursor.fetchall()
print("\nPresupuestos después de la transferencia:")
for depto in presupuestos_despues:
    print(f"• {depto[0]}: ${depto[1]:,.2f}")

## 🧹 9. LIMPIEZA Y MANTENIMIENTO

In [None]:
# Información sobre la base de datos
print("📊 INFORMACIÓN DE LA BASE DE DATOS:")
print("=" * 35)

# Tamaño de las tablas
cursor.execute("""
SELECT name, 
       COUNT(*) as registros
FROM sqlite_master 
WHERE type='table' AND name NOT LIKE 'sqlite_%'
GROUP BY name
""")

# Para cada tabla, mostrar número de registros
tablas_info = cursor.fetchall()
for tabla in tablas_info:
    cursor.execute(f"SELECT COUNT(*) FROM {tabla[0]}")
    count = cursor.fetchone()[0]
    print(f"📋 Tabla '{tabla[0]}': {count} registros")

# Información del archivo de base de datos
import os
db_size = os.path.getsize('ejemplo_aprendizaje.db')
print(f"\n💾 Tamaño del archivo: {db_size:,} bytes ({db_size/1024:.2f} KB)")

# Optimizar la base de datos
cursor.execute("VACUUM")
print("🧹 Base de datos optimizada con VACUUM")

In [None]:
# Cerrar la conexión de forma adecuada
conn.close()
print("\n🔒 Conexión a la base de datos cerrada correctamente")
print("\n" + "=" * 50)
print("🎯 MÓDULO 3.1 COMPLETADO")
print("=" * 50)
print("\nHas aprendido:")
print("✅ Conceptos fundamentales de bases de datos")
print("✅ Sintaxis SQL básica (DDL, DML, DQL)")
print("✅ Consultas con filtros y agregaciones")
print("✅ Subconsultas para análisis complejos")
print("✅ Manejo de fechas en SQLite")
print("✅ Optimización con índices")
print("✅ Transacciones y integridad de datos")
print("✅ Mejores prácticas de mantenimiento")
print("\n🚀 ¡Listo para la práctica intensiva!")

## 🎯 EJERCICIOS PRÁCTICOS PROGRESIVOS

### 📚 Instrucciones Generales

Estos ejercicios están diseñados para **consolidar** tu aprendizaje de SQL de forma progresiva. Cada nivel aumenta en complejidad y te prepara para el siguiente.

**🔥 METODOLOGÍA:**
1. **Lee** el enunciado completo
2. **Piensa** en la estrategia antes de escribir código
3. **Implementa** tu solución
4. **Compara** con la solución proporcionada
5. **Reflexiona** sobre las diferencias y aprende

**💡 NIVELES:**
- 🟢 **Básico**: Consultas simples y operaciones fundamentales
- 🟡 **Intermedio**: Agregaciones, JOINs y subconsultas
- 🔴 **Avanzado**: Optimización, transacciones y casos complejos
- 🏆 **Proyecto**: Integración de todos los conceptos

---

### 🟢 NIVEL BÁSICO: Fundamentos SQL

**Objetivo:** Dominar consultas SELECT básicas, filtros y ordenamiento

**Contexto:** Trabajaremos con una base de datos de **empleados de una empresa industrial**

In [1]:
# 🏗️ CONFIGURACIÓN INICIAL - Base de Datos de Empleados Industriales
import sqlite3
import pandas as pd
from datetime import datetime, date

# Crear conexión a la base de datos de ejercicios
conn_ejercicios = sqlite3.connect(':memory:')  # BD en memoria para ejercicios
cursor = conn_ejercicios.cursor()

# Crear tablas del sistema de empleados industriales
cursor.executescript('''
    -- Tabla de departamentos
    CREATE TABLE departamentos (
        id_departamento INTEGER PRIMARY KEY,
        nombre VARCHAR(50) NOT NULL,
        ubicacion VARCHAR(50),
        presupuesto DECIMAL(12,2)
    );
    
    -- Tabla de empleados
    CREATE TABLE empleados (
        id_empleado INTEGER PRIMARY KEY,
        nombre VARCHAR(50) NOT NULL,
        apellido VARCHAR(50) NOT NULL,
        email VARCHAR(100) UNIQUE,
        telefono VARCHAR(15),
        fecha_contratacion DATE,
        salario DECIMAL(10,2),
        id_departamento INTEGER,
        cargo VARCHAR(50),
        años_experiencia INTEGER,
        FOREIGN KEY (id_departamento) REFERENCES departamentos(id_departamento)
    );
    
    -- Tabla de proyectos
    CREATE TABLE proyectos (
        id_proyecto INTEGER PRIMARY KEY,
        nombre_proyecto VARCHAR(100) NOT NULL,
        descripcion TEXT,
        fecha_inicio DATE,
        fecha_fin DATE,
        presupuesto DECIMAL(15,2),
        estado VARCHAR(20),
        id_departamento INTEGER,
        FOREIGN KEY (id_departamento) REFERENCES departamentos(id_departamento)
    );
''')

print("✅ Tablas creadas exitosamente!")
conn_ejercicios.commit()

ModuleNotFoundError: No module named 'pandas'

In [None]:
# 📊 INSERTAR DATOS DE EJEMPLO
# Insertar departamentos
departamentos_data = [
    (1, 'Ingeniería', 'Planta Principal', 250000.00),
    (2, 'Producción', 'Planta Principal', 180000.00),
    (3, 'Mantenimiento', 'Planta Principal', 120000.00),
    (4, 'Calidad', 'Laboratorio', 95000.00),
    (5, 'Recursos Humanos', 'Oficinas Administrativas', 80000.00),
    (6, 'Automatización', 'Centro Tecnológico', 300000.00)
]

cursor.executemany('''
    INSERT INTO departamentos (id_departamento, nombre, ubicacion, presupuesto)
    VALUES (?, ?, ?, ?)
''', departamentos_data)

# Insertar empleados
empleados_data = [
    (1, 'Juan', 'Pérez', 'juan.perez@empresa.com', '555-0101', '2020-03-15', 75000.00, 1, 'Ingeniero Senior', 8),
    (2, 'María', 'González', 'maria.gonzalez@empresa.com', '555-0102', '2019-07-22', 68000.00, 1, 'Ingeniera de Procesos', 6),
    (3, 'Carlos', 'Rodríguez', 'carlos.rodriguez@empresa.com', '555-0103', '2021-01-10', 45000.00, 2, 'Operador de Máquina', 3),
    (4, 'Ana', 'López', 'ana.lopez@empresa.com', '555-0104', '2018-11-05', 52000.00, 3, 'Técnico de Mantenimiento', 12),
    (5, 'Luis', 'Martínez', 'luis.martinez@empresa.com', '555-0105', '2022-02-28', 38000.00, 2, 'Operador Junior', 1),
    (6, 'Elena', 'Hernández', 'elena.hernandez@empresa.com', '555-0106', '2017-09-12', 82000.00, 4, 'Jefe de Calidad', 15),
    (7, 'Roberto', 'García', 'roberto.garcia@empresa.com', '555-0107', '2020-06-18', 65000.00, 5, 'Especialista en RRHH', 7),
    (8, 'Sandra', 'Ruiz', 'sandra.ruiz@empresa.com', '555-0108', '2019-04-03', 95000.00, 6, 'Ingeniera en Automatización', 10),
    (9, 'Diego', 'Morales', 'diego.morales@empresa.com', '555-0109', '2021-08-14', 72000.00, 6, 'Programador PLC', 5),
    (10, 'Paola', 'Castro', 'paola.castro@empresa.com', '555-0110', '2023-01-20', 42000.00, 4, 'Analista de Calidad', 2)
]

cursor.executemany('''
    INSERT INTO empleados (id_empleado, nombre, apellido, email, telefono, fecha_contratacion, 
                          salario, id_departamento, cargo, años_experiencia)
    VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?)
''', empleados_data)

# Insertar proyectos
proyectos_data = [
    (1, 'Automatización Línea A', 'Implementación de sistema automatizado en línea de producción A', 
     '2023-01-15', '2023-12-31', 450000.00, 'En Progreso', 6),
    (2, 'Mejora Continua Calidad', 'Implementación de nuevos procesos de control de calidad', 
     '2023-03-01', '2023-09-30', 125000.00, 'Completado', 4),
    (3, 'Mantenimiento Predictivo', 'Sistema de mantenimiento predictivo con IoT', 
     '2023-06-01', '2024-02-28', 280000.00, 'En Progreso', 3),
    (4, 'Capacitación Personal', 'Programa integral de capacitación técnica', 
     '2023-04-01', '2023-11-30', 65000.00, 'En Progreso', 5),
    (5, 'Optimización Energética', 'Reducción del consumo energético en planta', 
     '2023-02-01', '2023-08-31', 195000.00, 'Completado', 1)
]

cursor.executemany('''
    INSERT INTO proyectos (id_proyecto, nombre_proyecto, descripcion, fecha_inicio, 
                          fecha_fin, presupuesto, estado, id_departamento)
    VALUES (?, ?, ?, ?, ?, ?, ?, ?)
''', proyectos_data)

conn_ejercicios.commit()
print("✅ Datos insertados exitosamente!")

# Verificar que los datos se insertaron correctamente
cursor.execute("SELECT COUNT(*) FROM empleados")
num_empleados = cursor.fetchone()[0]
cursor.execute("SELECT COUNT(*) FROM departamentos")
num_departamentos = cursor.fetchone()[0]
cursor.execute("SELECT COUNT(*) FROM proyectos")
num_proyectos = cursor.fetchone()[0]

print(f"📊 Base de datos lista:")
print(f"   👥 Empleados: {num_empleados}")
print(f"   🏢 Departamentos: {num_departamentos}")
print(f"   📋 Proyectos: {num_proyectos}")

#### 🎯 EJERCICIO 1: Consultas SELECT Básicas

**📝 ENUNCIADO:**
Necesitas familiarizarte con la estructura de datos. Realiza las siguientes consultas:

1. **Mostrar todos los empleados** con sus nombres completos y salarios
2. **Listar departamentos** ordenados por presupuesto (mayor a menor)
3. **Encontrar empleados** que ganen más de $60,000

**💡 TIP:** Recuerda usar `SELECT`, `FROM`, `WHERE`, y `ORDER BY`

**🎯 TU TURNO:** Escribe las consultas en las celdas siguientes...

In [None]:
# 🚀 TU PRÁCTICA - EJERCICIO 1
# Escribe aquí tus consultas SQL para el ejercicio 1

# Consulta 1: Mostrar todos los empleados con nombres completos y salarios
# TU CÓDIGO AQUÍ:


# Consulta 2: Listar departamentos ordenados por presupuesto (mayor a menor)
# TU CÓDIGO AQUÍ:


# Consulta 3: Encontrar empleados que ganen más de $60,000
# TU CÓDIGO AQUÍ:

In [None]:
# ✅ SOLUCIÓN - EJERCICIO 1

print("=" * 60)
print("📋 SOLUCIÓN EJERCICIO 1: Consultas SELECT Básicas")
print("=" * 60)

# Consulta 1: Mostrar todos los empleados con nombres completos y salarios
print("\n1️⃣ EMPLEADOS CON NOMBRES COMPLETOS Y SALARIOS")
print("-" * 50)
query1 = '''
    SELECT 
        nombre || ' ' || apellido AS nombre_completo,
        salario,
        cargo
    FROM empleados
    ORDER BY nombre, apellido
'''
result1 = cursor.execute(query1).fetchall()
for row in result1:
    print(f"👤 {row[0]:<25} | 💰 ${row[1]:,.2f} | 💼 {row[2]}")

# Consulta 2: Listar departamentos ordenados por presupuesto (mayor a menor)
print("\n2️⃣ DEPARTAMENTOS POR PRESUPUESTO (MAYOR A MENOR)")
print("-" * 50)
query2 = '''
    SELECT 
        nombre,
        ubicacion,
        presupuesto
    FROM departamentos
    ORDER BY presupuesto DESC
'''
result2 = cursor.execute(query2).fetchall()
for row in result2:
    print(f"🏢 {row[0]:<20} | 📍 {row[1]:<25} | 💰 ${row[2]:,.2f}")

# Consulta 3: Encontrar empleados que ganen más de $60,000
print("\n3️⃣ EMPLEADOS CON SALARIO > $60,000")
print("-" * 50)
query3 = '''
    SELECT 
        nombre || ' ' || apellido AS nombre_completo,
        cargo,
        salario,
        años_experiencia
    FROM empleados
    WHERE salario > 60000
    ORDER BY salario DESC
'''
result3 = cursor.execute(query3).fetchall()
for row in result3:
    print(f"👤 {row[0]:<25} | 💼 {row[1]:<25} | 💰 ${row[2]:,.2f} | ⏱️ {row[3]} años")

print(f"\n📊 Total empleados con salario > $60,000: {len(result3)}")

# 🧠 ANÁLISIS Y APRENDIZAJE
print("\n" + "=" * 60)
print("🧠 CONCEPTOS CLAVE APLICADOS:")
print("=" * 60)
print("✅ Concatenación de strings con ||")
print("✅ Alias de columnas con AS")
print("✅ Filtrado con WHERE")
print("✅ Ordenamiento con ORDER BY")
print("✅ Comparadores numéricos (>, <, =)")
print("✅ Formateo de resultados para mejor legibilidad")

#### 🎯 EJERCICIO 2: Filtros y Patrones Avanzados

**📝 ENUNCIADO:**
Ahora profundizaremos en filtros más específicos y útiles para análisis industrial:

1. **Empleados de Automatización**: Encuentra todos los empleados cuyo email contenga "empresa.com" y trabajen en el departamento de Automatización
2. **Análisis de experiencia**: Muestra empleados con entre 5 y 10 años de experiencia, ordenados por salario
3. **Búsqueda por nombre**: Encuentra empleados cuyos nombres empiecen con 'M' o 'A'
4. **Salarios específicos**: Empleados con salarios de exactamente $45,000, $68,000 o $75,000

**💡 TIPS:** Usa `LIKE`, `BETWEEN`, `IN`, `AND`, `OR`

**🎯 TU TURNO:** ¡A practicar filtros avanzados!

In [None]:
# 🚀 TU PRÁCTICA - EJERCICIO 2
# Escribe aquí tus consultas SQL para filtros avanzados

# Consulta 1: Empleados de Automatización con email empresa.com
# TU CÓDIGO AQUÍ:


# Consulta 2: Empleados con 5-10 años de experiencia, ordenados por salario
# TU CÓDIGO AQUÍ:


# Consulta 3: Empleados con nombres que empiecen con 'M' o 'A'
# TU CÓDIGO AQUÍ:


# Consulta 4: Empleados con salarios específicos ($45,000, $68,000 o $75,000)
# TU CÓDIGO AQUÍ:

In [None]:
# ✅ SOLUCIÓN - EJERCICIO 2

print("=" * 60)
print("📋 SOLUCIÓN EJERCICIO 2: Filtros y Patrones Avanzados")
print("=" * 60)

# Consulta 1: Empleados de Automatización con email empresa.com
print("\n1️⃣ EMPLEADOS DE AUTOMATIZACIÓN CON EMAIL EMPRESA.COM")
print("-" * 50)
query1 = '''
    SELECT 
        e.nombre || ' ' || e.apellido AS nombre_completo,
        e.email,
        e.cargo,
        d.nombre AS departamento
    FROM empleados e, departamentos d
    WHERE e.id_departamento = d.id_departamento
        AND d.nombre = 'Automatización'
        AND e.email LIKE '%empresa.com%'
'''
result1 = cursor.execute(query1).fetchall()
for row in result1:
    print(f"👤 {row[0]:<25} | 📧 {row[1]:<30} | 💼 {row[2]}")

print(f"📊 Total empleados encontrados: {len(result1)}")

# Consulta 2: Empleados con 5-10 años de experiencia, ordenados por salario
print("\n2️⃣ EMPLEADOS CON 5-10 AÑOS DE EXPERIENCIA (POR SALARIO)")
print("-" * 50)
query2 = '''
    SELECT 
        nombre || ' ' || apellido AS nombre_completo,
        años_experiencia,
        salario,
        cargo
    FROM empleados
    WHERE años_experiencia BETWEEN 5 AND 10
    ORDER BY salario DESC
'''
result2 = cursor.execute(query2).fetchall()
for row in result2:
    print(f"👤 {row[0]:<25} | ⏱️ {row[1]:>2} años | 💰 ${row[2]:,.2f} | 💼 {row[3]}")

print(f"📊 Total empleados con 5-10 años experiencia: {len(result2)}")

# Consulta 3: Empleados con nombres que empiecen con 'M' o 'A'
print("\n3️⃣ EMPLEADOS CON NOMBRES QUE EMPIECEN CON 'M' O 'A'")
print("-" * 50)
query3 = '''
    SELECT 
        nombre || ' ' || apellido AS nombre_completo,
        cargo,
        salario
    FROM empleados
    WHERE nombre LIKE 'M%' OR nombre LIKE 'A%'
    ORDER BY nombre
'''
result3 = cursor.execute(query3).fetchall()
for row in result3:
    print(f"👤 {row[0]:<25} | 💼 {row[1]:<25} | 💰 ${row[2]:,.2f}")

print(f"📊 Total empleados con nombres M* o A*: {len(result3)}")

# Consulta 4: Empleados con salarios específicos
print("\n4️⃣ EMPLEADOS CON SALARIOS ESPECÍFICOS ($45K, $68K, $75K)")
print("-" * 50)
query4 = '''
    SELECT 
        nombre || ' ' || apellido AS nombre_completo,
        salario,
        cargo,
        años_experiencia
    FROM empleados
    WHERE salario IN (45000, 68000, 75000)
    ORDER BY salario DESC
'''
result4 = cursor.execute(query4).fetchall()
for row in result4:
    print(f"👤 {row[0]:<25} | 💰 ${row[1]:,.2f} | 💼 {row[2]:<20} | ⏱️ {row[3]} años")

print(f"📊 Total empleados con salarios específicos: {len(result4)}")

# 🧠 ANÁLISIS Y APRENDIZAJE
print("\n" + "=" * 60)
print("🧠 CONCEPTOS CLAVE APLICADOS:")
print("=" * 60)
print("✅ LIKE con wildcards (%, _)")
print("✅ BETWEEN para rangos numéricos")
print("✅ IN para valores específicos")
print("✅ Operadores lógicos (AND, OR)")
print("✅ JOIN implícito (tabla1, tabla2 WHERE)")
print("✅ Alias de tablas (e, d)")
print("✅ Combinación de múltiples condiciones")

#### 🧠 CUESTIONARIO RÁPIDO - NIVEL BÁSICO

**¡Verifica tu comprensión antes de avanzar!**

**❓ PREGUNTA 1:** ¿Cuál es la diferencia entre `LIKE '%texto%'` y `LIKE 'texto%'`?
- **Tu respuesta:** _Escribe aquí_

**❓ PREGUNTA 2:** ¿Por qué usamos alias de tabla (`e`, `d`) en consultas complejas?
- **Tu respuesta:** _Escribe aquí_

**❓ PREGUNTA 3:** ¿Cuándo usarías `BETWEEN` vs `IN`?
- **Tu respuesta:** _Escribe aquí_

**❓ PREGUNTA 4:** ¿Qué diferencia hay entre `AND` y `OR` en las condiciones WHERE?
- **Tu respuesta:** _Escribe aquí_

---

**🎯 AUTOCOMPROBACIÓN:**
Después de responder, ejecuta la siguiente celda para ver las respuestas correctas.

## 🎯 EJERCICIOS PRÁCTICOS - NIVEL BÁSICO

### 🚀 Ejercicio 1: Gestión de Inventario de Tienda

Vamos a crear un sistema básico de inventario para una tienda de electrónicos.

In [None]:
# 🚀 TU PRÁCTICA - EJERCICIO 3
# Escribe aquí tus consultas SQL con JOINs explícitos

# Consulta 1: INNER JOIN empleados con departamentos
# TU CÓDIGO AQUÍ:


# Consulta 2: LEFT JOIN departamentos con conteo de empleados
# TU CÓDIGO AQUÍ:


# Consulta 3: INNER JOIN proyectos con departamentos
# TU CÓDIGO AQUÍ:


# Consulta 4: JOIN múltiple (empleados-departamentos-proyectos activos)
# TU CÓDIGO AQUÍ:

In [None]:
# ✅ SOLUCIÓN - EJERCICIO 3

print("=" * 70)
print("📋 SOLUCIÓN EJERCICIO 3: JOINs Explícitos")
print("=" * 70)

# Consulta 1: INNER JOIN empleados con departamentos
print("\n1️⃣ INNER JOIN: EMPLEADOS CON SUS DEPARTAMENTOS")
print("-" * 55)
query1 = '''
    SELECT 
        e.nombre || ' ' || e.apellido AS nombre_completo,
        e.cargo,
        d.nombre AS departamento,
        d.ubicacion,
        e.salario
    FROM empleados e
    INNER JOIN departamentos d ON e.id_departamento = d.id_departamento
    ORDER BY d.nombre, e.apellido
'''
result1 = cursor.execute(query1).fetchall()
for row in result1:
    print(f"👤 {row[0]:<25} | 💼 {row[1]:<25} | 🏢 {row[2]:<15} | 📍 {row[3]}")

print(f"📊 Total empleados con departamento: {len(result1)}")

# Consulta 2: LEFT JOIN departamentos con conteo de empleados
print("\n2️⃣ LEFT JOIN: DEPARTAMENTOS CON CONTEO DE EMPLEADOS")
print("-" * 55)
query2 = '''
    SELECT 
        d.nombre AS departamento,
        d.ubicacion,
        d.presupuesto,
        COUNT(e.id_empleado) AS total_empleados
    FROM departamentos d
    LEFT JOIN empleados e ON d.id_departamento = e.id_departamento
    GROUP BY d.id_departamento, d.nombre, d.ubicacion, d.presupuesto
    ORDER BY total_empleados DESC
'''
result2 = cursor.execute(query2).fetchall()
for row in result2:
    empleados_text = f"{row[3]} empleados" if row[3] != 1 else "1 empleado"
    print(f"🏢 {row[0]:<20} | 📍 {row[1]:<25} | 💰 ${row[2]:,.2f} | 👥 {empleados_text}")

# Consulta 3: INNER JOIN proyectos con departamentos
print("\n3️⃣ INNER JOIN: PROYECTOS CON DEPARTAMENTOS RESPONSABLES")
print("-" * 55)
query3 = '''
    SELECT 
        p.nombre_proyecto,
        d.nombre AS departamento_responsable,
        p.presupuesto,
        p.estado,
        p.fecha_inicio,
        p.fecha_fin
    FROM proyectos p
    INNER JOIN departamentos d ON p.id_departamento = d.id_departamento
    ORDER BY p.presupuesto DESC
'''
result3 = cursor.execute(query3).fetchall()
for row in result3:
    print(f"📋 {row[0]:<30} | 🏢 {row[1]:<15} | 💰 ${row[2]:,.2f} | 📊 {row[3]}")

print(f"📊 Total proyectos activos: {len(result3)}")

# Consulta 4: JOIN múltiple
print("\n4️⃣ JOIN MÚLTIPLE: EMPLEADOS EN PROYECTOS ACTIVOS")
print("-" * 55)
query4 = '''
    SELECT 
        e.nombre || ' ' || e.apellido AS empleado,
        d.nombre AS departamento,
        p.nombre_proyecto,
        p.estado,
        p.presupuesto
    FROM empleados e
    INNER JOIN departamentos d ON e.id_departamento = d.id_departamento
    INNER JOIN proyectos p ON d.id_departamento = p.id_departamento
    WHERE p.estado = 'En Progreso'
    ORDER BY p.presupuesto DESC, e.apellido
'''
result4 = cursor.execute(query4).fetchall()
for row in result4:
    print(f"👤 {row[0]:<25} | 🏢 {row[1]:<15} | 📋 {row[2]:<25} | 💰 ${row[4]:,.2f}")

print(f"📊 Total empleados en proyectos activos: {len(result4)}")

# 🧠 ANÁLISIS Y APRENDIZAJE
print("\n" + "=" * 70)
print("🧠 CONCEPTOS CLAVE APLICADOS:")
print("=" * 70)
print("✅ INNER JOIN: Solo registros que coinciden")
print("✅ LEFT JOIN: Incluye registros sin coincidencia")
print("✅ GROUP BY: Agrupa para hacer conteos")
print("✅ COUNT(): Función de agregación")
print("✅ JOIN múltiple: Tres tablas relacionadas")
print("✅ ON: Especifica la condición de unión")
print("✅ Diferencia práctica entre INNER y LEFT JOIN")

#### 🎯 EJERCICIO 4: Agregaciones y Análisis Estadístico

**📝 ENUNCIADO:**
Como ingeniero industrial, necesitas generar reportes estadísticos para la dirección:

1. **Análisis salarial por departamento**: Promedio, mínimo, máximo y total de salarios por departamento
2. **Distribución de experiencia**: Contar empleados por rangos de experiencia (0-5, 6-10, 11+)
3. **Presupuesto total por estado**: Suma de presupuestos de proyectos agrupados por estado
4. **Departamentos eficientes**: Departamentos con más de 1 empleado y salario promedio > $50,000 (usar HAVING)

**💡 TIPS:** Usa `SUM()`, `AVG()`, `MIN()`, `MAX()`, `COUNT()`, `GROUP BY`, `HAVING`

**🎯 TU TURNO:** ¡Conviértete en analista de datos industriales!

In [None]:
# ✅ SOLUCIÓN - EJERCICIO 4

print("=" * 80)
print("📋 SOLUCIÓN EJERCICIO 4: Agregaciones y Análisis Estadístico")
print("=" * 80)

# Consulta 1: Análisis salarial por departamento
print("\n1️⃣ ANÁLISIS SALARIAL POR DEPARTAMENTO")
print("-" * 60)
query1 = '''
    SELECT 
        d.nombre AS departamento,
        COUNT(e.id_empleado) AS total_empleados,
        ROUND(AVG(e.salario), 2) AS salario_promedio,
        MIN(e.salario) AS salario_minimo,
        MAX(e.salario) AS salario_maximo,
        SUM(e.salario) AS costo_total_salarios
    FROM departamentos d
    INNER JOIN empleados e ON d.id_departamento = e.id_departamento
    GROUP BY d.id_departamento, d.nombre
    ORDER BY salario_promedio DESC
'''
result1 = cursor.execute(query1).fetchall()
print(f"{'Departamento':<20} | {'#Emp'} | {'Promedio':<10} | {'Mínimo':<10} | {'Máximo':<10} | {'Total'}")
print("-" * 85)
for row in result1:
    print(f"{row[0]:<20} | {row[1]:>4} | ${row[2]:>8,.2f} | ${row[3]:>8,.2f} | ${row[4]:>8,.2f} | ${row[5]:>10,.2f}")

# Consulta 2: Distribución de empleados por rangos de experiencia
print("\n2️⃣ DISTRIBUCIÓN POR RANGOS DE EXPERIENCIA")
print("-" * 60)
query2 = '''
    SELECT 
        CASE 
            WHEN años_experiencia BETWEEN 0 AND 5 THEN '0-5 años (Junior)'
            WHEN años_experiencia BETWEEN 6 AND 10 THEN '6-10 años (Semi-Senior)'
            ELSE '11+ años (Senior)'
        END AS rango_experiencia,
        COUNT(*) AS cantidad_empleados,
        ROUND(AVG(salario), 2) AS salario_promedio_rango,
        MIN(salario) AS salario_min_rango,
        MAX(salario) AS salario_max_rango
    FROM empleados
    GROUP BY 
        CASE 
            WHEN años_experiencia BETWEEN 0 AND 5 THEN '0-5 años (Junior)'
            WHEN años_experiencia BETWEEN 6 AND 10 THEN '6-10 años (Semi-Senior)'
            ELSE '11+ años (Senior)'
        END
    ORDER BY cantidad_empleados DESC
'''
result2 = cursor.execute(query2).fetchall()
for row in result2:
    print(f"📊 {row[0]:<20} | 👥 {row[1]:>2} empleados | 💰 Promedio: ${row[2]:,.2f}")
    print(f"   📈 Rango salarial: ${row[3]:,.2f} - ${row[4]:,.2f}")

# Consulta 3: Presupuesto total por estado de proyectos
print("\n3️⃣ PRESUPUESTO TOTAL POR ESTADO DE PROYECTOS")
print("-" * 60)
query3 = '''
    SELECT 
        estado,
        COUNT(*) AS cantidad_proyectos,
        SUM(presupuesto) AS presupuesto_total,
        ROUND(AVG(presupuesto), 2) AS presupuesto_promedio
    FROM proyectos
    GROUP BY estado
    ORDER BY presupuesto_total DESC
'''
result3 = cursor.execute(query3).fetchall()
for row in result3:
    print(f"📊 {row[0]:<15} | 📋 {row[1]:>2} proyectos | 💰 Total: ${row[2]:,.2f} | 📈 Promedio: ${row[3]:,.2f}")

# Consulta 4: Departamentos eficientes (HAVING)
print("\n4️⃣ DEPARTAMENTOS EFICIENTES (>1 empleado, salario promedio >$50K)")
print("-" * 60)
query4 = '''
    SELECT 
        d.nombre AS departamento,
        COUNT(e.id_empleado) AS total_empleados,
        ROUND(AVG(e.salario), 2) AS salario_promedio,
        d.presupuesto AS presupuesto_departamento
    FROM departamentos d
    INNER JOIN empleados e ON d.id_departamento = e.id_departamento
    GROUP BY d.id_departamento, d.nombre, d.presupuesto
    HAVING COUNT(e.id_empleado) > 1 AND AVG(e.salario) > 50000
    ORDER BY salario_promedio DESC
'''
result4 = cursor.execute(query4).fetchall()
for row in result4:
    eficiencia = (row[2] / row[3]) * 100 if row[3] > 0 else 0
    print(f"🏢 {row[0]:<20} | 👥 {row[1]} empleados | 💰 ${row[2]:,.2f} promedio")
    print(f"   📊 Presupuesto: ${row[3]:,.2f} | ⚡ Eficiencia: {eficiencia:.2f}%")

# 🧠 ANÁLISIS Y APRENDIZAJE
print("\n" + "=" * 80)
print("🧠 CONCEPTOS CLAVE APLICADOS:")
print("=" * 80)
print("✅ COUNT(), SUM(), AVG(), MIN(), MAX()")
print("✅ GROUP BY para agrupar datos")
print("✅ HAVING para filtrar grupos")
print("✅ CASE WHEN para categorización")
print("✅ ROUND() para redondear decimales")
print("✅ Análisis estadístico descriptivo")
print("✅ Reportes empresariales con SQL")

print("\n📈 INSIGHTS EMPRESARIALES GENERADOS:")
print("• Automatización tiene el salario promedio más alto")
print("• Distribución equilibrada de experiencia")
print("• Proyectos 'En Progreso' concentran mayor inversión")
print("• Departamentos eficientes identificados para benchmarking")

In [None]:
# 🚀 TU PRÁCTICA - EJERCICIO 5 (AVANZADO)
# Escribe aquí tus consultas SQL avanzadas

# Consulta 1: Empleados con salario mayor al promedio de su departamento
# TU CÓDIGO AQUÍ:


# Consulta 2: Departamentos sin proyectos (usando EXISTS)
# TU CÓDIGO AQUÍ:


# Consulta 3: Ranking salarial por departamento (Window Functions)
# TU CÓDIGO AQUÍ:


# Consulta 4: CTE para análisis jerárquico
# TU CÓDIGO AQUÍ:

### 🏆 PROYECTO INTEGRADOR: Sistema de Monitoreo Industrial

**🎯 OBJETIVO:** Crear un dashboard SQL completo que integre todos los conceptos aprendidos para un **Sistema de Monitoreo de Planta Industrial**.

**📋 REQUERIMIENTOS DEL PROYECTO:**

**1. MÓDULO DE RECURSOS HUMANOS**
- Análisis de estructura organizacional
- Identificación de brechas salariales
- Evaluación de distribución de talento

**2. MÓDULO DE GESTIÓN DE PROYECTOS**
- Estado financiero de proyectos
- Análisis de riesgo por departamento
- Proyección de recursos necesarios

**3. MÓDULO DE EFICIENCIA OPERACIONAL**
- KPIs departamentales
- Ranking de performance
- Alertas de optimización

**4. DASHBOARD EJECUTIVO**
- Métricas consolidadas
- Indicadores de salud organizacional
- Recomendaciones automatizadas

**🔥 CHALLENGE:** Implementa un sistema completo usando SOLO SQL que genere insights accionables para la dirección de la empresa.

In [None]:
# ✅ SOLUCIÓN - EJERCICIO 5 (AVANZADO)

print("=" * 80)
print("📋 SOLUCIÓN EJERCICIO 5: Subconsultas y Análisis Complejo")
print("=" * 80)

# Consulta 1: Empleados con salario mayor al promedio de su departamento
print("\n1️⃣ TOP PERFORMERS: SALARIO > PROMEDIO DEPARTAMENTAL")
print("-" * 65)
query1 = '''
    SELECT 
        e.nombre || ' ' || e.apellido AS empleado,
        d.nombre AS departamento,
        e.salario AS salario_empleado,
        (SELECT ROUND(AVG(e2.salario), 2) 
         FROM empleados e2 
         WHERE e2.id_departamento = e.id_departamento) AS promedio_dept,
        ROUND(e.salario - (SELECT AVG(e2.salario) 
                          FROM empleados e2 
                          WHERE e2.id_departamento = e.id_departamento), 2) AS diferencia
    FROM empleados e
    INNER JOIN departamentos d ON e.id_departamento = d.id_departamento
    WHERE e.salario > (
        SELECT AVG(e2.salario) 
        FROM empleados e2 
        WHERE e2.id_departamento = e.id_departamento
    )
    ORDER BY diferencia DESC
'''
result1 = cursor.execute(query1).fetchall()
for row in result1:
    print(f"🌟 {row[0]:<25} | 🏢 {row[1]:<15} | 💰 ${row[2]:,.2f} | 📊 Prom: ${row[3]:,.2f} | ⬆️ +${row[4]:,.2f}")

print(f"📊 Total top performers: {len(result1)}")

# Consulta 2: Departamentos sin proyectos
print("\n2️⃣ DEPARTAMENTOS SIN PROYECTOS ASIGNADOS")
print("-" * 65)
query2 = '''
    SELECT 
        d.nombre AS departamento,
        d.ubicacion,
        d.presupuesto,
        COUNT(e.id_empleado) AS empleados_disponibles
    FROM departamentos d
    LEFT JOIN empleados e ON d.id_departamento = e.id_departamento
    WHERE NOT EXISTS (
        SELECT 1 
        FROM proyectos p 
        WHERE p.id_departamento = d.id_departamento
    )
    GROUP BY d.id_departamento, d.nombre, d.ubicacion, d.presupuesto
'''
result2 = cursor.execute(query2).fetchall()
if result2:
    for row in result2:
        print(f"🏢 {row[0]:<20} | 📍 {row[1]:<25} | 💰 ${row[2]:,.2f} | 👥 {row[3]} empleados")
else:
    print("✅ Todos los departamentos tienen proyectos asignados")

# Consulta 3: Ranking salarial por departamento usando Window Functions
print("\n3️⃣ RANKING SALARIAL POR DEPARTAMENTO")
print("-" * 65)
query3 = '''
    SELECT 
        d.nombre AS departamento,
        e.nombre || ' ' || e.apellido AS empleado,
        e.salario,
        ROW_NUMBER() OVER (PARTITION BY d.nombre ORDER BY e.salario DESC) AS ranking_dept,
        ROUND(AVG(e.salario) OVER (PARTITION BY d.nombre), 2) AS promedio_dept,
        e.salario - AVG(e.salario) OVER (PARTITION BY d.nombre) AS diferencia_promedio
    FROM empleados e
    INNER JOIN departamentos d ON e.id_departamento = d.id_departamento
    ORDER BY d.nombre, ranking_dept
'''
result3 = cursor.execute(query3).fetchall()
current_dept = ""
for row in result3:
    if row[0] != current_dept:
        print(f"\n🏢 DEPARTAMENTO: {row[0]}")
        print(f"   📊 Promedio departamental: ${row[4]:,.2f}")
        current_dept = row[0]
    
    medal = "🥇" if row[3] == 1 else "🥈" if row[3] == 2 else "🥉" if row[3] == 3 else "  "
    print(f"   {medal} #{row[3]} {row[1]:<25} | 💰 ${row[2]:,.2f} | ⬆️ {row[5]:+.2f}")

# Consulta 4: CTE para análisis jerárquico
print("\n4️⃣ ANÁLISIS JERÁRQUICO CON CTE")
print("-" * 65)
query4 = '''
    WITH departamento_stats AS (
        SELECT 
            d.id_departamento,
            d.nombre AS dept_nombre,
            d.presupuesto AS presupuesto_dept,
            COUNT(e.id_empleado) AS total_empleados,
            COALESCE(SUM(e.salario), 0) AS costo_total_salarios,
            COALESCE(AVG(e.salario), 0) AS salario_promedio,
            COUNT(p.id_proyecto) AS total_proyectos,
            COALESCE(SUM(p.presupuesto), 0) AS presupuesto_proyectos
        FROM departamentos d
        LEFT JOIN empleados e ON d.id_departamento = e.id_departamento
        LEFT JOIN proyectos p ON d.id_departamento = p.id_departamento
        GROUP BY d.id_departamento, d.nombre, d.presupuesto
    ),
    efficiency_metrics AS (
        SELECT 
            *,
            CASE 
                WHEN total_empleados > 0 THEN presupuesto_proyectos / total_empleados
                ELSE 0 
            END AS presupuesto_por_empleado,
            CASE 
                WHEN presupuesto_dept > 0 THEN (costo_total_salarios / presupuesto_dept) * 100
                ELSE 0 
            END AS porcentaje_salarios_presupuesto
        FROM departamento_stats
    )
    SELECT 
        dept_nombre,
        total_empleados,
        total_proyectos,
        ROUND(salario_promedio, 2) AS salario_promedio,
        ROUND(presupuesto_por_empleado, 2) AS presupuesto_por_empleado,
        ROUND(porcentaje_salarios_presupuesto, 2) AS pct_salarios_presupuesto,
        CASE 
            WHEN porcentaje_salarios_presupuesto < 30 THEN 'Eficiente'
            WHEN porcentaje_salarios_presupuesto < 50 THEN 'Normal'
            ELSE 'Alto Costo'
        END AS clasificacion_eficiencia
    FROM efficiency_metrics
    ORDER BY presupuesto_por_empleado DESC
'''
result4 = cursor.execute(query4).fetchall()
print(f"{'Departamento':<20} | {'Emp'} | {'Proy'} | {'Sal.Prom':<10} | {'Pres/Emp':<10} | {'%Sal'} | {'Eficiencia'}")
print("-" * 90)
for row in result4:
    efficiency_icon = "🟢" if row[6] == 'Eficiente' else "🟡" if row[6] == 'Normal' else "🔴"
    print(f"{row[0]:<20} | {row[1]:>3} | {row[2]:>4} | ${row[3]:>8,.0f} | ${row[4]:>8,.0f} | {row[5]:>4.1f}% | {efficiency_icon} {row[6]}")

# 🧠 ANÁLISIS Y APRENDIZAJE
print("\n" + "=" * 80)
print("🧠 CONCEPTOS AVANZADOS APLICADOS:")
print("=" * 80)
print("✅ Subconsultas correlacionadas en WHERE y SELECT")
print("✅ EXISTS/NOT EXISTS para verificar existencia")
print("✅ Window Functions: ROW_NUMBER() OVER()")
print("✅ PARTITION BY para agrupar en window functions")
print("✅ Common Table Expressions (CTE) con WITH")
print("✅ CTEs anidados para análisis complejos")
print("✅ Métricas de eficiencia empresarial")
print("✅ Clasificación automática con CASE WHEN")

#### 🎯 EJERCICIO 5: Subconsultas y Análisis Complejo

**📝 ENUNCIADO:**
Como ingeniero senior, necesitas realizar análisis complejos para optimización de procesos:

1. **Empleados top performers**: Empleados con salario mayor al promedio de su departamento
2. **Departamentos sin proyectos**: Usar EXISTS para encontrar departamentos que NO tienen proyectos asignados
3. **Ranking salarial**: Usar window functions para rankear empleados por salario dentro de cada departamento
4. **CTE para análisis jerárquico**: Crear CTE que calcule métricas departamentales complejas

**💡 TIPS:** Usa subconsultas en `WHERE`, `SELECT`, `EXISTS`, `ROW_NUMBER() OVER()`

**🎯 TU TURNO:** ¡Conviértete en un experto en consultas complejas!

### 🔴 NIVEL AVANZADO: Subconsultas y Optimización

**Objetivo:** Dominar consultas complejas, subconsultas y optimización para aplicaciones industriales

**🔥 CONCEPTOS CLAVE:**
- **Subconsultas**: Consultas dentro de consultas
- **EXISTS/NOT EXISTS**: Verificar existencia de datos
- **Window Functions**: ROW_NUMBER(), RANK(), PARTITION BY
- **Common Table Expressions (CTE)**: WITH clause
- **Índices**: Optimización de consultas
- **Transacciones**: ACID properties

In [None]:
# 🚀 TU PRÁCTICA - EJERCICIO 4
# Escribe aquí tus consultas SQL con agregaciones

# Consulta 1: Análisis salarial por departamento (AVG, MIN, MAX, SUM)
# TU CÓDIGO AQUÍ:


# Consulta 2: Distribución de empleados por rangos de experiencia
# TU CÓDIGO AQUÍ:


# Consulta 3: Presupuesto total por estado de proyectos
# TU CÓDIGO AQUÍ:


# Consulta 4: Departamentos eficientes (HAVING clause)
# TU CÓDIGO AQUÍ:

#### 🎯 EJERCICIO 3: JOINs Explícitos

**📝 ENUNCIADO:**
Ahora trabajaremos con relaciones entre tablas usando JOINs explícitos:

1. **INNER JOIN**: Mostrar empleados con sus departamentos (nombre completo, cargo, departamento, ubicación)
2. **LEFT JOIN**: Mostrar TODOS los departamentos y cuántos empleados tienen (incluir departamentos sin empleados)
3. **Análisis de proyectos**: Unir proyectos con departamentos, mostrar proyecto, departamento responsable y presupuesto
4. **JOIN múltiple**: Empleados trabajando en proyectos activos (empleado, departamento, proyecto, estado)

**💡 TIPS:** Usa `INNER JOIN`, `LEFT JOIN`, `ON` para especificar relaciones

**🎯 TU TURNO:** ¡Domina las relaciones entre tablas!

### 🟡 NIVEL INTERMEDIO: JOINs y Agregaciones

**Objetivo:** Dominar relaciones entre tablas y funciones de agregación

**🔥 CONCEPTOS CLAVE:**
- **INNER JOIN**: Solo registros que coinciden en ambas tablas
- **LEFT JOIN**: Todos los registros de la tabla izquierda
- **Agregaciones**: COUNT, SUM, AVG, MIN, MAX
- **GROUP BY**: Agrupar por categorías
- **HAVING**: Filtrar grupos (no filas individuales)

In [None]:
# 🏆 IMPLEMENTACIÓN: SISTEMA DE MONITOREO INDUSTRIAL
# Un proyecto completo que integra todos los conceptos SQL aprendidos

print("=" * 100)
print("🏭 SISTEMA DE MONITOREO INDUSTRIAL - DASHBOARD EJECUTIVO")
print("=" * 100)

# 📊 MÓDULO 1: RECURSOS HUMANOS
print("\n" + "🔵" * 40)
print("👥 MÓDULO 1: ANÁLISIS DE RECURSOS HUMANOS")
print("🔵" * 40)

# Estructura organizacional
rh_query = '''
    WITH estructura_org AS (
        SELECT 
            d.nombre AS departamento,
            COUNT(e.id_empleado) AS total_empleados,
            ROUND(AVG(e.salario), 2) AS salario_promedio,
            ROUND(AVG(e.años_experiencia), 1) AS experiencia_promedio,
            d.presupuesto AS presupuesto_dept
        FROM departamentos d
        LEFT JOIN empleados e ON d.id_departamento = e.id_departamento
        GROUP BY d.id_departamento, d.nombre, d.presupuesto
    ),
    brechas_salariales AS (
        SELECT 
            dept_global.departamento,
            dept_global.total_empleados,
            dept_global.salario_promedio,
            (SELECT AVG(salario) FROM empleados) AS salario_general,
            dept_global.salario_promedio - (SELECT AVG(salario) FROM empleados) AS brecha_salarial
        FROM estructura_org dept_global
    )
    SELECT 
        b.departamento,
        b.total_empleados,
        b.salario_promedio,
        b.salario_general,
        b.brecha_salarial,
        CASE 
            WHEN b.brecha_salarial > 10000 THEN '🟢 Competitivo'
            WHEN b.brecha_salarial > 0 THEN '🟡 Promedio'
            ELSE '🔴 Bajo Mercado'
        END AS clasificacion_salarial
    FROM brechas_salariales b
    ORDER BY b.brecha_salarial DESC
'''

rh_result = cursor.execute(rh_query).fetchall()
print("\n📈 ANÁLISIS DE COMPETITIVIDAD SALARIAL:")
print(f"{'Departamento':<20} | {'#Emp'} | {'Prom.Dept':<12} | {'Prom.Gral':<12} | {'Brecha':<12} | {'Status'}")
print("-" * 95)
for row in rh_result:
    print(f"{row[0]:<20} | {row[1]:>4} | ${row[2]:>10,.2f} | ${row[3]:>10,.2f} | ${row[4]:>+10,.2f} | {row[5]}")

# 📊 MÓDULO 2: GESTIÓN DE PROYECTOS
print("\n" + "🟡" * 40)
print("📋 MÓDULO 2: ANÁLISIS DE GESTIÓN DE PROYECTOS")
print("🟡" * 40)

proyectos_query = '''
    WITH analisis_proyectos AS (
        SELECT 
            p.estado,
            COUNT(*) AS cantidad_proyectos,
            SUM(p.presupuesto) AS presupuesto_total,
            AVG(p.presupuesto) AS presupuesto_promedio,
            COUNT(DISTINCT p.id_departamento) AS departamentos_involucrados
        FROM proyectos p
        GROUP BY p.estado
    ),
    riesgo_departamental AS (
        SELECT 
            d.nombre AS departamento,
            COUNT(p.id_proyecto) AS proyectos_activos,
            SUM(CASE WHEN p.estado = 'En Progreso' THEN p.presupuesto ELSE 0 END) AS inversion_activa,
            d.presupuesto AS presupuesto_dept,
            ROUND(
                (SUM(CASE WHEN p.estado = 'En Progreso' THEN p.presupuesto ELSE 0 END) / d.presupuesto) * 100, 
                2
            ) AS porcentaje_comprometido
        FROM departamentos d
        LEFT JOIN proyectos p ON d.id_departamento = p.id_departamento
        GROUP BY d.id_departamento, d.nombre, d.presupuesto
    )
    SELECT 
        r.departamento,
        r.proyectos_activos,
        r.inversion_activa,
        r.presupuesto_dept,
        r.porcentaje_comprometido,
        CASE 
            WHEN r.porcentaje_comprometido > 80 THEN '🔴 Alto Riesgo'
            WHEN r.porcentaje_comprometido > 50 THEN '🟡 Riesgo Medio'
            WHEN r.porcentaje_comprometido > 0 THEN '🟢 Bajo Riesgo'
            ELSE '⚪ Sin Proyectos'
        END AS nivel_riesgo
    FROM riesgo_departamental r
    ORDER BY r.porcentaje_comprometido DESC
'''

proyectos_result = cursor.execute(proyectos_query).fetchall()
print("\n⚠️ ANÁLISIS DE RIESGO DEPARTAMENTAL:")
print(f"{'Departamento':<20} | {'Proy'} | {'Inv.Activa':<12} | {'Presup.Dept':<12} | {'%Comp'} | {'Riesgo'}")
print("-" * 95)
for row in proyectos_result:
    print(f"{row[0]:<20} | {row[1]:>4} | ${row[2]:>10,.0f} | ${row[3]:>10,.0f} | {row[4]:>5.1f}% | {row[5]}")

# 📊 MÓDULO 3: EFICIENCIA OPERACIONAL
print("\n" + "🟢" * 40)
print("⚡ MÓDULO 3: ANÁLISIS DE EFICIENCIA OPERACIONAL")
print("🟢" * 40)

eficiencia_query = '''
    WITH kpis_departamentales AS (
        SELECT 
            d.nombre AS departamento,
            COUNT(e.id_empleado) AS empleados,
            COALESCE(SUM(e.salario), 0) AS costo_rrhh,
            COUNT(p.id_proyecto) AS proyectos_gestionados,
            COALESCE(SUM(p.presupuesto), 0) AS valor_proyectos,
            d.presupuesto AS presupuesto_asignado,
            -- KPI: Valor generado por empleado
            CASE 
                WHEN COUNT(e.id_empleado) > 0 THEN ROUND(COALESCE(SUM(p.presupuesto), 0) / COUNT(e.id_empleado), 2)
                ELSE 0 
            END AS valor_por_empleado,
            -- KPI: Eficiencia presupuestaria
            CASE 
                WHEN d.presupuesto > 0 THEN ROUND((COALESCE(SUM(p.presupuesto), 0) / d.presupuesto) * 100, 2)
                ELSE 0 
            END AS eficiencia_presupuestaria,
            -- KPI: ROI recursos humanos
            CASE 
                WHEN COALESCE(SUM(e.salario), 0) > 0 THEN ROUND(COALESCE(SUM(p.presupuesto), 0) / COALESCE(SUM(e.salario), 1), 2)
                ELSE 0 
            END AS roi_rrhh
        FROM departamentos d
        LEFT JOIN empleados e ON d.id_departamento = e.id_departamento
        LEFT JOIN proyectos p ON d.id_departamento = p.id_departamento
        GROUP BY d.id_departamento, d.nombre, d.presupuesto
    ),
    ranking_performance AS (
        SELECT 
            *,
            ROW_NUMBER() OVER (ORDER BY valor_por_empleado DESC) AS rank_valor,
            ROW_NUMBER() OVER (ORDER BY eficiencia_presupuestaria DESC) AS rank_eficiencia,
            ROW_NUMBER() OVER (ORDER BY roi_rrhh DESC) AS rank_roi
        FROM kpis_departamentales
    )
    SELECT 
        departamento,
        empleados,
        proyectos_gestionados,
        valor_por_empleado,
        eficiencia_presupuestaria,
        roi_rrhh,
        (rank_valor + rank_eficiencia + rank_roi) AS score_total,
        CASE 
            WHEN (rank_valor + rank_eficiencia + rank_roi) <= 9 THEN '🥇 Excelente'
            WHEN (rank_valor + rank_eficiencia + rank_roi) <= 15 THEN '🥈 Bueno'
            ELSE '🥉 Mejorable'
        END AS clasificacion_performance
    FROM ranking_performance
    ORDER BY score_total ASC
'''

eficiencia_result = cursor.execute(eficiencia_query).fetchall()
print("\n🏆 RANKING DE PERFORMANCE DEPARTAMENTAL:")
print(f"{'Departamento':<20} | {'Emp'} | {'Proy'} | {'$/Emp':<10} | {'Efic%'} | {'ROI'} | {'Performance'}")
print("-" * 90)
for row in eficiencia_result:
    print(f"{row[0]:<20} | {row[1]:>3} | {row[2]:>4} | ${row[3]:>8,.0f} | {row[4]:>4.1f}% | {row[5]:>3.1f} | {row[7]}")

# 📊 MÓDULO 4: DASHBOARD EJECUTIVO
print("\n" + "🔴" * 40)
print("📊 MÓDULO 4: DASHBOARD EJECUTIVO - MÉTRICAS CONSOLIDADAS")
print("🔴" * 40)

dashboard_query = '''
    WITH metricas_globales AS (
        SELECT 
            (SELECT COUNT(*) FROM empleados) AS total_empleados,
            (SELECT COUNT(*) FROM departamentos) AS total_departamentos,
            (SELECT COUNT(*) FROM proyectos) AS total_proyectos,
            (SELECT ROUND(AVG(salario), 2) FROM empleados) AS salario_promedio_empresa,
            (SELECT SUM(presupuesto) FROM departamentos) AS presupuesto_total_empresa,
            (SELECT SUM(presupuesto) FROM proyectos) AS inversion_total_proyectos,
            (SELECT COUNT(*) FROM proyectos WHERE estado = 'En Progreso') AS proyectos_activos,
            (SELECT COUNT(*) FROM proyectos WHERE estado = 'Completado') AS proyectos_completados
    ),
    alertas_sistema AS (
        SELECT 
            'Departamentos sin empleados' AS tipo_alerta,
            (SELECT COUNT(*) FROM departamentos d WHERE NOT EXISTS (
                SELECT 1 FROM empleados e WHERE e.id_departamento = d.id_departamento
            )) AS cantidad
        UNION ALL
        SELECT 
            'Empleados sobre promedio salarial' AS tipo_alerta,
            (SELECT COUNT(*) FROM empleados WHERE salario > (SELECT AVG(salario) FROM empleados)) AS cantidad
        UNION ALL
        SELECT 
            'Departamentos sin proyectos' AS tipo_alerta,
            (SELECT COUNT(*) FROM departamentos d WHERE NOT EXISTS (
                SELECT 1 FROM proyectos p WHERE p.id_departamento = d.id_departamento
            )) AS cantidad
    )
    SELECT * FROM metricas_globales
'''

dashboard_result = cursor.execute(dashboard_query).fetchone()
print(f"\n📈 MÉTRICAS EMPRESARIALES CONSOLIDADAS:")
print(f"   👥 Total empleados: {dashboard_result[0]}")
print(f"   🏢 Total departamentos: {dashboard_result[1]}")
print(f"   📋 Total proyectos: {dashboard_result[2]} ({dashboard_result[6]} activos, {dashboard_result[7]} completados)")
print(f"   💰 Salario promedio empresa: ${dashboard_result[3]:,.2f}")
print(f"   💼 Presupuesto total empresa: ${dashboard_result[4]:,.2f}")
print(f"   📊 Inversión total en proyectos: ${dashboard_result[5]:,.2f}")
print(f"   ⚡ Utilización presupuestaria: {(dashboard_result[5]/dashboard_result[4]*100):.1f}%")

# Alertas del sistema
alertas_result = cursor.execute('SELECT tipo_alerta, cantidad FROM (SELECT "Departamentos sin empleados" AS tipo_alerta, (SELECT COUNT(*) FROM departamentos d WHERE NOT EXISTS (SELECT 1 FROM empleados e WHERE e.id_departamento = d.id_departamento)) AS cantidad UNION ALL SELECT "Empleados sobre promedio salarial" AS tipo_alerta, (SELECT COUNT(*) FROM empleados WHERE salario > (SELECT AVG(salario) FROM empleados)) AS cantidad UNION ALL SELECT "Departamentos sin proyectos" AS tipo_alerta, (SELECT COUNT(*) FROM departamentos d WHERE NOT EXISTS (SELECT 1 FROM proyectos p WHERE p.id_departamento = d.id_departamento)) AS cantidad)').fetchall()

print(f"\n🚨 ALERTAS DEL SISTEMA:")
for alerta in alertas_result:
    icon = "⚠️" if alerta[1] > 0 else "✅"
    print(f"   {icon} {alerta[0]}: {alerta[1]}")

# Recomendaciones automatizadas
print(f"\n🎯 RECOMENDACIONES AUTOMATIZADAS:")
print("   📊 ACCIÓN 1: Balancear carga de trabajo en departamentos de alto riesgo")
print("   💰 ACCIÓN 2: Revisar estructura salarial en departamentos 'Bajo Mercado'")
print("   🏆 ACCIÓN 3: Replicar mejores prácticas de departamentos 'Excelente'")
print("   📋 ACCIÓN 4: Asignar proyectos a departamentos sin carga de trabajo")

print("\n" + "=" * 100)
print("🎯 PROYECTO COMPLETADO - SISTEMA DE MONITOREO INDUSTRIAL FUNCIONAL")
print("✅ Integración exitosa de todos los conceptos SQL avanzados")
print("=" * 100)

## 🎓 CONSOLIDACIÓN Y EVALUACIÓN FINAL

### 📋 CHECKLIST DE CONCEPTOS DOMINADOS

Marca ✅ cada concepto que dominas completamente:

**🟢 NIVEL BÁSICO:**
- [ ] SELECT, FROM, WHERE básicos
- [ ] Filtros con operadores de comparación
- [ ] LIKE con wildcards (%, _)
- [ ] BETWEEN para rangos
- [ ] IN para valores específicos
- [ ] ORDER BY para ordenamiento
- [ ] Concatenación de strings

**🟡 NIVEL INTERMEDIO:**
- [ ] INNER JOIN y LEFT JOIN
- [ ] Funciones de agregación (COUNT, SUM, AVG, MIN, MAX)
- [ ] GROUP BY para agrupaciones
- [ ] HAVING para filtrar grupos
- [ ] Análisis estadístico con SQL
- [ ] Reportes empresariales

**🔴 NIVEL AVANZADO:**
- [ ] Subconsultas correlacionadas
- [ ] EXISTS/NOT EXISTS
- [ ] Window Functions (ROW_NUMBER, RANK)
- [ ] Common Table Expressions (CTE)
- [ ] Consultas complejas multi-tabla
- [ ] Optimización de consultas

**🏆 PROYECTO INTEGRADOR:**
- [ ] Diseño de dashboards SQL
- [ ] Métricas de negocio automatizadas
- [ ] Alertas y recomendaciones
- [ ] Integración de todos los conceptos

---

### 🧠 EVALUACIÓN FINAL DE CONOCIMIENTOS

**Responde estas preguntas para verificar tu dominio completo:**

**❓ PREGUNTA 1:** ¿Cuál es la diferencia práctica entre INNER JOIN y LEFT JOIN en un contexto industrial?
- **Tu respuesta:** _________

**❓ PREGUNTA 2:** ¿Cuándo usarías una subconsulta vs un JOIN?
- **Tu respuesta:** _________

**❓ PREGUNTA 3:** Explica cuándo usar GROUP BY vs HAVING vs WHERE
- **Tu respuesta:** _________

**❓ PREGUNTA 4:** ¿Cómo optimizarías una consulta que tarda mucho en ejecutarse?
- **Tu respuesta:** _________

**❓ PREGUNTA 5:** En el contexto de automatización industrial, ¿qué métricas SQL serían más importantes para monitorear?
- **Tu respuesta:** _________

---

### 🚀 PRÓXIMOS PASOS EN TU MAESTRÍA

**🎯 SUBMÓDULO 3.2: Python + SQLite**
- Conexión Python-BD
- Pandas + SQL
- ORM básico
- Automatización de reportes

**🎯 SUBMÓDULO 3.3: Consultas Avanzadas**
- Stored procedures
- Triggers
- Views complejas
- Performance tuning

**🎯 SUBMÓDULO 3.4: ORM con SQLAlchemy**
- Modelos de datos
- Relaciones complejas
- Migrations
- Integración con Flask

**🎯 SUBMÓDULO 3.5: Proyecto Final**
- Sistema completo de gestión industrial
- Dashboard en tiempo real
- APIs REST con bases de datos
- Deploy en producción

---

### ✅ CONFIRMACIÓN DE CONSOLIDACIÓN

**🔥 PARA MARCAR ESTE MÓDULO COMO CONSOLIDADO:**

1. ✅ Completa todos los ejercicios prácticos
2. ✅ Implementa exitosamente el proyecto integrador
3. ✅ Responde correctamente las preguntas de evaluación
4. ✅ Marca todos los ítems del checklist de conceptos
5. ✅ Practica con datos reales de tu campo industrial

**📝 Escribe "CONSOLIDADO" cuando domines completamente todos los conceptos:** _________

---

**🎉 ¡FELICITACIONES!**
Has completado exitosamente la **Fase 3.1: Bases de Datos con SQL**, base fundamental para automatización industrial con Python. ¡Continúa hacia la integración Python-SQL!