# General configuration

In [None]:
# Libraries used
import sqlite3 
import os
import pandas as pd

In [None]:
# Paths 
wd = os.getcwd()
db = "adventureworks_sql_lite.sqlite" # same archive contained in the repository
db_path = os.path.join(wd, db)


In [None]:
# Function used to display the query made with sql on python with sqlite3

def mostrar_query (query, limite = 3, dataset = True):
    cursor.execute(query)
    columnas = [desc[0] for desc in cursor.description]
    filas = cursor.fetchmany(limite)
    try:
        if dataset:
            dataset_final = pd.DataFrame(filas, columns=columnas)
            return dataset_final
        else:
            return filas
    except Exception as e:
        print (f"No se puede mostrar la consulta, la palida es: {e}")


In [None]:
# Database conection with sqlite3

conn = sqlite3.connect(db_path)
cursor = conn.cursor()

# Exercises

##  Thematic Index by Conceptual Unit


### 1. Fundamentals of SQL Querying
*Using SELECT, WHERE, LIKE, logical operators, and NULL handling.*

In [None]:
# 1. Mostrar el contenido de la tabla Person, del esquema Person.

mostrar_query("""SELECT * 
              from 'Person.Person' p""")



In [None]:
# 2. Mostrar los nombres y apelllido de cada persona que tenga como tratamiento “Ms.”

mostrar_query("""
SELECT p.FirstName, p.LastName
FROM 'Person.Person' p
WHERE p.Title LIKE 'Ms%'
""")

In [None]:
#3. Personas con “Mr.” y apellido “White”

mostrar_query("""
SELECT *
FROM 'Person.Person' p
WHERE p.Title LIKE 'Mr%' COLLATE NOCASE
  AND p.LastName LIKE '%White' COLLATE NOCASE
""")


In [None]:
# 5. Mostrar los datos de las personas que tengan asignado el tipo “SP” ó el tipo “VC”.

mostrar_query("""
SELECT * 
FROM 'Person.Person' p
WHERE p.PersonType LIKE 'EM' OR p.PersonType LIKE 'VC'
""")


In [None]:
#6. Mostrar el contenido de la tabla Employee, del esquema HumanResources

mostrar_query("""
SELECT * 
FROM 'HumanResources.Employee' AS e
""")



In [None]:
# 7. Hallar el Id y fecha de nacimiento de los empleados que tengan como función “Research and
# Development Manager” y que tengan menos de 10 “VacationHours”.


mostrar_query("""
SELECT e.BusinessEntityID AS id
FROM 'HumanResources.Employee' e
WHERE e.JobTitle = 'Research and Development Manager'
  AND e.VacationHours < 10
""")


In [None]:
# 8. ¿Cuáles son los tipos de “género” que figuran en la tabla de empleados?

mostrar_query("""
SELECT DISTINCT e.Gender 
FROM 'HumanResources.Employee' AS e
""")



In [None]:
# 9. Mostrar el id, nombres, apellido de los empleados ordenados desde el de fecha de nacimiento
# más antigua.


mostrar_query("""
SELECT p.BusinessEntityID AS id, p.FirstName, p.LastName
FROM 'HumanResources.Employee' AS e
JOIN 'Person.Person' AS p ON e.BusinessEntityID = p.BusinessEntityID
ORDER BY e.BirthDate ASC
""")


In [None]:
#10.Mostrar el contenido de la tabla Departments


mostrar_query("""
SELECT * 
FROM 'HumanResources.Department' AS d
""")



In [None]:
#11.¿Cuáles son los departamentos que están agrupados como “Manufacturing” ó como “Quality
#Assurance”?

mostrar_query("""
SELECT * 
FROM 'HumanResources.Department' AS d
WHERE d.GroupName = 'Manufacturing' OR d.GroupName = 'Quality Assurance'
""")


### 2. Joins and Table Relationships  


In [None]:
# Ejercicio 12 - ¿Cuáles son los datos de los departamentos cuyo nombre esté relacionado con “Production”?
mostrar_query(""" 
SELECT * 
FROM 'HumanResources.Department' AS d
WHERE d.Name LIKE 'Production'
""")


In [None]:
# Ejercicio 13 - Mostrar los datos de los departamentos que no estén agrupados como “Research and Develpment”
mostrar_query(""" 
SELECT * 
FROM 'HumanResources.Department' AS d
WHERE d.Name NOT LIKE 'Research and Develpment'
""")


In [None]:
# Ejercicio 14 - Mostrar los datos de la tabla Product del esquema Production
mostrar_query(""" 
SELECT * 
FROM 'Production.Product' AS p
""")

In [None]:
# Ejercicio 15 - Hallar los productos que no tengan asignado color.
mostrar_query(""" 
SELECT * 
FROM 'Production.Product' AS p
WHERE p.Color IS NULL
""")


In [None]:
# Ejercicio 16 - Para todos los productos que tengan asignado algún color y que tengan un stock (SafetyStockLevel) mayor a 900, 
# mostrar su id, nombre y color. Ordenarlo por id descendente y por color ascendente.
mostrar_query(""" 
SELECT p.ProductID, p.Name, p.Color 
FROM 'Production.Product' AS p
WHERE p.Color IS NOT NULL AND p.SafetyStockLevel > 900
ORDER BY p.ProductID DESC, p.Color ASC
""")


In [None]:
# Ejercicio 32a - Verificar si existe una Foreign Key entre Employee y Person
mostrar_query("""
PRAGMA foreign_key_list('HumanResources.Employee')
""")

# Ejercicio 32b - Obtener el nombre, apellido, cargo y fecha de nacimiento de todos los empleados.
mostrar_query(""" 
SELECT e.BusinessEntityID, p.FirstName, p.LastName, e.JobTitle, e.BirthDate 
FROM 'HumanResources.Employee' AS e
LEFT JOIN 'Person.Person' AS p ON e.BusinessEntityID = p.BusinessEntityID
""")

# Ejercicio 32c - Obtener el nombre y apellido de los empleados que nacieron durante el año 1986 y su “género” es F.
mostrar_query(""" 
SELECT e.BusinessEntityID, p.FirstName, p.LastName, e.JobTitle, e.BirthDate 
FROM 'HumanResources.Employee' AS e
LEFT JOIN 'Person.Person' AS p ON e.BusinessEntityID = p.BusinessEntityID
WHERE strftime('%Y', e.BirthDate) = '1986' AND e.Gender = 'F'
""")

# Ejercicio 32d - Contar la cantidad de empleados cuyo nombre comience con la letra “J” y hayan nacido después del año 1977.
mostrar_query(""" 
SELECT COUNT(e.BusinessEntityID) 
FROM 'HumanResources.Employee' AS e
LEFT JOIN 'Person.Person' AS p ON e.BusinessEntityID = p.BusinessEntityID
WHERE strftime('%Y', e.BirthDate) > '1977' AND p.FirstName LIKE 'J%'
""")

# Ejercicio 32e - Para las mismas condiciones del punto anterior, ¿cuántos empleados están registrados según su género?
mostrar_query(""" 
SELECT e.Gender, COUNT(e.BusinessEntityID) 
FROM 'HumanResources.Employee' AS e
LEFT JOIN 'Person.Person' AS p ON e.BusinessEntityID = p.BusinessEntityID
WHERE strftime('%Y', e.BirthDate) > '1977' AND p.FirstName LIKE 'J%'
GROUP BY e.Gender
""")


In [None]:
# Ejercicio 33a - Obtener nombre, apellido y StoreID para aquellos clientes que estén en TerritoryID = 4 o que pertenezcan al tipo de persona 'SC'
mostrar_query(""" 
SELECT 
  p.FirstName, 
  p.LastName, 
  c.StoreID
FROM 'Sales.Customer' AS c
LEFT JOIN 'Person.Person' AS p 
  ON c.PersonID = p.BusinessEntityID
WHERE c.TerritoryID = 4 
   OR p.PersonType = 'SC'
""")

# Ejercicio 33b - Obtener nombre, apellido y número de orden (SalesOrderID) para los clientes que pertenezcan al tipo de persona 'SC'
mostrar_query(""" 
SELECT 
  p.FirstName, 
  p.LastName, 
  soh.SalesOrderID
FROM 'Sales.Customer' AS c
LEFT JOIN 'Person.Person' AS p 
  ON c.PersonID = p.BusinessEntityID
LEFT JOIN 'Sales.SalesOrderHeader' AS soh 
  ON c.CustomerID = soh.CustomerID
WHERE p.PersonType = 'SC'
""")



In [None]:
# Ejercicio 34a - Descripción, tamaño y descripción de modelo de productos sin color y con SafetyStockLevel < 1000
mostrar_query(""" 
SELECT 
  pd.Description, 
  p.Size, 
  pm.CatalogDescription 
FROM 'Production.Product' AS p
LEFT JOIN 'Production.ProductModel' AS pm 
  ON p.ProductModelID = pm.ProductModelID 
LEFT JOIN 'Production.ProductModelProductDescriptionCulture' AS pmpdc 
  ON pm.ProductModelID = pmpdc.ProductModelID 
LEFT JOIN 'Production.ProductDescription' AS pd 
  ON pmpdc.ProductDescriptionID = pd.ProductDescriptionID
WHERE p.Color IS NULL AND p.SafetyStockLevel < 1000
""")






In [None]:
# Ejercicio 34b - Obtener ventas de junio y julio de 2011, incluyendo nombre, apellido del cliente, nro de venta, fecha, nombre y descripción del producto.
mostrar_query(""" 
SELECT 
  p.FirstName, 
  p.LastName, 
  soh.SalesOrderID, 
  soh.OrderDate, 
  pt.Name, 
  pd.Description
FROM 'Sales.SalesOrderHeader' AS soh
LEFT JOIN 'Sales.Customer' AS c 
  ON soh.CustomerID = c.CustomerID 
LEFT JOIN 'Person.Person' AS p 
  ON c.PersonID = p.BusinessEntityID
LEFT JOIN 'Sales.SalesOrderDetail' AS sod 
  ON soh.SalesOrderID = sod.SalesOrderID
LEFT JOIN 'Production.Product' AS pt 
  ON sod.ProductID = pt.ProductID
LEFT JOIN 'Production.ProductModelProductDescriptionCulture' AS pmpdc 
  ON pt.ProductModelID = pmpdc.ProductModelID AND pmpdc.CultureID = 'en'
LEFT JOIN 'Production.ProductDescription' AS pd 
  ON pmpdc.ProductDescriptionID = pd.ProductDescriptionID
WHERE strftime('%Y', soh.OrderDate) = '2011' 
  AND strftime('%m', soh.OrderDate) IN ('06', '07')
""")

In [None]:
# Ejercicio 38  - Mostrar el ID de todos los vendedores y el ID de la venta (si existió), con revisión 9 en 2013.
mostrar_query(""" 
SELECT sp.BusinessEntityID, soh.SalesOrderID
FROM 'Sales.SalesPerson' AS sp  
LEFT JOIN 'Sales.SalesOrderHeader' AS soh 
    ON sp.BusinessEntityID = soh.SalesPersonID 
    AND soh.RevisionNumber = 9 
    AND strftime('%Y', soh.OrderDate) = '2013'
""")


In [None]:
# Ejercicio 39 - Mostrar ID, nombre y apellido de los vendedores junto con el ID de venta (revisión 9, año 2013). Incluir vendedores sin ventas.
mostrar_query(""" 
SELECT sp.BusinessEntityID, p.FirstName, p.LastName, soh.SalesOrderID
FROM 'Sales.SalesPerson' AS sp  
LEFT JOIN 'Person.Person' AS p 
  ON sp.BusinessEntityID = p.BusinessEntityID 
LEFT JOIN 'Sales.SalesOrderHeader' AS soh 
  ON sp.BusinessEntityID = soh.SalesPersonID 
     AND soh.RevisionNumber = 9 
     AND strftime('%Y', soh.OrderDate) = '2013'
""")


### 3. Aggregation, Grouping, and Scalar Functions  


In [None]:
# Ejercicio 17 - Hallar el Id y el nombre de los productos cuyo nombre comience con “Chain”
mostrar_query(""" 
SELECT p.ProductID, p.Name 
FROM 'Production.Product' AS p
WHERE p.Name LIKE 'Chain%'
""")


In [None]:
# Ejercicio 18 - Hallar el Id y el nombre de los productos cuyo nombre contenga “helmet”
mostrar_query(""" 
SELECT p.ProductID, p.Name 
FROM 'Production.Product' AS p
WHERE p.Name LIKE '%helmet%'
""")


In [None]:
# Ejercicio 19 - Modificar la consulta anterior para que retorne aquellos productos cuyo nombre no contenga “helmet”
mostrar_query(""" 
SELECT p.ProductID, p.Name 
FROM 'Production.Product' AS p
WHERE p.Name NOT LIKE '%helmet%'
""")


In [None]:
# Ejercicio 20 - Mostrar los datos principales de las personas (tabla Person) cuyo LastName termine con “es” y contenga en total 5 caracteres.
mostrar_query(""" 
SELECT * 
FROM 'Person.Person' AS p
WHERE p.LastName LIKE '___es'
""")


In [None]:
# Ejercicio 21 - Usando la tabla SpecialOffer del esquema Sales, mostrar la diferencia entre MinQty y MaxQty, con el id y descripción.
mostrar_query(""" 
SELECT so.SpecialOfferID, so.Description, so.MaxQty - so.MinQty AS DeltaQty
FROM 'Sales.SpecialOffer' AS so
""")


In [None]:
# Ejercicio 23 - Para resolver el problema anterior, usar la función ISNULL para, cuando no tengan asignado valor, reemplazarlo en el cálculo por 0 (cero).
mostrar_query(""" 
SELECT 
  IFNULL(so.MaxQty, 0) - IFNULL(so.MinQty, 0) AS DeltaQty
FROM 'Sales.SpecialOffer' AS so
""")


In [None]:
# Ejercicio 24 - ¿Cuántos clientes están almacenados en la tabla Customers?
mostrar_query(""" 
SELECT COUNT(c.CustomerID) 
FROM 'Sales.Customer' AS c
""")



In [None]:
# Ejercicio 25 (primera parte) - ¿Cuál es la cantidad de clientes por tienda?
mostrar_query(""" 
SELECT c.StoreID, COUNT(c.CustomerID) AS CantidadClientes
FROM 'Sales.Customer' AS c
GROUP BY c.StoreID
""")

# Ejercicio 25 (segunda parte) - ¿Cuál es la cantidad de clientes por territorio?
mostrar_query(""" 
SELECT c.TerritoryID, COUNT(c.CustomerID) AS CantidadClientes
FROM 'Sales.Customer' AS c
GROUP BY c.TerritoryID
""")

# Ejercicio 25 (tercera parte) - ¿Cuáles son las tiendas (su Id) asociadas al territorio Id 4 que tienen menos de 2 clientes?
mostrar_query(""" 
SELECT c.StoreID 
FROM 'Sales.Customer' AS c
GROUP BY c.StoreID, c.TerritoryID
HAVING COUNT(c.CustomerID) < 2 AND c.TerritoryID = 4
""")


In [None]:
# Ejercicio 26 - Para la tabla SalesOrderDetail del esquema Sales, calcular cuál es la cantidad total de items ordenados (OrderQty) para el producto con Id igual a 778.
mostrar_query(""" 
SELECT COUNT(sod.OrderQty)  
FROM 'Sales.SalesOrderDetail' AS sod 
WHERE sod.ProductID = 778
""")


In [None]:
# Ejercicio 27a - ¿Cuál es el precio unitario más caro vendido?
mostrar_query(""" 
SELECT MAX(sod.UnitPrice)  
FROM 'Sales.SalesOrderDetail' AS sod
""")

# Ejercicio 27b - ¿Cuál es el número total de items ordenado para cada producto?
mostrar_query(""" 
SELECT sod.ProductID, COUNT(sod.OrderQty)  
FROM 'Sales.SalesOrderDetail' AS sod
GROUP BY sod.ProductID
""")

# Ejercicio 27c - ¿Cuál es la cantidad de líneas de cada orden?
mostrar_query(""" 
SELECT sod.SalesOrderID, COUNT(sod.ProductID)  
FROM 'Sales.SalesOrderDetail' AS sod
GROUP BY sod.SalesOrderID
""")

# Ejercicio 27d - ¿Cuál es la cantidad de líneas de cada orden, sólo para aquellas órdenes que tengan más de 3 líneas? Ordenar por id de orden descendente.
mostrar_query(""" 
SELECT sod.SalesOrderID, COUNT(sod.ProductID)  
FROM 'Sales.SalesOrderDetail' AS sod
GROUP BY sod.SalesOrderID
HAVING COUNT(sod.ProductID) > 3
ORDER BY sod.SalesOrderID DESC
""")

# Ejercicio 27e - ¿Cuál es el importe total (LineTotal) de cada orden, para aquellas que tengan menos de 3 líneas?
mostrar_query(""" 
SELECT sod.SalesOrderID, SUM(sod.LineTotal) AS lt 
FROM 'Sales.SalesOrderDetail' AS sod
GROUP BY sod.SalesOrderID 
HAVING COUNT(sod.SalesOrderID) < 3
""")

# Ejercicio 27f - ¿Cuál es la cantidad distinta de productos ordenados?
mostrar_query(""" 
SELECT COUNT(DISTINCT sod.SalesOrderID)  
FROM 'Sales.SalesOrderDetail' AS sod
""")


In [None]:
# Ejercicio 28 - Usando la tabla SalesOrderHeader, ¿cuál es la cantidad de órdenes emitidas en cada año?
mostrar_query(""" 
SELECT strftime('%Y', soh.OrderDate) AS Anio, COUNT(soh.SalesOrderID) 
FROM 'Sales.SalesOrderHeader' AS soh
GROUP BY strftime('%Y', soh.OrderDate)
""")


In [None]:
# Ejercicio 29 - Usando la tabla SalesOrderHeader, ¿cuál es la cantidad de órdenes emitidas para cada cliente en cada año?
mostrar_query(""" 
SELECT soh.CustomerID, strftime('%Y', soh.OrderDate) AS Anio, COUNT(soh.SalesOrderID) 
FROM 'Sales.SalesOrderHeader' AS soh
GROUP BY soh.CustomerID, strftime('%Y', soh.OrderDate)
""")


In [None]:
# Ejercicio 30 - Para los empleados, contar la cantidad de empleados solteros nacidos por año y por género, 
# para aquellos años donde hayan nacido más de 10 empleados.
mostrar_query(""" 
SELECT strftime('%Y', e.BirthDate) AS Anio, e.Gender, COUNT(e.LoginID) AS Cantidad 
FROM 'HumanResources.Employee' AS e
GROUP BY strftime('%Y', e.BirthDate), e.Gender
HAVING COUNT(e.LoginID) > 10
""")


In [None]:
# Ejercicio 31a - ¿Cuál es el promedio del precio de lista por color de producto?
mostrar_query(""" 
SELECT p.Color, AVG(p.ListPrice) AS PromedioPrecio 
FROM 'Production.Product' AS p 
GROUP BY p.Color
""")


# Ejercicio 31b - ¿Cuál es el promedio del precio de lista por color de producto para aquellos colores que tengan más de 15 productos?
mostrar_query(""" 
SELECT p.Color, AVG(p.ListPrice) AS PromedioPrecio 
FROM 'Production.Product' AS p 
GROUP BY p.Color 
HAVING COUNT(p.Color) > 15
""")


### 4. Logical Modeling and Cross-Analysis  


In [None]:
# Ejercicio 40 - Mostrar todos los vendedores junto con los productos que han vendido (si los vendieron)
mostrar_query(""" 
SELECT 
  sp.BusinessEntityID, 
  p.ProductID
FROM 'Sales.SalesPerson' AS sp  
LEFT JOIN 'Sales.SalesOrderHeader' AS soh 
  ON sp.BusinessEntityID = soh.SalesPersonID 
LEFT JOIN 'Sales.SalesOrderDetail' AS sod 
  ON soh.SalesOrderID = sod.SalesOrderID 
LEFT JOIN 'Production.Product' AS p 
  ON sod.ProductID = p.ProductID
""")


In [None]:
# Ejercicio 41 - Mostrar todos los valores de BusinessEntityID de SalesPerson junto a cada ProductID de Product (producto cartesiano)
mostrar_query(""" 
SELECT 
  sp.BusinessEntityID, 
  p.ProductID
FROM 'Sales.SalesPerson' AS sp
CROSS JOIN 'Production.Product' AS p
""")


In [None]:
# Ejercicio 42 - Contar cuántas personas están registradas por tipo de contacto (ContactTypeID). Ordenar por cantidad descendente.
mostrar_query(""" 
SELECT 
  bec.ContactTypeID, 
  COUNT(p.BusinessEntityID) AS CantidadPersonas
FROM 'Person.Person' AS p
LEFT JOIN 'Person.BusinessEntityContact' AS bec 
  ON p.BusinessEntityID = bec.PersonID
GROUP BY bec.ContactTypeID
ORDER BY CantidadPersonas DESC
""")


In [None]:
# Ejercicio 44 - Calcular la suma de las cuotas de ventas históricas por persona y año. Mostrar el apellido.
mostrar_query(""" 
SELECT 
  strftime('%Y', spqh.QuotaDate) AS Anio, 
  spqh.BusinessEntityID, 
  p.LastName, 
  SUM(spqh.SalesQuota) AS TotalQuota
FROM 'Sales.SalesPersonQuotaHistory' AS spqh
JOIN 'Person.Person' AS p ON spqh.BusinessEntityID = p.BusinessEntityID
GROUP BY Anio, spqh.BusinessEntityID, p.LastName
""")


In [None]:
# Ejercicio 45 - Calcular el total vendido por territorio para aquellos con más de 100 ventas. Mostrar ID, nombre del territorio y suma de ventas.
mostrar_query(""" 
SELECT 
  soh.TerritoryID, 
  st.Name, 
  COUNT(soh.SalesOrderID) AS CantidadOrdenes, 
  SUM(sod.LineTotal) AS TotalVendido
FROM 'Sales.SalesOrderHeader' AS soh
JOIN 'Sales.SalesTerritory' AS st ON soh.TerritoryID = st.TerritoryID
JOIN 'Sales.SalesOrderDetail' AS sod ON soh.SalesOrderID = sod.SalesOrderID
GROUP BY soh.TerritoryID, st.Name 
HAVING COUNT(soh.SalesOrderID) >= 100
""")


In [None]:
# Ejercicio 46 - Mostrar ID y nombre de provincias con más de 1000 domicilios registrados.
mostrar_query(""" 
SELECT 
  sp.StateProvinceID, 
  sp.Name, 
  COUNT(a.AddressID) AS CantidadDomicilios
FROM 'Person.StateProvince' AS sp
JOIN 'Person.Address' AS a ON sp.StateProvinceID = a.StateProvinceID
GROUP BY sp.StateProvinceID, sp.Name
HAVING COUNT(a.AddressID) > 1000
""")


### 5. Subqueries and Common Table Expressions (CTEs)  
*Modular SQL logic with CTEs. Replacing correlated subqueries. Query chaining.*

In [None]:
# Ejercicio 48 (versión optimizada) - Calcular métricas por cliente una sola vez con CTE y luego unir con las órdenes
mostrar_query("""
WITH op1 (cus, c, a, min, max) AS (
  SELECT 
    CustomerID, 
    COUNT(*), 
    AVG(TotalDue), 
    MIN(TotalDue), 
    MAX(TotalDue)
  FROM 'Sales.SalesOrderHeader' AS soh
  GROUP BY soh.CustomerID
)
SELECT 
  soh.SalesOrderID, 
  op1.cus AS CustomerID,
  op1.c AS CountOfSales, 
  op1.a AS AvgSale,
  op1.min AS LowestSale, 
  op1.max AS HighestSale
FROM op1 
JOIN 'Sales.SalesOrderHeader' AS soh ON op1.cus = soh.CustomerID
""")


In [None]:
# Ejercicio 49 - Devolver una lista de los clientes con los productos solicitados en su pedido más reciente
mostrar_query(""" 
WITH fecha_ultima_compra AS (
  SELECT soh.CustomerID, soh.SalesOrderID, soh.OrderDate
  FROM 'Sales.SalesOrderHeader' AS soh
  WHERE soh.OrderDate = (
    SELECT MAX(soh2.OrderDate)
    FROM 'Sales.SalesOrderHeader' AS soh2
    WHERE soh2.CustomerID = soh.CustomerID
  )
)
SELECT 
  fuc.CustomerID, 
  p.Name AS NombreProducto
FROM fecha_ultima_compra AS fuc
LEFT JOIN 'Sales.SalesOrderDetail' AS sod ON sod.SalesOrderID = fuc.SalesOrderID
LEFT JOIN 'Production.Product' AS p ON sod.ProductID = p.ProductID
""")


In [None]:
# Ejercicio 50 - Mostrar el Rate del empleado y el promedio de Rate del departamento actual (usando CTE)
mostrar_query("""
WITH promedio_departamento AS (
  SELECT 
    edh2.DepartmentID, 
    AVG(eph2.Rate) AS avg_dep 
  FROM 'HumanResources.Employee' AS e2
  LEFT JOIN 'HumanResources.EmployeeDepartmentHistory' AS edh2 
    ON e2.BusinessEntityID = edh2.BusinessEntityID
  LEFT JOIN 'HumanResources.EmployeePayHistory' AS eph2 
    ON edh2.BusinessEntityID = eph2.BusinessEntityID
  WHERE edh2.EndDate IS NULL
  GROUP BY edh2.DepartmentID
)
SELECT 
  e.BusinessEntityID, 
  edh.DepartmentID, 
  eph.Rate, 
  pd.avg_dep 
FROM 'HumanResources.Employee' AS e
LEFT JOIN 'HumanResources.EmployeeDepartmentHistory' AS edh 
  ON e.BusinessEntityID = edh.BusinessEntityID AND edh.EndDate IS NULL
LEFT JOIN promedio_departamento AS pd 
  ON edh.DepartmentID = pd.DepartmentID
LEFT JOIN 'HumanResources.EmployeePayHistory' AS eph 
  ON edh.BusinessEntityID = eph.BusinessEntityID
""")


### 6. Business-Oriented Query Applications  

*Customer behavior analysis, employee efficiency, detecting unsold or incomplete records.*



In [None]:
# Ejercicio 36 - Mostrar la descripción de los productos y el ID de la orden de venta. Incluir productos que nunca se hayan vendido.
mostrar_query(""" 
SELECT pd.Description, sod.SalesOrderDetailID
FROM 'Production.Product' AS pt
LEFT JOIN 'Production.ProductModelProductDescriptionCulture' AS pmpdc 
  ON pt.ProductModelID = pmpdc.ProductModelID AND pmpdc.CultureID = 'en'
LEFT JOIN 'Production.ProductDescription' AS pd 
  ON pmpdc.ProductDescriptionID = pd.ProductDescriptionID
LEFT JOIN 'Sales.SalesOrderDetail' AS sod 
  ON pt.ProductID = sod.ProductID
""")


In [None]:
# Ejercicio 37 - Mostrar la descripción de los productos que nunca hayan sido vendidos.
mostrar_query(""" 
SELECT DISTINCT pd.Description
FROM 'Production.Product' AS pt
LEFT JOIN 'Production.ProductModelProductDescriptionCulture' AS pmpdc 
  ON pt.ProductModelID = pmpdc.ProductModelID AND pmpdc.CultureID = 'en'
LEFT JOIN 'Production.ProductDescription' AS pd 
  ON pmpdc.ProductDescriptionID = pd.ProductDescriptionID
LEFT JOIN 'Sales.SalesOrderDetail' AS sod 
  ON pt.ProductID = sod.ProductID
WHERE sod.SalesOrderDetailID IS NULL AND pd.Description IS NOT NULL
""")


In [None]:
# Ejercicio 43 - Mostrar nombre y apellido de los empleados que viven en el estado de “Oregon”
mostrar_query(""" 
SELECT p.FirstName, p.LastName
FROM 'HumanResources.Employee' AS e
LEFT JOIN 'Person.Person' AS p ON p.BusinessEntityID = e.BusinessEntityID 
LEFT JOIN 'Person.BusinessEntityAddress' AS bea ON p.BusinessEntityID = bea.BusinessEntityID
LEFT JOIN 'Person.Address' AS a ON bea.AddressID = a.AddressID
LEFT JOIN 'Person.StateProvince' AS sp ON a.StateProvinceID = sp.StateProvinceID 
WHERE sp.Name = 'Oregon'
""")


In [None]:
# Ejercicio 47 - Usar CTE para calcular el máximo, mínimo y promedio de productos en locaciones (tabla ProductInventory)
mostrar_query(""" 
WITH productos (locacion, cantidad) AS (
  SELECT 
    LocationID, 
    SUM(pi2.Quantity) 
  FROM 'Production.ProductInventory' AS pi2
  LEFT JOIN 'Production.Product' AS p ON pi2.ProductID = p.ProductID
  GROUP BY LocationID
)
SELECT 
  AVG(cantidad) AS Promedio, 
  MIN(cantidad) AS Minimo, 
  MAX(cantidad) AS Maximo 
FROM productos
""")


### 7. Window Functions

In [None]:
# Ejercicio 51 - Obtener el ranking de empleados por salario actual dentro de cada departamento
mostrar_query("""
SELECT 
  e.BusinessEntityID, 
  RANK() OVER(PARTITION BY edh.DepartmentID ORDER BY eph.Rate) AS ranking_departamento
FROM 'HumanResources.Employee' AS e
JOIN 'HumanResources.EmployeePayHistory' AS eph 
  ON e.BusinessEntityID = eph.BusinessEntityID
JOIN 'HumanResources.EmployeeDepartmentHistory' AS edh 
  ON e.BusinessEntityID = edh.BusinessEntityID
WHERE eph.RateChangeDate = (
  SELECT MAX(eph2.RateChangeDate) 
  FROM 'HumanResources.EmployeePayHistory' AS eph2
  WHERE eph2.BusinessEntityID = e.BusinessEntityID
)
""")


In [None]:
# Ejercicio 52 - Enumerar las órdenes de venta con ROW_NUMBER en orden por SalesOrderID
mostrar_query("""
SELECT 
  soh.SalesOrderID, 
  DATE(soh.OrderDate) AS OrderDate, 
  ROW_NUMBER() OVER (ORDER BY soh.SalesOrderID) AS RankOrderID
FROM 'Sales.SalesOrderHeader' AS soh
""")


In [None]:
# Ejercicio 53 - Calcular el promedio de salario por empleado usando función de ventana AVG OVER
mostrar_query("""
SELECT DISTINCT 
  xd.BusinessEntityID, 
  xd.AvgSalario
FROM (
  SELECT 
    e.BusinessEntityID, 
    AVG(eph.Rate) OVER (PARTITION BY eph.BusinessEntityID) AS AvgSalario
  FROM 'HumanResources.Employee' AS e
  LEFT JOIN 'HumanResources.EmployeePayHistory' AS eph 
    ON e.BusinessEntityID = eph.BusinessEntityID
) AS xd
""")


In [None]:
# Ejercicio 54 - Calcular el acumulado de SubTotal por cliente a lo largo del tiempo
mostrar_query("""
SELECT 
  soh.CustomerID, 
  soh.SalesOrderID, 
  DATE(soh.OrderDate) AS OrderDate, 
  SUM(soh.SubTotal) OVER (
    PARTITION BY soh.CustomerID 
    ORDER BY soh.OrderDate
  ) AS AcumuladoCliente
FROM 'Sales.SalesOrderHeader' AS soh
""")


In [None]:
# Ejercicio 56 - Mostrar el salario actual de cada empleado y la diferencia con respecto al salario del empleado anterior
mostrar_query("""
SELECT 
  eph.BusinessEntityID, 
  eph.Rate AS sueldo_actual, 
  eph.Rate - LAG(eph.Rate, 1) OVER (ORDER BY eph.BusinessEntityID) AS diferencia_con_anterior
FROM 'HumanResources.EmployeePayHistory' AS eph
WHERE eph.RateChangeDate = (
  SELECT MAX(eph2.RateChangeDate)
  FROM 'HumanResources.EmployeePayHistory' AS eph2
  WHERE eph.BusinessEntityID = eph2.BusinessEntityID
)
""")



In [None]:
# Ejercicio 57 - Obtener salario actual y extremos salariales dentro del departamento (MIN/MAX con OVER y CTE)
mostrar_query("""
WITH salario_actual AS (
  SELECT 
    eph.BusinessEntityID, 
    eph.Rate
  FROM 'HumanResources.EmployeePayHistory' AS eph
  WHERE eph.RateChangeDate = (
    SELECT MAX(eph2.RateChangeDate)
    FROM 'HumanResources.EmployeePayHistory' AS eph2 
    WHERE eph.BusinessEntityID = eph2.BusinessEntityID
  )
)
SELECT 
  e.BusinessEntityID,
  sa.Rate AS salario_actual,
  MAX(sa.Rate) OVER (PARTITION BY edh.DepartmentID) AS maximo_departamento,
  MIN(sa.Rate) OVER (PARTITION BY edh.DepartmentID) AS minimo_departamento
FROM 'HumanResources.Employee' AS e
LEFT JOIN salario_actual AS sa ON e.BusinessEntityID = sa.BusinessEntityID
LEFT JOIN 'HumanResources.EmployeeDepartmentHistory' AS edh 
  ON e.BusinessEntityID = edh.BusinessEntityID
""")


In [None]:
# Ejercicio 58 - Mostrar empleados cuyo salario actual es mayor al promedio del departamento
mostrar_query("""
WITH salario_actual AS (
  SELECT 
    eph.BusinessEntityID, 
    eph.Rate
  FROM 'HumanResources.EmployeePayHistory' AS eph
  WHERE eph.RateChangeDate = (
    SELECT MAX(eph2.RateChangeDate)
    FROM 'HumanResources.EmployeePayHistory' AS eph2 
    WHERE eph.BusinessEntityID = eph2.BusinessEntityID
  )
)
SELECT 
  e.BusinessEntityID
FROM 'HumanResources.Employee' AS e
LEFT JOIN salario_actual AS sa ON e.BusinessEntityID = sa.BusinessEntityID
LEFT JOIN 'HumanResources.EmployeeDepartmentHistory' AS edh ON e.BusinessEntityID = edh.BusinessEntityID
WHERE sa.Rate > (
  SELECT AVG(sa2.Rate)
  FROM 'HumanResources.Employee' AS e2
  LEFT JOIN salario_actual AS sa2 ON e2.BusinessEntityID = sa2.BusinessEntityID
  LEFT JOIN 'HumanResources.EmployeeDepartmentHistory' AS edh2 ON e2.BusinessEntityID = edh2.BusinessEntityID
  WHERE edh2.DepartmentID = edh.DepartmentID
)
""")


In [None]:
# Ejercicio 59 - Calcular la diferencia de días entre una orden y la anterior del mismo cliente
mostrar_query("""
SELECT 
  soh.CustomerID,
  DATE(soh.OrderDate) AS OrderDate,
  JULIANDAY(soh.OrderDate) - JULIANDAY(
    LAG(soh.OrderDate, 1) OVER (
      PARTITION BY soh.CustomerID 
      ORDER BY soh.OrderDate DESC
    )
  ) AS dias_desde_ultima_orden
FROM 'Sales.SalesOrderHeader' AS soh
""")


In [None]:
# Ejercicio 60 - Rankear categorías por cantidad de productos y mostrar solo las top 3
mostrar_query("""
WITH cantidad_ventas AS (
  SELECT 
    pc.ProductCategoryID, 
    COUNT(p.ProductID) OVER (PARTITION BY pc.ProductCategoryID) AS cantidad_productos
  FROM 'Production.ProductCategory' AS pc 
  LEFT JOIN 'Production.ProductSubcategory' AS ps 
    ON pc.ProductCategoryID = ps.ProductCategoryID
  LEFT JOIN 'Production.Product' AS p 
    ON ps.ProductSubcategoryID = p.ProductSubcategoryID
)
SELECT *
FROM (
  SELECT 
    pc.ProductCategoryID, 
    cp.cantidad_productos,
    DENSE_RANK() OVER (
      ORDER BY cp.cantidad_productos DESC
    ) AS rango_productos
  FROM 'Production.ProductCategory' AS pc  
  LEFT JOIN cantidad_ventas AS cp ON pc.ProductCategoryID = cp.ProductCategoryID
)
WHERE rango_productos <= 3
""")


In [None]:
# Ejercicio 61 Mostrar las 3 subcategorías con más productos por cada categoría
mostrar_query("""
WITH cantidad_ventas AS (
  SELECT 
    ps.ProductSubcategoryID,
    COUNT(p.ProductID) OVER (PARTITION BY ps.ProductSubcategoryID) AS cantidad_productos_subcategoria
  FROM 'Production.ProductSubcategory' AS ps
  LEFT JOIN 'Production.Product' AS p 
    ON ps.ProductSubcategoryID = p.ProductSubcategoryID
)

SELECT *
FROM (
  SELECT 
    pc.ProductCategoryID,
    ps.ProductSubcategoryID,
    cp.cantidad_productos_subcategoria,
    DENSE_RANK() OVER (
      PARTITION BY pc.ProductCategoryID 
      ORDER BY cp.cantidad_productos_subcategoria DESC
    ) AS rango_productos
  FROM 'Production.ProductCategory' AS pc
  LEFT JOIN 'Production.ProductSubcategory' AS ps 
    ON pc.ProductCategoryID = ps.ProductCategoryID
  LEFT JOIN cantidad_ventas AS cp 
    ON ps.ProductSubcategoryID = cp.ProductSubcategoryID
) AS TABLITA
WHERE rango_productos <= 3
ORDER BY ProductCategoryID ASC, rango_productos ASC;
""")


In [None]:
# Ejercicio 61 - Calcular diferencias sucesivas entre cambios salariales por empleado
mostrar_query("""
SELECT *
FROM (
  SELECT 
    eph.BusinessEntityID, 
    DATE(eph.RateChangeDate) AS fecha, 
    eph.Rate,
    eph.Rate - LAG(eph.Rate, 1) OVER (
      PARTITION BY eph.BusinessEntityID 
      ORDER BY eph.RateChangeDate ASC
    ) AS diferencia
  FROM 'HumanResources.EmployeePayHistory' AS eph
) AS sc
WHERE sc.diferencia IS NOT NULL
ORDER BY sc.BusinessEntityID, sc.fecha ASC;
""")

### 8. Time Functions

In [None]:
# Ejercicio 62 - Mostrar los 10 pedidos más recientes realizados en la tabla Sales.SalesOrderHeader.Incluir la fecha del pedido (OrderDate) y el ID del cliente (CustomerID).
mostrar_query("""
SELECT SalesOrderID, DATE(OrderDate) AS OrderDate, CustomerID
FROM 'Sales.SalesOrderHeader'
ORDER BY OrderDate DESC
LIMIT 10
""")


In [None]:
# Ejercicio 63 - Calcular cuántos días pasaron entre la fecha del pedido (OrderDate) y la fecha de envío (ShipDate).Mostrar solo los pedidos donde la diferencia fue mayor a 5 días.
mostrar_query("""
SELECT SalesOrderID, 
       JULIANDAY(ShipDate) - JULIANDAY(OrderDate) AS diferencia_envio
FROM 'Sales.SalesOrderHeader'
WHERE JULIANDAY(ShipDate) - JULIANDAY(OrderDate) > 5
""")


In [None]:
# Ejercicio 64 - Contar cuántos pedidos se hicieron por mes durante el año 2013. Mostrar número y nombre del mes, y total de pedidos
mostrar_query("""
SELECT STRFTIME('%m', OrderDate) AS mes_num,
       STRFTIME('%m', OrderDate) || ' - ' || STRFTIME('%B', OrderDate) AS nombre_mes,
       COUNT(SalesOrderID) AS total_pedidos
FROM 'Sales.SalesOrderHeader'
WHERE STRFTIME('%Y', OrderDate) = '2013'
GROUP BY mes_num, nombre_mes
ORDER BY mes_num
""")


In [None]:
# Ejercicio 65 - Mostrar una lista de empleados con su fecha de contratación (HireDate) y cuántos años llevan trabajando. Ordenar por antigüedad descendente.
mostrar_query("""
SELECT DATE(HireDate) AS fecha_contratacion,
       CAST(STRFTIME('%Y', 'now') AS INTEGER) - CAST(STRFTIME('%Y', HireDate) AS INTEGER) AS antiguedad
FROM 'HumanResources.Employee'
ORDER BY antiguedad DESC
""")


### 9. Geografical Functions

In [None]:
# Ejercicio 65 - Antigüedad de empleados
mostrar_query("""
SELECT DATE(HireDate) AS fecha_contratacion,
       CAST(STRFTIME('%Y', 'now') AS INTEGER) - CAST(STRFTIME('%Y', HireDate) AS INTEGER) AS antiguedad
FROM 'HumanResources.Employee'
ORDER BY antiguedad DESC
""")


In [None]:
# Ejercicio 66 - Direcciones más cercanas (simulado con distancia euclídea)
mostrar_query("""
SELECT AddressID, AddressLine1, City,
       ((Latitude - 47.6062)*(Latitude - 47.6062) + 
        (Longitude + 122.3321)*(Longitude + 122.3321)) AS DistanciaAproximada
FROM 'Person.Address'
WHERE Latitude IS NOT NULL AND Longitude IS NOT NULL
ORDER BY DistanciaAproximada ASC
LIMIT 10
""")


In [None]:
# Ejercicio 67 - Direcciones dentro de un radio de 50km (aproximado)
mostrar_query("""
SELECT AddressID, AddressLine1, City
FROM 'Person.Address'
WHERE Latitude IS NOT NULL AND Longitude IS NOT NULL
AND ((Latitude - 47.6062)*(Latitude - 47.6062) + 
     (Longitude + 122.3321)*(Longitude + 122.3321)) <= 0.25
""")


In [None]:
# Ejercicio 68 - Direcciones con representación WKT
mostrar_query("""
SELECT AddressID, AddressLine1, City,
       'POINT(' || Longitude || ' ' || Latitude || ')' AS WKT
FROM 'Person.Address'
WHERE Latitude IS NOT NULL AND Longitude IS NOT NULL
""")


In [None]:
# Ejercicio 69 - Ruta entre 3 direcciones con IDs más bajos (LINESTRING en plano)
mostrar_query("""
SELECT 'LINESTRING(' || 
       MIN(Longitude) || ' ' || MIN(Latitude) || ', ' ||
       AVG(Longitude) || ' ' || AVG(Latitude) || ', ' ||
       MAX(Longitude) || ' ' || MAX(Latitude) || ')' AS RutaEnPlano
FROM (
  SELECT Longitude, Latitude
  FROM 'Person.Address'
  WHERE Latitude IS NOT NULL AND Longitude IS NOT NULL
  ORDER BY AddressID
  LIMIT 3
)
""")
