
## 1. Esquema

Para esta actividad vamos a trabajar con datos de una empresa que vende productos a través de varias tiendas. Trabajaremos con el siguiente esquema:

- Tiendas(tid PRIMARY KEY, capacidad, minpersonal)
- Productos(pid PRIMARY KEY, nombre, precio, tipo)
- Vende(tid,pid) PRIMARY KEY(tid,pid)
- Usuarios(uid PRIMARY KEY, nombre, calle, comuna, region)
- Compras(cid PRIMARY KEY, uid, tid)
- Contenido_Compra(cid,pid,cantidad) PRIMARY KEY (cid,pid)

En este esquema, la tabla 'Tiendas' tiene información sobre cada tienda de la empresa. La información que guardaremos sobre cada tienda es su id único, la capacidad de personas que pueden ingresar a la tienda, y la cantidad mínima del personal requerido para el funcionamiento de la tienda. El repositorio (único) de productos se guarda en la tabla 'Productos', donde cada producto se describe a través de su id, nombre, su precio y tipo. Para registrar que una tienda en particular vende un producto, se ocupa la tabla 'Vende', vinculando la tienda con el producto. Por otro lado, la tabla 'Usuarios' tiene un registro de los usuarios de la empresa, respaldando la información con su nombre y dirección.

Para registrar las compras que los usuarios realizan de una tienda específica, se tienen dos tablas. La primera, llamada 'Compras' establece una compra de un usuario en una tienda, y la tabla 'Contenido_Compra' guarda la información sobre los productos comprados en cada compra individual. También se guarda la información sobre la cantidad de unidades de cada producto comprado para poder modelar que un usuario compra varias unidades del mismo producto en una compra.

## 2. Datos

Aquí crearemos una instancia del esquema de arriba e insertaremos algunos datos a la instancia.

La idea es que cada tabla debería tener al menos una fila y cada consulta de abajo debería devolver al menos una respuesta con los datos especificados.

In [1]:
# install
!apt update
!apt install postgresql postgresql-contrib &>log
!service postgresql start
!sudo -u postgres psql -c "CREATE USER root WITH SUPERUSER"
# set connection
%load_ext sql
%config SqlMagic.feedback=False 
%config SqlMagic.autopandas=True
%sql postgresql+psycopg2://@/postgres

[33m0% [Working][0m            Hit:1 http://archive.ubuntu.com/ubuntu focal InRelease
[33m0% [Waiting for headers] [Connected to cloud.r-project.org (18.67.65.79)] [Conn[0m                                                                               Get:2 http://archive.ubuntu.com/ubuntu focal-updates InRelease [114 kB]
                                                                               Get:3 http://security.ubuntu.com/ubuntu focal-security InRelease [114 kB]
                                                                               Get:4 https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/ InRelease [3,622 B]
[33m0% [Waiting for headers] [Connecting to ppa.launchpad.net (185.125.190.52)] [Wa[0m                                                                               Get:5 http://archive.ubuntu.com/ubuntu focal-backports InRelease [108 kB]
Hit:6 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64  InRelease
Hit:7 http

In [2]:
%%sql
DROP TABLE IF EXISTS Tiendas;
CREATE TABLE Tiendas(tid INT PRIMARY KEY, capacidad INT, minpersonal INT);
INSERT INTO Tiendas VALUES(1, 100, 10);
INSERT INTO Tiendas VALUES(2, 150, 15);
INSERT INTO Tiendas VALUES(3, 50, 5);

DROP TABLE IF EXISTS Productos;
CREATE TABLE Productos(pid INT PRIMARY KEY, nombre VARCHAR(200), precio FLOAT, tipo VARCHAR(100));
INSERT INTO Productos VALUES(100, 'Polera BTS', 40, 'Ropa');
INSERT INTO Productos VALUES(200, 'Polera Bad Bunny', 20, 'Ropa');
INSERT INTO Productos VALUES(300, 'Refrigerador', 1000, 'Electro');
INSERT INTO Productos VALUES(400, 'Mancuerna 10kgs', 80, 'Deporte');
INSERT INTO Productos VALUES(500, 'Banda elástica', 10, 'Deporte');
INSERT INTO Productos VALUES(600, 'Pelota Futbol', 200, 'Deporte');
INSERT INTO Productos VALUES(700, 'Cafetera', 100, 'Electro');
INSERT INTO Productos VALUES(800, 'Monitor', 200, 'Tecnología');
INSERT INTO Productos VALUES(900, 'Notebook', 1200, 'Tecnología');
INSERT INTO Productos VALUES(1000, 'Lomo kg', 10, 'Carne');

DROP TABLE IF EXISTS Vende;
CREATE TABLE Vende(tid INT, pid INT, PRIMARY KEY(tid, pid));
INSERT INTO Vende VALUES(1, 100);
INSERT INTO Vende VALUES(1, 200);
INSERT INTO Vende VALUES(1, 300);
INSERT INTO Vende VALUES(1, 400);
INSERT INTO Vende VALUES(1, 500);
INSERT INTO Vende VALUES(1, 600);
INSERT INTO Vende VALUES(1, 700);
INSERT INTO Vende VALUES(1, 800);
INSERT INTO Vende VALUES(1, 900);
INSERT INTO Vende VALUES(2, 100);
INSERT INTO Vende VALUES(2, 200);
INSERT INTO Vende VALUES(2, 300);
INSERT INTO Vende VALUES(2, 700);
INSERT INTO Vende VALUES(3, 100);
INSERT INTO Vende VALUES(3, 200);
INSERT INTO Vende VALUES(3, 300);
INSERT INTO Vende VALUES(3, 400);
INSERT INTO Vende VALUES(3, 500);
INSERT INTO Vende VALUES(3, 700);
INSERT INTO Vende VALUES(3, 800);
INSERT INTO Vende VALUES(3, 900);
INSERT INTO Vende VALUES(1, 1000);

DROP TABLE IF EXISTS Usuarios;
CREATE TABLE Usuarios(uid INT PRIMARY KEY, nombre VARCHAR(200), calle VARCHAR(200), comuna VARCHAR(100), region VARCHAR(200));
INSERT INTO Usuarios VALUES(1, 'Valentina', 'Calle 123', 'Conchalí', 'RM');
INSERT INTO Usuarios VALUES(2, 'Adrián', 'Dirección 145', 'Maipú', 'RM');
INSERT INTO Usuarios VALUES(5, 'Lomos', 'Dirección 90', 'Maipú', 'RM');
INSERT INTO Usuarios VALUES(3, 'Conito', 'Otra Calle 78', 'Viña del mar', 'Valparaíso');
INSERT INTO Usuarios VALUES(4, 'Frambuesa', 'Más direcciones 90', 'Concón', 'Valparaíso');

DROP TABLE IF EXISTS Compras;
CREATE TABLE Compras(cid INT PRIMARY KEY, uid INT, tid INT);
INSERT INTO Compras VALUES(1, 1, 1);
INSERT INTO Compras VALUES(101, 1, 1);
INSERT INTO Compras VALUES(3, 1, 1);
INSERT INTO Compras VALUES(4, 1, 2);
INSERT INTO Compras VALUES(5, 1, 2);
INSERT INTO Compras VALUES(6, 2, 1);
INSERT INTO Compras VALUES(7, 2, 2);
INSERT INTO Compras VALUES(8, 2, 3);
INSERT INTO Compras VALUES(9, 3, 3);
INSERT INTO Compras VALUES(10, 3, 3);
INSERT INTO Compras VALUES(11, 3, 1);
INSERT INTO Compras VALUES(12, 4, 1);

DROP TABLE IF EXISTS Contenido_Compra;
CREATE TABLE Contenido_Compra(cid INT, pid INT, cantidad INT, PRIMARY KEY(cid, pid));
INSERT INTO Contenido_Compra VALUES(1, 100, 2);
INSERT INTO Contenido_Compra VALUES(101, 800, 2);
INSERT INTO Contenido_Compra VALUES(101, 900, 1);
INSERT INTO Contenido_Compra VALUES(101, 100, 1);
INSERT INTO Contenido_Compra VALUES(101, 1000, 3);
INSERT INTO Contenido_Compra VALUES(3, 400, 2);
INSERT INTO Contenido_Compra VALUES(4, 200, 3);
INSERT INTO Contenido_Compra VALUES(5, 100, 1);
INSERT INTO Contenido_Compra VALUES(6, 100, 3);
INSERT INTO Contenido_Compra VALUES(6, 600, 1);
INSERT INTO Contenido_Compra VALUES(7, 300, 1);
INSERT INTO Contenido_Compra VALUES(7, 700, 1);
INSERT INTO Contenido_Compra VALUES(8, 200, 4);
INSERT INTO Contenido_Compra VALUES(8, 1000, 2);
INSERT INTO Contenido_Compra VALUES(9, 100, 2);
INSERT INTO Contenido_Compra VALUES(10, 100, 1);
INSERT INTO Contenido_Compra VALUES(11, 200, 1);
INSERT INTO Contenido_Compra VALUES(12, 500, 3);

 * postgresql+psycopg2://@/postgres


## 3. Consultas

Escriban las siguentes consultas SQL que funcionan sobre el esquema de arriba.


**1**. Liste los productos desde el más caro hasta el más barato:

In [None]:
%%sql
SELECT *
FROM Productos
ORDER BY precio DESC;

2. Máximo de los precios para cada tipo de producto. Las respuestas deberían listar pares [tipo, máximo(precio)].

In [None]:
%%sql
SELECT tipo, MAX(precio)
from Productos
GROUP BY tipo
ORDER BY MAX(precio) DESC;

3. Tienda con el número de clientes que realizaron compras en esta tienda. Ojo que hay que eliminar usuarios duplicados.

In [None]:
%%sql
SELECT tid, COUNT(DISTINCT uid)
FROM Compras
GROUP BY tid;

4. Nombre del usuario, junto con el precio del producto más caro que
compró. Si el usuario no realizó ninguna compra, no es necesario listarlo:

In [None]:
%%sql
SELECT Usuarios.nombre, MAX(productos.precio)
FROM Usuarios, Compras, Contenido_Compra, Productos
WHERE Usuarios.uid = Compras.uid AND Compras.cid = Contenido_Compra.cid AND Contenido_Compra.pid = Productos.pid
GROUP BY Usuarios.nombre
ORDER BY max DESC;

5. Nombre de los usuarios que realizaron la compra con el mayor valor: 

In [None]:
%%sql
SELECT compras.nombre as nombre_usuario
FROM (
  SELECT Usuarios.nombre, SUM(productos.precio*Contenido_Compra.cantidad) as suma
  FROM Usuarios, Compras, Contenido_Compra, Productos
  WHERE Usuarios.uid = Compras.uid AND Compras.cid = Contenido_Compra.cid AND Contenido_Compra.pid = Productos.pid
  GROUP BY Usuarios.nombre, Compras.cid
  ORDER BY sum DESC
  LIMIT 1
) as maximo_valor, (
  SELECT Usuarios.nombre, SUM(productos.precio*Contenido_Compra.cantidad)
  FROM Usuarios, Compras, Contenido_Compra, Productos
  WHERE Usuarios.uid = Compras.uid AND Compras.cid = Contenido_Compra.cid AND Contenido_Compra.pid = Productos.pid
  GROUP BY Usuarios.nombre, Compras.cid
) as compras
WHERE maximo_valor.suma = compras.sum;

6. Nombre (sin repeticiones) de todos los usuarios que compraron un producto de tipo 'Electro'

In [None]:
%%sql
SELECT DISTINCT Usuarios.nombre
FROM Usuarios, Compras, Contenido_Compra, Productos
WHERE Usuarios.uid = Compras.uid AND Compras.cid = Contenido_Compra.cid AND Contenido_Compra.pid = Productos.pid AND Productos.tipo = 'Electro'
GROUP BY Usuarios.nombre;

7. Nombre de los usuarios que compraron uno de los cinco productos más caros. Para sacar los cinco más caros, usar LIMIT:

In [None]:
%%sql
SELECT DISTINCT Usuarios.nombre
FROM Usuarios, Compras, Contenido_Compra, (
  SELECT DISTINCT pid, precio
  FROM Productos 
  ORDER BY Productos.precio DESC 
  LIMIT 5
) as p1
WHERE Usuarios.uid = Compras.uid AND Compras.cid = Contenido_Compra.cid AND Contenido_Compra.pid = p1.pid
GROUP BY Usuarios.nombre;

8. Id de cada tienda, junto con el promedio de los precios de todos los productos que vende esta tienda

In [None]:
%%sql
SELECT Tiendas.tid, AVG(Productos.precio)
FROM Tiendas, Vende, Productos
WHERE Tiendas.tid = Vende.tid AND Productos.pid = Vende.pid
GROUP BY Tiendas.tid
ORDER BY Tiendas.tid;

9. Id de todas las compras en las cuales se compraron más de tres productos distintos (si el mismo producto fue comprado 3 veces o mas, esto no cuenta)

In [None]:
%%sql
SELECT cid
FROM (
  SELECT DISTINCT cid, COUNT(DISTINCT pid) as cantidad
  FROM Contenido_Compra
  GROUP BY cid
) as c1
WHERE cantidad > 3;

10. Para cada compra con **tres o más productos**, listar su id, el nombre del usuario, y el número de productos comprados en esta compra. Si un producto fue comprado dos o más veces, hay que contar esto:

In [None]:
%%sql
SELECT c1.cid, Usuarios.nombre, c1.cantidad
FROM (SELECT DISTINCT cid, SUM(cantidad) as cantidad
  FROM Contenido_Compra
  GROUP BY cid
) as c1, Usuarios, Compras
WHERE c1.cantidad >= 3 AND Compras.cid = c1.cid AND Compras.uid = Usuarios.uid
ORDER BY c1.cantidad DESC;

11. Id de todas las tiendas que venden al menos un producto más caro que el producto más barato que existe en todos los productos:

In [None]:
%%sql
SELECT DISTINCT Vende.tid
FROM (
  SELECT precio
  FROM Productos
  ORDER BY precio
  LIMIT 1
) as Mas_Barato, Vende, Productos
WHERE Vende.pid = Productos.pid AND Productos.precio > Mas_Barato.precio;


12. Para cada región, listar el id de la tienda más preferida por los usuarios en esta región. Aquí se cuenta el número total de compras realizadas en la tienda, y no el número de usuarios que realizaron la compra. Si dos o mas tiendas empatadas para el primer lugar, listar todas.

In [None]:
%%sql
SELECT f2.region, f2.tid
FROM (
  SELECT region, MAX(cantidad) as cantidad
  FROM (
    SELECT Usuarios.region, Num_compras.tid, SUM(Num_compras.cantidad) as cantidad
    FROM (
      SELECT uid, tid, COUNT(cid) as cantidad
      FROM Compras 
      GROUP BY uid, tid
      ORDER BY uid
    ) as Num_Compras, Usuarios
    WHERE Num_Compras.uid = Usuarios.uid 
    GROUP BY Usuarios.region, Num_compras.tid
    ORDER BY Num_compras.tid
  ) as f1
  GROUP BY region
) as max_region, (
    SELECT Usuarios.region, Num_compras.tid, SUM(Num_compras.cantidad) as cantidad
    FROM (
      SELECT uid, tid, COUNT(cid) as cantidad
      FROM Compras 
      GROUP BY uid, tid
      ORDER BY uid
    ) as Num_Compras, Usuarios
    WHERE Num_Compras.uid = Usuarios.uid 
    GROUP BY Usuarios.region, Num_compras.tid
    ORDER BY Num_compras.tid
  ) as f2
  WHERE max_region.cantidad = f2.cantidad AND max_region.region = f2.region