# SQL - pod-zapytania
![](https://memegenerator.net/img/instances/14499321/yo-dawg-i-heard-you-like-queries-so-i-put-subquery-in-your-sql-query.jpg)

## Konspekt

* Pod-zapytania
* Zadania utrwalające 3

## Pod-zapytania

Tworzenie podzapytania polega na zagnieżdżaniu zapytania w innym zapytaniu.

Aby je zagnieździć, wystarczy w miejscu, w którym oczekujemy zwróconej przez podzapytanie wartości, wstawić nawiasy i zapisać pomiędzy nimi zapytanie w takiej samej formie jak zwykłe zapytanie.

```sqlite
SELECT kolumna,kolumna2,.. FROM tabela WHERE kolumna=(SELECT kolumna FROM tabela2);
```

#### Przykład

**Wybieramy id, imię i nazwisko autora który napisał książkę o tytule “`Solaris`”**

Tabela **`Authors`**:

In [1]:
%LOAD library_db.db rw

In [2]:
SELECT * FROM authors;

ID,surname,name
1,Lem,Stanisław
2,Kosik,Rafał
3,Gombrowicz,Witold
4,Mrożek,Sławomir
5,Dukaj,Jacek
6,Sapkowki,Andrzej


Tabela **`Titles`**:

In [3]:
SELECT * FROM titles;

ID,title,author_id
1,Solaris,1
2,Cyberiada,1
3,Katar,1
4,Bajki robotów,1
5,Opowieści o Pilocie Pirxie,1
6,Rękopis znaleziony w wannie,1
7,Dzienniki gwiazdowe,1
8,Eden,1
9,Śledztwo,1
10,Powrót z gwiazd,1


Zapytanie i wynik zapytania:

In [4]:
SELECT author_id FROM titles WHERE title='Solaris';

author_id
1


In [5]:
SELECT id,name,surname FROM authors
WHERE id = '1';

ID,name,surname
1,Stanisław,Lem


In [6]:
SELECT id,name,surname FROM authors
WHERE id = (SELECT author_id FROM titles WHERE title='Solaris');

ID,name,surname
1,Stanisław,Lem


#### Ćwiczenie

**Wybierz id i nazwę produktów zamówionych w zamówieniu o id `2`**

Tabela **`Product`**:

In [7]:
%LOAD CodeBrainers.db rw

In [8]:
SELECT * FROM product;

id,name,price,amount,date
5,Spodnie,100.0,5,2011-02-01
6,Bluza,60.0,2,2011-02-12


Tabela **`Order_product`**:

In [9]:
SELECT * FROM order_product;

order_id,product_id,amount
1,2,2
1,4,1
2,6,1
2,8,1
2,5,2
3,5,1
3,7,2
4,5,1
4,2,1
4,7,2


Wpisz zapytanie do bazy!

---

Zapytanie i wynik zapytania:

In [10]:
SELECT id,name FROM product
WHERE id IN (SELECT product_id FROM order_product WHERE order_id=2);

id,name
5,Spodnie
6,Bluza


Wynik każdego zapytania `SELECT` można traktować jak kolejną (wirtualną) tabelę. W efekcie możemy wykonywać na takiej tabeli zapytania.

* Pod-zapytania w `FROM`
* Pod-zapytania w `WHERE`
* Pod-zapytania w `SELECT`

### Podzapytania w `FROM`

#### Przykład

**Załóżmy, że mamy gotowe zapytanie o listę użytkowników biblioteki wraz z liczbą książek pożyczonych przez każdego z nich.**

Tabela **`Users`**:

In [12]:
%LOAD library_db.db rw

In [13]:
SELECT * FROM users;

ID,surname,name,registration_date
0,Piotrowski,Igor,1994-04-27
1,Lewandowska,Róża,2008-07-04
2,Woźniak,Adam,1999-08-09
3,Kowalczyk,Michał,2011-01-22
4,Kaczmarek,Leon,1990-08-15
5,Kwiatkowska,Joanna,2013-06-16
6,Zieliński,Michał,1990-09-21
7,Woźniak,Małgorzata,1991-10-03
8,Kaczmarek,Joanna,2001-05-31
9,Wójcik,Izabela,2013-03-07


Tabela **`Borrowings`**:

In [14]:
SELECT * FROM borrowings;

ID,user_id,book_id,borrow_date,return_date
0,129,621,2017-09-05,2017-09-14
1,192,284,2011-01-26,2011-01-31
2,235,160,1995-12-18,1995-12-27
3,96,308,2018-07-02,2018-07-19
4,195,180,2017-07-11,2017-07-30
5,171,378,2015-06-19,2015-06-29
6,94,359,2012-04-23,2012-05-04
7,8,593,2001-05-31,2001-06-05
8,223,37,2010-03-06,2010-04-03
9,203,248,1996-03-20,1996-03-26


Zapytanie i wynik zapytania:

In [15]:
SELECT users.name, users.surname, COUNT(borrowings.ID) AS activity FROM users JOIN borrowings
ON users.ID=borrowings.user_id GROUP BY users.ID;

name,surname,activity
Igor,Piotrowski,8
Róża,Lewandowska,8
Klaudia,Lewandowska,10
Mateusz,Grabowski,4
Paulina,Wojciechowska,13
Marta,Woźniak,5
Joanna,Dąbrowska,7
Marcel,Kamiński,11
Michał,Nowak,6
Marta,Wiśniewska,3


Na wyniku tego zapytania możemy wykonać kolejne zapytanie, by otrzymać listę użytkowników, którzy pożyczyli więcej niż 10 książek.

Zapytanie i wynik zapytania:

In [16]:
SELECT * FROM
(
    SELECT users.name, users.surname, COUNT(borrowings.ID) AS activity FROM users JOIN borrowings
    ON users.ID=borrowings.user_id GROUP BY users.ID
)
WHERE activity>10;

name,surname,activity
Paulina,Wojciechowska,13
Marcel,Kamiński,11
Małgorzata,Piotrowska,13
Róża,Dąbrowska,14
Sara,Kaczmarek,14
Adam,Kowalczyk,13
Aniela,Dąbrowska,13
Katarzyna,Krawczyk,14
Stanisław,Wójcik,13
Piotr,Szymański,12


### Podzapytania w `WHERE`

#### Przykład

**Zapytania zwracające w wyniku pojedynczą wartość możemy użyć np. w wyrażeniach warunkowych (`WHERE`, `HAVING`). Mając zapytanie o średnią liczbę wypożyczeń dokonanych przez użytkownika.**

Tabela **`Borrowings`**:

In [17]:
SELECT * FROM borrowings;

ID,user_id,book_id,borrow_date,return_date
0,129,621,2017-09-05,2017-09-14
1,192,284,2011-01-26,2011-01-31
2,235,160,1995-12-18,1995-12-27
3,96,308,2018-07-02,2018-07-19
4,195,180,2017-07-11,2017-07-30
5,171,378,2015-06-19,2015-06-29
6,94,359,2012-04-23,2012-05-04
7,8,593,2001-05-31,2001-06-05
8,223,37,2010-03-06,2010-04-03
9,203,248,1996-03-20,1996-03-26


Zapytanie i wynik zapytania:

In [20]:
SELECT 1.0*COUNT(DISTINCT borrowings.ID)/COUNT(DISTINCT borrowings.user_id) FROM borrowings;

1.0*COUNT(DISTINCT borrowings.ID)/COUNT(DISTINCT borrowings.user_id)
8.0


**Możemy napisać zapytanie zwracające listę użytkowników pożyczających więcej książek niż średnia.**

Tabela **`Users`**:

In [21]:
SELECT * FROM users;

ID,surname,name,registration_date
0,Piotrowski,Igor,1994-04-27
1,Lewandowska,Róża,2008-07-04
2,Woźniak,Adam,1999-08-09
3,Kowalczyk,Michał,2011-01-22
4,Kaczmarek,Leon,1990-08-15
5,Kwiatkowska,Joanna,2013-06-16
6,Zieliński,Michał,1990-09-21
7,Woźniak,Małgorzata,1991-10-03
8,Kaczmarek,Joanna,2001-05-31
9,Wójcik,Izabela,2013-03-07


Zapytanie i wynik zapytania:

In [22]:
SELECT users.name,users.surname, COUNT(borrowings.ID) AS books_borrowed FROM users JOIN borrowings 
ON users.ID=borrowings.user_id GROUP BY users.ID HAVING books_borrowed>8.0;

name,surname,books_borrowed
Klaudia,Lewandowska,10
Paulina,Wojciechowska,13
Marcel,Kamiński,11
Małgorzata,Piotrowska,13
Marta,Kowalska,10
Paulina,Krawczyk,10
Róża,Dąbrowska,14
Joanna,Grabowska,9
Sara,Kaczmarek,14
Izabela,Piotrowska,9


In [23]:
SELECT users.name,users.surname, COUNT(borrowings.ID) AS books_borrowed FROM users JOIN borrowings 
ON users.ID=borrowings.user_id GROUP BY users.ID HAVING books_borrowed>
(
    SELECT 1.0*COUNT(DISTINCT borrowings.ID)/COUNT(DISTINCT borrowings.user_id) FROM borrowings
)
;

name,surname,books_borrowed
Klaudia,Lewandowska,10
Paulina,Wojciechowska,13
Marcel,Kamiński,11
Małgorzata,Piotrowska,13
Marta,Kowalska,10
Paulina,Krawczyk,10
Róża,Dąbrowska,14
Joanna,Grabowska,9
Sara,Kaczmarek,14
Izabela,Piotrowska,9


### Podzapytania w `SELECT`

#### Przykład

**Analogicznie do poprzedniego przypadku - jeśli podzapytanie zwraca pojedynczą wartość, możemy je użyć jako jedną z kolumn w głównym zapytaniu.**

Tabela **`Users`**:

In [24]:
SELECT * FROM users;

ID,surname,name,registration_date
0,Piotrowski,Igor,1994-04-27
1,Lewandowska,Róża,2008-07-04
2,Woźniak,Adam,1999-08-09
3,Kowalczyk,Michał,2011-01-22
4,Kaczmarek,Leon,1990-08-15
5,Kwiatkowska,Joanna,2013-06-16
6,Zieliński,Michał,1990-09-21
7,Woźniak,Małgorzata,1991-10-03
8,Kaczmarek,Joanna,2001-05-31
9,Wójcik,Izabela,2013-03-07


Tabela **`Borrowings`**:

In [25]:
SELECT * FROM borrowings;

ID,user_id,book_id,borrow_date,return_date
0,129,621,2017-09-05,2017-09-14
1,192,284,2011-01-26,2011-01-31
2,235,160,1995-12-18,1995-12-27
3,96,308,2018-07-02,2018-07-19
4,195,180,2017-07-11,2017-07-30
5,171,378,2015-06-19,2015-06-29
6,94,359,2012-04-23,2012-05-04
7,8,593,2001-05-31,2001-06-05
8,223,37,2010-03-06,2010-04-03
9,203,248,1996-03-20,1996-03-26


Zapytanie i wynik zapytania:

In [26]:
SELECT users.name,users.surname, 
(
    SELECT COUNT(borrowings.ID) FROM borrowings WHERE borrowings.user_id=users.ID
) 
AS books FROM users;

name,surname,books
Igor,Piotrowski,8
Róża,Lewandowska,8
Adam,Woźniak,10
Michał,Kowalczyk,7
Leon,Kaczmarek,9
Joanna,Kwiatkowska,13
Michał,Zieliński,10
Małgorzata,Woźniak,9
Joanna,Kaczmarek,10
Izabela,Wójcik,11


Co ważne - w podzapytaniu (w tym przypadku z tabeli **`Borrowings`**) możemy odwołać się do tabeli i pól z zapytania zewnętrznego (**`Users`**)

In [27]:
SELECT COUNT(borrowings.ID) FROM borrowings WHERE borrowings.user_id=users.ID;

Error: no such column: users.ID

### Wydajność

Nie musimy się martwić o wydajność takich podzapytań - mimo że pozornie liczenie średniej liczby wypożyczeń powinno się wykonywać z osobna dla każdego rekordu użytkownika, baza danych optymalizuje plan zapytania. Jeśli chcemy sprawdzić, jak nasze zapytanie przekłada się na operacje wykonywane w bazie, możemy przed treścią zapytania dodać komendę `EXPLAIN QUERY PLAN` - zapytanie nie zostanie wtedy wykonane, otrzymamy jednak listę kroków, które baza danych chce wykonać.

#### Przykład

Zapytanie i wynik zapytania:

In [28]:
EXPLAIN QUERY PLAN 
SELECT users.name, users.surname,COUNT(borrowings.ID) AS books_borrowed FROM users JOIN borrowings 
ON users.ID=borrowings.user_id GROUP BY users.ID HAVING books_borrowed>
(
    SELECT 1.0*COUNT(DISTINCT borrowings.ID)/count(DISTINCT borrowings.user_id) FROM borrowings
)
;

id,parent,notused,detail
7,0,0,SCAN users
20,0,0,SEARCH borrowings USING AUTOMATIC COVERING INDEX (user_id=?)
26,0,0,USE TEMP B-TREE FOR GROUP BY
61,0,0,SCALAR SUBQUERY 1
66,61,0,USE TEMP B-TREE FOR count(DISTINCT)
68,61,0,USE TEMP B-TREE FOR count(DISTINCT)
70,61,0,SCAN borrowings


## Zadania utrwalające 3

### Ćwiczenia

[`03_subquerries.md`](https://github.com/pkociepka/sql/blob/master/exercises/03_subquerries.md)

### Materiały

[`library_db.sql`](https://github.com/pkociepka/sql/blob/master/library_db.sql)