# Zaawansowane operacje w SQL - stringi, daty, aliasy, joins i podzapytania

_Mikołaj Leszczuk_

## Konspekt

* Operacje na stringach
* Funkcje daty
* Aliasy - zastępcze nazwy kolumn lub tabeli
* Łączenie tabel i wyszukiwanie danych w wielu tabelach
* Pod-zapytania

## Operacje na stringach

Tu doświadczymy istotnych różnic pomiędzy implementacjami DBMS!

In [1]:
!cp simple_library_original.db simple_library.db
%load_ext sql
%sql sqlite:///simple_library.db?mode=rw

In [2]:
%%sql
SELECT * FROM simple_library;

 * sqlite:///simple_library.db?mode=rw
Done.


ID,Title,Author_surname,Author_name,Registration_date
1,Solaris,Lem,Stanisław,2002-01-30
2,Solaris,Lem,Stanisław,1986-03-26
3,Solaris,Lem,Stanisław,2017-03-02
4,Solaris,Lem,Stanisław,2006-05-01
5,Solaris,Lem,Stanisław,2018-08-04
6,Solaris,Lem,Stanisław,1995-10-06
7,Solaris,Lem,Stanisław,1972-06-30
8,Solaris,Lem,Stanisław,2006-05-27
9,Solaris,Lem,Stanisław,1973-06-16
10,Solaris,Lem,Stanisław,1988-05-20


### Operator `||`

Czasem jest potrzeba wyświetlenia konkatenacji kolumn i jakiegoś łańcucha tekstowego. Do tego może przydać się operator `||`.

Sposób realizacji konkatenacji różni się od siebie w bazach danych:

* SQLite: `||`
* Oracle: `||` lub `CONCAT()` 
* MySQL: `CONCAT()`
* SQL Server: `+`

Składnia użycia operatora `||` w SQLite/Oracle:

```sql
SELECT nazwa_kolumny1 || 'dowolny_tekst' || nazwa_kolumny2
FROM nazwa_tabeli;
```

> **Przykład:**
>
>  Użycie `||` w SQLite/Oracle. **Wyświetl imię i nazwisko oddzielone spacją `(" ")`**

In [3]:
%%sql
SELECT Author_name || ' ' || Author_surname FROM simple_library;

 * sqlite:///simple_library.db?mode=rw
Done.


Author_name || ' ' || Author_surname
Stanisław Lem
Stanisław Lem
Stanisław Lem
Stanisław Lem
Stanisław Lem
Stanisław Lem
Stanisław Lem
Stanisław Lem
Stanisław Lem
Stanisław Lem


### `LOWER()` i `UPPER()`

Funkcja zwraca wartość kolumny tekstowej w postaci małych/dużych liter.

Składnia:

```sqlite
SELECT LOWER(nazwa_kolumny) FROM nazwa_tabeli;
```

```sqlite
SELECT UPPER(nazwa_kolumny) FROM nazwa_tabeli;
```

> **Przykład:**
> 
> Wyświetl przy pomocy LOWER() wszystkie imiona małymi literami.

In [4]:
%%sql
SELECT LOWER(Author_name) FROM simple_library;

 * sqlite:///simple_library.db?mode=rw
Done.


LOWER(Author_name)
stanisław
stanisław
stanisław
stanisław
stanisław
stanisław
stanisław
stanisław
stanisław
stanisław


> **Przykład:**
> 
> Wyświetl przy pomocy UPPER() wszystkie nazwiska dużymi literami.

In [5]:
%%sql
SELECT UPPER(Author_surname) FROM simple_library;

 * sqlite:///simple_library.db?mode=rw
Done.


UPPER(Author_surname)
LEM
LEM
LEM
LEM
LEM
LEM
LEM
LEM
LEM
LEM


### `LENGTH()`

Funkcja zwraca długość pola tekstowego podanego jako argument

Składnia:

```sqlite
SELECT LENGTH(nazwa_kolumny) FROM nazwa_tabeli;
```

W SQL Server używa się do tego samego funkcji `LEN()`

> **Przykład:**
>
> Wyświetl przy pomocy LENGTH() nazwisko i odpowiadającą jemu długość nazwiska.

In [6]:
%%sql
SELECT Author_surname, LENGTH(Author_surname) FROM simple_library;

 * sqlite:///simple_library.db?mode=rw
Done.


Author_surname,LENGTH(Author_surname)
Lem,3
Lem,3
Lem,3
Lem,3
Lem,3
Lem,3
Lem,3
Lem,3
Lem,3
Lem,3


### `REPLACE()`

Funkcja przeszukuje `str1` w poszukiwaniu `str2` aby go zamienić na `str3`

Składnia:

```sqlite
SELECT REPLACE(nazwa_kolumny,'str2','str3') FROM nazwa_tabeli;
```

> **Przykład:**
>
> Wyświetl imiona i nazwiska z tym, że za pomocą `REPLACE()` zamiast imienia `'Stanisław'` wyświetl `'Stan'`.

In [10]:
%%sql
SELECT REPLACE(Author_name, 'Stanisław', 'Stan'), Author_surname FROM simple_library;

 * sqlite:///simple_library.db?mode=rw
Done.


"REPLACE(Author_name, 'Stanisław', 'Stan')",Author_surname
Stan,Lem
Stan,Lem
Stan,Lem
Stan,Lem
Stan,Lem
Stan,Lem
Stan,Lem
Stan,Lem
Stan,Lem
Stan,Lem


### `SUBSTR()`

Funkcja ta służy do operacji na łańcuchach tekstowych w wyniku zapytań. Może przyjmować 2-3 argumentów.

```sql
SUBSTR(nazwa_kolumny, pozycja [, liczba_znaków])
```

`nazwa_kolumny` - łańcuch tekstowy do obcięcia

`pozycja` - nr znaku od którego ma być wyświetlony string

`liczba_znaków` - argument opcjonalny, liczba znaków do wyświetlenia, liczona od parametru pozycja

Składnia:

```sqlite
SELECT SUBSTR(nazwa_kolumny,pozycja[,liczba_znaków])
FROM nazwa_tabeli;
```

W Oracle oraz w niektórych wersjach MySQL używa się funkcji `SUBSTRING()`. Natomiast w MS Access stosuje się `MID()`.

> **Przykład:**
>
> Wyświetl przy pomocy `SUBSTR()` dwie pierwsze litery z nazwiska.

In [11]:
%%sql
SELECT SUBSTR(Author_surname, 1, 2) FROM simple_library;

 * sqlite:///simple_library.db?mode=rw
Done.


"SUBSTR(Author_surname, 1, 2)"
Le
Le
Le
Le
Le
Le
Le
Le
Le
Le


## Funkcje daty

### Funkcje daty SQLite

Umożliwiają operacje na dacie i czasie w trakcie wykonywania zapytania. Typowe funkcje to:

`strftime('%d')`, `strftime('%m')`, `strftime('%Y')`

Zwracają kolejno dzień, miesiąc, rok z podanej w argumencie daty

```sqlite
SELECT strftime('%d', data);
```

> **Przykład:**
> 
> Wybieramy książki, które zarejestrowano lutym.

In [12]:
%%sql
SELECT * FROM simple_library WHERE STRFTIME('%m', Registration_date) = '02';

 * sqlite:///simple_library.db?mode=rw
Done.


ID,Title,Author_surname,Author_name,Registration_date
18,Solaris,Lem,Stanisław,1986-02-01
19,Solaris,Lem,Stanisław,1981-02-21
29,Bajki robotów,Lem,Stanisław,2016-02-23
33,Bajki robotów,Lem,Stanisław,1979-02-21
45,Rękopis znaleziony w wannie,Lem,Stanisław,1999-02-13
50,Dzienniki gwiazdowe,Lem,Stanisław,1979-02-16
104,Śledztwo,Lem,Stanisław,1985-02-03
108,Powrót z gwiazd,Lem,Stanisław,2005-02-26
119,Powrót z gwiazd,Lem,Stanisław,2008-02-20
123,Powrót z gwiazd,Lem,Stanisław,1999-02-03


### `DATE()`

W SQLite funkcja DATE() służy do manipulacji i formatowania dat.

Naczęstsze zastosowane to `DATE('now')`, które zwraca bieżącą datę i czas.

> **Przykład:**
>
> Zwracanie aktualnej datę w formacie YYYY-MM-DD na podstawie czasu UTC.

In [13]:
%%sql
SELECT DATE('now');

 * sqlite:///simple_library.db?mode=rw
Done.


DATE('now')
2025-02-18


### `JULIANDAY()`

Funkcja `JULIANDAY()` zwraca liczbę dni, które upłyneły od od **4713 roku p.n.e. (12:00 UTC, 1 stycznia)** według **kalendarza juliańskiego**. Jest to standard używany w astronomii do mierzenia czasu w sposób ciągły.

**Dlaczego 4713 rok p.n.e.?**

Rok ten został wybrany przez Josepha Scaligera w 1583 roku jako początek ery juliańskiej, co pozwala na unikanie problemów związanych z różnymi kalendarzami i epokami historycznymi. System ten umożliwia łatwe obliczanie różnic między datami.

> **Przykład:**
>
> Zwrócenie aktualnej daty w formacie juliańskim.

In [17]:
%%sql
SELECT JULIANDAY('now');

 * sqlite:///simple_library.db?mode=rw
Done.


JULIANDAY('now')
2460725.2320958795


## Aliasy - zastępcze nazwy kolumn lub tabeli

Alias to nazwa zastępcza, którą możemy zdefiniować dla konkretnej kolumny lub tabeli na początku zapytania, a następnie używać w całym zapytaniu jako wygodniejsza (zazwyczaj dużo krótsza) nazwa.

Alias definiuje się używając klauzuli “`AS`” zaraz po nazwie kolumny lub tabeli w następujący sposób:

```sqlite
SELECT Kolumna AS Kol FROM tabela AS tab WHERE Kol = wartość;
```

Od momentu takiej definicji do kolumny kolumna wystarczy odwoływać się aliasem `Kol` a tabeli tabela aliasem `tab`.

In [26]:
%%sql
SELECT DISTINCT Author_surname AS Nazwisko FROM simple_library WHERE LENGTH(Nazwisko) >= 6;

 * sqlite:///simple_library.db?mode=rw
Done.


Nazwisko
Gombrowicz
Mrożek
Sapkowki


## Łączenie tabel i wyszukiwanie danych w wielu tabelach

In [28]:
!cp library_original.db library.db
%sql sqlite:///library.db?mode=rw

Schemat bazy danych z pliku `library.db`:

![](library.png)

In [29]:
%%sql
SELECT * FROM authors;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,surname,name
1,Lem,Stanisław
2,Kosik,Rafał
3,Gombrowicz,Witold
4,Mrożek,Sławomir
5,Dukaj,Jacek
6,Sapkowki,Andrzej


In [30]:
%%sql
SELECT * FROM titles;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,title,author_id
1,Solaris,1
2,Cyberiada,1
3,Katar,1
4,Bajki robotów,1
5,Opowieści o Pilocie Pirxie,1
6,Rękopis znaleziony w wannie,1
7,Dzienniki gwiazdowe,1
8,Eden,1
9,Śledztwo,1
10,Powrót z gwiazd,1


In [31]:
%%sql
SELECT * FROM books;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,title_id,registration_date
1,1,2002-01-30
2,1,1986-03-26
3,1,2017-03-02
4,1,2006-05-01
5,1,2018-08-04
6,1,1995-10-06
7,1,1972-06-30
8,1,2006-05-27
9,1,1973-06-16
10,1,1988-05-20


In [32]:
%%sql
SELECT * FROM borrowings;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,user_id,book_id,borrow_date,return_date
0,129,621,2017-09-05,2017-09-14
1,192,284,2011-01-26,2011-01-31
2,235,160,1995-12-18,1995-12-27
3,96,308,2018-07-02,2018-07-19
4,195,180,2017-07-11,2017-07-30
5,171,378,2015-06-19,2015-06-29
6,94,359,2012-04-23,2012-05-04
7,8,593,2001-05-31,2001-06-05
8,223,37,2010-03-06,2010-04-03
9,203,248,1996-03-20,1996-03-26


In [33]:
%%sql
SELECT * FROM users;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,surname,name,registration_date
0,Piotrowski,Igor,1994-04-27
1,Lewandowska,Róża,2008-07-04
2,Woźniak,Adam,1999-08-09
3,Kowalczyk,Michał,2011-01-22
4,Kaczmarek,Leon,1990-08-15
5,Kwiatkowska,Joanna,2013-06-16
6,Zieliński,Michał,1990-09-21
7,Woźniak,Małgorzata,1991-10-03
8,Kaczmarek,Joanna,2001-05-31
9,Wójcik,Izabela,2013-03-07


In [34]:
%%sql
SELECT * FROM fines;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,user_id,payment_date,fine
1,223,2010-04-03,1.5
2,28,2017-09-21,1.5
3,8,2007-02-07,0.5
4,92,2016-06-03,1.5
5,234,2017-01-07,0.5
6,113,2017-04-28,0.5
7,172,2003-06-28,1.5
8,152,1996-09-19,0.5
9,35,1992-05-26,1.5
10,205,2001-03-27,1.5


Czasem potrzebujemy wybrać dane z tabeli w zależności od danych pochodzących z innej tabeli. Do rozwiązania tego problemu służy operacja zwana **łączeniem (`JOIN`)**.

Jeśli w zapytaniu potrzebne nam są dane z tabel: `tabela1` i `tabela2`, to musimy wpisać ich nazwy zaraz po słowie `FROM` (tak jak to robimy w standardowych zapytaniach) a następnie odwoływać się do kolumn z tych tabel używając: nazwy konkretnej tabeli, operatora kropki “`.`” oraz nazwy żądanej kolumny.

Do kolumny w konkretnej tabeli odwołujemy się za pomocą operatora kropki “`.`”. Jest to szczególnie istotne w zapytaniach, w których korzysta się z więcej niż jednej tabeli.

```sqlite
SELECT tabela1.Kolumna1, tabela2.Kolumna2
FROM tabela1 JOIN tabela2 ON tabela1.Kolumna1 = tabela2.Kolumna2;
```

Operator “`,`” jest skrótem od słowa kluczowego `JOIN`, które oznacza zebranie wymienionych tabel w jedną dużą i operowanie na niej.

Możliwe jest łączenie trzech i więcej tabel. Działa to analogicznie jak w przypadku dwóch tabel.

`JOIN` łączy rekordy z dwóch+ kolumn w jeden na podstawie podanego warunku/podanych warunków.

> **Przykład:**
>
> Łączymy rekordy z tabel `authors` i `titles` w jedną tabelę na podstawie podanego warunku równości `authors.ID` i `titles.Author_ID`.

In [35]:
%%sql
SELECT * FROM authors JOIN titles ON authors.ID = titles.Author_ID;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,surname,name,ID_1,title,author_id
1,Lem,Stanisław,1,Solaris,1
1,Lem,Stanisław,2,Cyberiada,1
1,Lem,Stanisław,3,Katar,1
1,Lem,Stanisław,4,Bajki robotów,1
1,Lem,Stanisław,5,Opowieści o Pilocie Pirxie,1
1,Lem,Stanisław,6,Rękopis znaleziony w wannie,1
1,Lem,Stanisław,7,Dzienniki gwiazdowe,1
1,Lem,Stanisław,8,Eden,1
1,Lem,Stanisław,9,Śledztwo,1
1,Lem,Stanisław,10,Powrót z gwiazd,1


**Możliwe jest łączenie tabel z użyciem aliasów**

Aliasy znajdują praktyczne zastosowanie w bardziej złożonych zapytaniach np. korzystających ze złączenia tabel czy podzapytania.

```sql
SELECT tabela1.Kolumna1 FROM Tabela1 AS tab1, tabela2 AS tab2
WHERE tab2.kolumna=wartość;
```

> **Przykład:**
> 
> Podajemy id tytułu, nazwisko autora i tytuł autora o ID `1` korzystając z aliasów dla tabel `titles` i `authors`.

In [40]:
%%sql
SELECT t.ID, a.Surname, t.Title FROM authors AS a, titles AS t ON a.ID = t.Author_ID
WHERE a.ID = '1';

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,surname,title
1,Lem,Solaris
2,Lem,Cyberiada
3,Lem,Katar
4,Lem,Bajki robotów
5,Lem,Opowieści o Pilocie Pirxie
6,Lem,Rękopis znaleziony w wannie
7,Lem,Dzienniki gwiazdowe
8,Lem,Eden
9,Lem,Śledztwo
10,Lem,Powrót z gwiazd


## Pod-zapytania

Tworzenie podzapytania polega na zagnieżdżaniu zapytania w innym zapytaniu.

Aby je zagnieździć, wystarczy w miejscu, w którym oczekujemy zwróconej przez podzapytanie wartości, wstawić nawiasy i zapisać pomiędzy nimi zapytanie w takiej samej formie jak zwykłe zapytanie.

```sqlite
SELECT Kolumna1, ... FROM tabela1
WHERE Kolumna1 = (SELECT Kolumna2 FROM tabela2);
```

> **Przykład:**
>
> Wybieramy id, imię i nazwisko autora który napisał książkę o tytule `'Solaris'`.

In [41]:
%%sql
SELECT Author_ID FROM titles WHERE Title = 'Solaris';

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


author_id
1


In [42]:
%%sql
SELECT ID, Name, Surname FROM authors WHERE ID = '1';

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,name,surname
1,Stanisław,Lem


In [43]:
%%sql
SELECT ID, Name, Surname FROM authors WHERE ID = (
    SELECT Author_ID FROM titles WHERE Title = 'Solaris'
);

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


ID,name,surname
1,Stanisław,Lem


Wynik każdego zapytania `SELECT` można traktować jak kolejną (wirtualną) tabelę. W efekcie możemy wykonywać na takiej tabeli zapytania.

* Pod-zapytania w `FROM`
* Pod-zapytania w `WHERE`
* Pod-zapytania w `SELECT`

### Podzapytania w `FROM`

> Przykład
> 
> Załóżmy, że mamy gotowe zapytanie o listę użytkowników biblioteki wraz z liczbą książek pożyczonych przez każdego z nich.
>
> Na wyniku tego zapytania możemy wykonać kolejne zapytanie, by otrzymać listę użytkowników, którzy pożyczyli więcej niż 10 książek.

In [46]:
%%sql
SELECT users.Name, users.Surname, COUNT(borrowings.ID) AS Activity
FROM users JOIN borrowings ON users.ID = borrowings.User_ID GROUP BY users.ID;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


name,surname,Activity
Igor,Piotrowski,8
Róża,Lewandowska,8
Adam,Woźniak,10
Michał,Kowalczyk,7
Leon,Kaczmarek,9
Joanna,Kwiatkowska,13
Michał,Zieliński,10
Małgorzata,Woźniak,9
Joanna,Kaczmarek,10
Izabela,Wójcik,11


In [47]:
%%sql
SELECT * FROM
(
    SELECT users.Name, users.Surname, COUNT(borrowings.ID) AS Activity
    FROM users JOIN borrowings ON users.ID = borrowings.User_ID GROUP BY users.ID
)
WHERE Activity>10;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


Name,Surname,Activity
Joanna,Kwiatkowska,13
Izabela,Wójcik,11
Aniela,Lewandowska,15
Piotr,Kowalczyk,11
Matylda,Mazur,13
Róża,Szymańska,13
Małgorzata,Kaczmarek,14
Marcel,Lewandowski,12
Aniela,Kaczmarek,13
Klaudia,Dąbrowska,11


### Podzapytania w `WHERE`

> Przykład
> 
> Zapytania zwracające w wyniku pojedynczą wartość możemy użyć np. w wyrażeniach warunkowych (`WHERE`, `HAVING`). 
> 
> Mając zapytanie o średnią liczbę wypożyczeń dokonanych przez użytkownika, możemy napisać zapytanie zwracające listę użytkowników pożyczających więcej książek niż średnia.

In [48]:
%%sql
SELECT COUNT(DISTINCT borrowings.ID) / COUNT(DISTINCT borrowings.User_ID) FROM borrowings;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


COUNT(DISTINCT borrowings.ID) / COUNT(DISTINCT borrowings.User_ID)
8


In [49]:
%%sql
SELECT users.Name, users.Surname, COUNT(borrowings.ID) AS Books_borrowed
FROM users JOIN borrowings ON users.ID = borrowings.User_ID GROUP BY users.ID
HAVING Books_borrowed > 8;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


name,surname,Books_borrowed
Adam,Woźniak,10
Leon,Kaczmarek,9
Joanna,Kwiatkowska,13
Michał,Zieliński,10
Małgorzata,Woźniak,9
Joanna,Kaczmarek,10
Izabela,Wójcik,11
Klaudia,Lewandowska,10
Izabela,Kamińska,10
Piotr,Piotrowski,9


In [50]:
%%sql
SELECT users.Name, users.Surname, COUNT(borrowings.ID) AS Books_borrowed
FROM users JOIN borrowings  ON users.ID = borrowings.User_ID GROUP BY users.ID
HAVING Books_borrowed > (
    SELECT COUNT(DISTINCT borrowings.ID) / COUNT(DISTINCT borrowings.User_ID) FROM borrowings
);

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


name,surname,Books_borrowed
Adam,Woźniak,10
Leon,Kaczmarek,9
Joanna,Kwiatkowska,13
Michał,Zieliński,10
Małgorzata,Woźniak,9
Joanna,Kaczmarek,10
Izabela,Wójcik,11
Klaudia,Lewandowska,10
Izabela,Kamińska,10
Piotr,Piotrowski,9


### Podzapytania w `SELECT`

> **Przykład:**
>
> Analogicznie do poprzedniego przypadku - jeśli podzapytanie zwraca pojedynczą wartość, możemy je użyć jako jedną z kolumn w głównym zapytaniu.
>
> Co ważne - w podzapytaniu (w tym przypadku z tabeli `borrowings`) możemy odwołać się do tabeli i pól z zapytania zewnętrznego (`users`).

In [51]:
%%sql
SELECT users.Name, users.Surname, 
(
    SELECT COUNT(borrowings.ID) FROM borrowings WHERE borrowings.User_ID = users.ID
) 
AS Books FROM users;

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


name,surname,Books
Igor,Piotrowski,8
Róża,Lewandowska,8
Adam,Woźniak,10
Michał,Kowalczyk,7
Leon,Kaczmarek,9
Joanna,Kwiatkowska,13
Michał,Zieliński,10
Małgorzata,Woźniak,9
Joanna,Kaczmarek,10
Izabela,Wójcik,11


### Wydajność

Nie musimy się martwić o wydajność takich podzapytań - mimo że pozornie liczenie średniej liczby wypożyczeń powinno się wykonywać z osobna dla każdego rekordu użytkownika, baza danych optymalizuje plan zapytania. Jeśli chcemy sprawdzić, jak nasze zapytanie przekłada się na operacje wykonywane w bazie, możemy przed treścią zapytania dodać komendę `EXPLAIN QUERY PLAN` - zapytanie nie zostanie wtedy wykonane, otrzymamy jednak listę kroków, które baza danych chce wykonać.

> **Przykład:**
> 
> Zapytanie łączy tabelę `users` z `borrowings`, grupuje wyniki według użytkownika i filtruje tych, którzy wypożyczyli więcej książek niż średnia liczba wypożyczeń na użytkownika. `EXPLAIN QUERY PLAN` pokazuje, że SQLite wykonuje skanowanie tabeli `users`, a następnie używa **filtra Bloom**, który jest strukturą danych pozwalającą szybko sprawdzić, czy dany element może należeć do zbioru (kosztem rzadkich fałszywych trafień). Dzięki temu liczba sprawdzanych rekordów w `borrowings` jest mniejsza. Dla grupowania SQLite tworzy **tymczasowe B-drzewo**, czyli zbalansowaną strukturę indeksową optymalizującą operacje wyszukiwania i sortowania. Podzapytanie liczące średnią wypożyczeń również korzysta z **tymczasowego B-drzewa**, aby efektywnie przetwarzać unikalne wartości.

In [52]:
%%sql
EXPLAIN QUERY PLAN 
SELECT users.Name, users.Surname, COUNT(borrowings.ID) AS Books_borrowed
FROM users JOIN borrowings ON users.ID = borrowings.User_ID GROUP BY users.ID
HAVING Books_borrowed > (
    SELECT COUNT(DISTINCT borrowings.ID) / count(DISTINCT borrowings.User_ID) FROM borrowings
);

 * sqlite:///library.db?mode=rw
   sqlite:///simple_library.db?mode=rw
Done.


id,parent,notused,detail
7,0,0,SCAN users
11,0,0,BLOOM FILTER ON borrowings (user_id=?)
21,0,0,SEARCH borrowings USING AUTOMATIC COVERING INDEX (user_id=?)
28,0,0,USE TEMP B-TREE FOR GROUP BY
63,0,0,SCALAR SUBQUERY 1
68,63,0,USE TEMP B-TREE FOR count(DISTINCT)
70,63,0,USE TEMP B-TREE FOR count(DISTINCT)
72,63,0,SCAN borrowings
