# INTERMEDIATE SQL 

Bu başlık altında üzerine eğileceğimiz konular : 

✓ Verileri filtreleme ve karşılaştırma

✓ Verileri özetlemek için toplama işlevlerini kullanma

✓ Verileri sıralama ve gruplandırma

✓ Rounding (yuvarlama) ve aliasing (örtüşme) gibi araçları kullanarak verilerimizi nasıl temiz bir şekilde sunabiliriz

Bu başlık altında sorgu yaparken kullanacağımız veritabanının şeması : 

![dvd-rental-sample-database-diagram.png](attachment:dvd-rental-sample-database-diagram.png)

Veritabanının linki = https://www.postgresqltutorial.com/postgresql-getting-started/postgresql-sample-database/

SQL uzantısını yükleyelim: 

In [1]:
%load_ext sql

Bilgisayarımızda kurulu olan dvdrental veritabanına bağlanalım: 

In [2]:
%sql postgresql://postgres:1q2w3e4r5t@localhost:5432/dvdrental

# Selecting Data (Verileri Seçme)

Bu ilk bölümde, kullanacağımız veritabanındaki verilerin tümünü ya da belli bir kısmını nasıl seçeceğimizi göreceğiz. Ayrıca SQL kodunun nasıl yürütüldüğünü ve biçimlendirildiğini de anlayacağız.

### < Querying a Database (Bir veritabanını Sorgulamak) > 

**Query (Sorgu) :** Bir veri tabanından veri talep etmektir. 

#### COUNT() 

+ Bir sütundaki NULL olmayan değerlerin sayısını döndürür.

Aşağıdaki sorguda, "customer" tablosundan "first_name" sütununu döndürelim ve bir sonraki sorguda da **COUNT()** Null olmayan değerlerin sayısını döndürelim.

In [3]:
%%sql 

SELECT first_name
FROM customer
LIMIT 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


first_name
Jared
Mary
Patricia
Linda
Barbara
Elizabeth
Jennifer
Maria
Susan
Margaret


In [4]:
%%sql

SELECT COUNT(first_name) AS count_first_names 
FROM customer;

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


count_first_names
599


Birden fazla sütunu saymak istiyorsak, **COUNT()** 'u saymak istediğimiz sütun kadar kullanmamız gerekir. Aşağıdaki sorguda bunu yapalım.

In [5]:
%%sql 

SELECT COUNT(first_name)  AS count_first_names, 
COUNT(last_name)  AS count_last_names
FROM customer;

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


count_first_names,count_last_names
599,599


Bir tablodaki bütün kayıt sayısını (Null olmayan) saymak için **COUNT(*)** kullanırız. Aşağıdaki sorguda bunu "inventory" tablosu için yapalım. 

In [6]:
%%sql

SELECT COUNT(*) AS total_records_inventory_table 
FROM inventory;

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


total_records_inventory_table
4581


Aşağıdaki sorguda, eşsiz olan kayıt sayısnı tespit etmek için **COUNT()** ve **DISTINCT** işlevlerini "customer" tablosunun, "first_name" sütunu üzerinde beraber kullanalım. 

+ Yukarıdaki sorgularda, count_first_names = 599 iken count_distinct_first_names = 591 gelecek. Yani 8 tane aynı isme sahip insan varmış.

In [7]:
%%sql

SELECT COUNT(DISTINCT first_name) AS count_distinct_first_names 
FROM customer;

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


count_distinct_first_names
591


#### ORDER BY 

+ Bir tablodan veri sorguladığımızda, SELECT deyimi, satırları belirtilmemiş bir sırada döndürür. Sonuç kümesinin satırlarını sıralamak için SELECT ifadesinde ORDER BY yan tümcesini kullanırız. Eğer satırları artan düzende sıralamak istiyorsak **ASC**, azalan düzende sıralamak istiyorsak **DESC** kullanırız.

Aşağıdaki sorguda, customer tablosu üzerinde ORDER BY işlevini, ASC ile kullanalım.

In [8]:
%%sql 

SELECT first_name, last_name
FROM customer
ORDER BY first_name ASC
LIMIT 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


first_name,last_name
Aaron,Selby
Adam,Gooch
Adrian,Clary
Agnes,Bishop
Alan,Kahn
Albert,Crouse
Alberto,Henning
Alex,Gresham
Alexander,Fennell
Alfred,Casillas


Aşağıdaki sorguda, customer tablosu üzerinde ORDER BY işlevini, DESC ile kullanalım.

In [9]:
%%sql

SELECT first_name, last_name
FROM customer
ORDER BY last_name DESC
LIMIT 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


first_name,last_name
Cynthia,Young
Marvin,Yee
Luis,Yanez
Brian,Wyman
Brenda,Wright
Tyler,Wren
Florence,Woods
Lori,Wood
Virgil,Wofford
Darren,Windham


Aşağıdaki sorguda, customer tablosu üzerinde ORDER BY işlevini, ASC ve DESC ile kullanalım.

In [10]:
%%sql

SELECT first_name, last_name
FROM customer
ORDER BY first_name ASC, last_name DESC
LIMIT 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


first_name,last_name
Aaron,Selby
Adam,Gooch
Adrian,Clary
Agnes,Bishop
Alan,Kahn
Albert,Crouse
Alberto,Henning
Alex,Gresham
Alexander,Fennell
Alfred,Casillas


### < SQL Execution (SQL Yürütme) >  

Birçok programlama dilinden farklı olarak SQL kodu yazıldığı sırayla işlenmez. Dolaptan bir kaban almak istediğimizi düşünelim. Önce, hangi dolabın kabanları içerdiğini bilmemiz gerekiyor. Bu, işlenecek ilk satır olan **FROM** ifadesine benzer. Yani, herhangi bir verinin seçilebilmesi için önce verinin seçileceği tablonun bilinmesi gerekir. Ardından seçim yapılır. Bu da **SELECT** ifadesine benzer. Ardından ne kadar veri gösterileceği belirlenir. Bu da **LIMIT** ifadesine benzer. Sıralamanın nasıl olduğunu bilmek, hata ayıklama gibi durumlarda bize kolaylık sağlar.

Yani sıralama şu şekilde : 

**SELECT** name (2)

**FROM** people (1)

**LIMIT** 10; (3)

Ayrıca SQL sorgusu yaparken sıkça karşılaşabileceğimiz hatalar şunlardır : 

+ Misspelling (Yazım hatası)
+ Incorrect capitalization (Yanlış büyük harf kullanımı)
+ Incorrect or missing punctuation (Yanlış veya eksik noktalama)

# Filtering Data (Verileri Filtreleme)

Bu başlık altında verileri filtremek için kullanacağımız SQL işlevlerini öğreneceğiz.

####  WHERE 

+ SELECT ifadesi tarafından döndürülen satırları filtrelemeyi sağlar. Yani döndürülen sütunların, satırlarındaki spesifik bir özelliği filtrelemekte kullanılır. WHERE kullanımında **AND**, **OR**, **IN**, **LIKE**, **BETWEEN**, **<> (eşit değildir)** operatörleri kullanılabilir.  

Aşağıdaki sorgularda, WHERE kullanımını customer tablosu üzerinde deneyelim.

In [11]:
%%sql

SELECT last_name, first_name
FROM customer
WHERE first_name = 'Jamie'

 * postgresql://postgres:***@localhost:5432/dvdrental
2 rows affected.


last_name,first_name
Rice,Jamie
Waugh,Jamie


Aşağıdaki sorguda, WHERE kullanımını AND operatörüyle customer tablosu üzerinde deneyelim.

In [12]:
%%sql 

SELECT last_name, first_name
FROM customer
WHERE first_name = 'Jamie' AND last_name = 'Rice'

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


last_name,first_name
Rice,Jamie


Aşağıdaki sorguda, WHERE kullanımını OR operatörü ile customer tablosu üzerinde deneyelim.

In [13]:
%%sql 

SELECT first_name, last_name
FROM customer
WHERE last_name = 'Rodriguez' OR first_name = 'Adam';

 * postgresql://postgres:***@localhost:5432/dvdrental
2 rows affected.


first_name,last_name
Laura,Rodriguez
Adam,Gooch


Aşağıdaki sorguda, WHERE kullanımını IN operatörü ile customer tablosu üzerinde deneyelim.

In [14]:
%%sql

SELECT first_name, last_name
FROM customer
WHERE first_name IN ('Ann', 'Anne', 'Annie');

 * postgresql://postgres:***@localhost:5432/dvdrental
3 rows affected.


first_name,last_name
Ann,Evans
Anne,Powell
Annie,Russell


Aşağıdaki sorguda, WHERE kullanımını LIKE operatörü ile customer tablosu üzerinde deneyelim.

In [15]:
%%sql

SELECT first_name, last_name
FROM customer
WHERE first_name LIKE 'Ann%'

 * postgresql://postgres:***@localhost:5432/dvdrental
5 rows affected.


first_name,last_name
Anna,Hill
Ann,Evans
Anne,Powell
Annie,Russell
Annette,Olson


+ % işareti, Ann ile başlayan bütün değerleri getirmesini sağladı. 

Aşağıdaki sorguda, WHERE kullanımını BETWEEN operatörü ile customer tablosu üzerinde deneyelim.

In [16]:
%%sql 

SELECT first_name, LENGTH(first_name) name_length
FROM customer
WHERE first_name LIKE 'A%' AND LENGtH(first_name) BETWEEN 3 AND 5
ORDER BY name_length;

 * postgresql://postgres:***@localhost:5432/dvdrental
22 rows affected.


first_name,name_length
Amy,3
Ann,3
Ana,3
Andy,4
Anna,4
Anne,4
Alma,4
Adam,4
Alan,4
Alex,4


Aşağıdaki sorguda, WHERE kullanımını (<>) operatörleri ile customer tablosu üzerinde deneyelim.

In [17]:
%%sql 

SELECT first_name, last_name
FROM customer
WHERE first_name LIKE 'Bra%' AND last_name <> 'Motley';

 * postgresql://postgres:***@localhost:5432/dvdrental
3 rows affected.


first_name,last_name
Brandy,Graves
Brandon,Huey
Brad,Mccurdy


#### FETCH 

+ LIMIT ile aynı işlevi görür. LIMIT işlevi bir SQL standartı değilken FETCH işlevi bir SQL standartıdır.

Aşağıdaki sorgularda, FETCH işlevinin kullanımlarını film tablosu üzerinde deneyelim.

In [18]:
%%sql

SELECT film_id, title
FROM film
ORDER BY title
FETCH FIRST ROW ONLY;

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


film_id,title
1,Academy Dinosaur


In [19]:
%%sql 

SELECT film_id, title
FROM film
ORDER BY title 
FETCH FIRST 1 ROW ONLY;

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


film_id,title
1,Academy Dinosaur


In [20]:
%%sql 

SELECT film_id, title
FROM film
ORDER BY title
FETCH FIRST 5 ROW ONLY;

 * postgresql://postgres:***@localhost:5432/dvdrental
5 rows affected.


film_id,title
1,Academy Dinosaur
2,Ace Goldfinger
3,Adaptation Holes
4,Affair Prejudice
5,African Egg


Aşağıdaki sorguda, FETCH işlevinden önce **OFFSET**, yani telafi işlevini kullanalım. OFFSET, FETCH ile döndürülecek satırlardan önceki kaç satırın döndürülmeyeceğini söyler. (Biraz karışık oldu)

In [21]:
%%sql

SELECT film_id, title
FROM film 
ORDER BY title
OFFSET 5 ROWS
FETCH FIRST 5 ROW ONLY;

 * postgresql://postgres:***@localhost:5432/dvdrental
5 rows affected.


film_id,title
6,Agent Truman
7,Airplane Sierra
8,Airport Pollock
9,Alabama Devil
10,Aladdin Calendar


+ Göreceğiz ki ilk 5 satırı atlayıp sonraki ilk 5 satırı yazdıracak. OFFSET kaç satırın atlanılacağını belirtmemize yarıyor.

#### IN (WHERE IN) 

+ Bir değerin listedeki herhangi bir değerle eşleşip eşleşmediğini kontrol etmek için WHERE yan tümcesinde IN operatörü kullanılır.

Aşağıdaki sorguda, IN işlevini rental tablosunda uygulayalım.

In [22]:
%%sql

SELECT customer_id, rental_id, return_date
FROM rental
WHERE customer_id IN (1, 2)
ORDER BY return_date DESC;

 * postgresql://postgres:***@localhost:5432/dvdrental
59 rows affected.


customer_id,rental_id,return_date
2,15145,2005-08-31 15:51:04
1,15315,2005-08-30 01:51:46
2,14743,2005-08-29 00:18:56
1,15298,2005-08-28 22:49:37
2,14475,2005-08-27 08:59:32
1,14825,2005-08-27 07:01:57
2,15907,2005-08-25 23:23:35
2,12963,2005-08-23 11:37:04
1,13176,2005-08-23 08:50:54
1,14762,2005-08-23 01:30:57


+ customer_id sütunundaki, değerleri 1 ve 2 olan satırları döndürdü. 

In [23]:
%%sql 

SELECT customer_id, rental_id, return_date
FROM rental
WHERE customer_id NOT IN (1, 2)
LIMIT 10 ;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


customer_id,rental_id,return_date
459,2,2005-05-28 19:40:33
408,3,2005-06-01 22:12:39
333,4,2005-06-03 01:43:41
222,5,2005-06-02 04:33:21
549,6,2005-05-27 01:32:07
269,7,2005-05-29 20:34:53
239,8,2005-05-27 23:33:46
126,9,2005-05-28 00:22:40
399,10,2005-05-31 22:44:21
142,11,2005-06-02 20:56:02


+ customer_id sütunundaki, değerleri 1 ve 2 olmayan satırları döndürdü.

Aşağıdaki sorgularda biraz subquery (alt sorgu) olayına ineceğiz ve IN işlevinin subqery'deki kullanımını da göreceğiz. İade tarihi 2005-05-27 olan kiralama tablosundaki müşteri kimliklerinin bir listesini döndürelim.

In [24]:
%%sql 

SELECT customer_id
FROM rental
WHERE CAST (return_date AS DATE) = '2005-05-27'
ORDER BY customer_id;

 * postgresql://postgres:***@localhost:5432/dvdrental
49 rows affected.


customer_id
37
47
48
65
73
75
93
114
119
131


Yukarıdaki sorgu bir değerler listesi döndürdüğünden, bunu IN operatörünün girişi olarak şu şekilde kullanabiliriz:

In [25]:
%%sql 

SELECT customer_id, first_name, last_name
FROM customer
WHERE customer_id IN (SELECT customer_id
                     FROM rental
                     WHERE CAST (return_date AS DATE) = '2005-05-27')
ORDER BY customer_id;

 * postgresql://postgres:***@localhost:5432/dvdrental
49 rows affected.


customer_id,first_name,last_name
37,Pamela,Baker
47,Frances,Parker
48,Ann,Evans
65,Rose,Howard
73,Beverly,Brooks
75,Tammy,Sanders
93,Phyllis,Foster
114,Grace,Ellis
119,Sherry,Marshall
131,Monica,Hicks


#### BETWEEN 

+ Bir değer aralığındaki verileri seçmemize olanak sağlar.  

Aşağıdaki sorguda, BETWEEN işlevini payment tablosunda kullanalım.

In [26]:
%%sql 

SELECT customer_id, payment_id, amount
FROM payment
WHERE amount BETWEEN 8 AND 9
LIMIT 10 

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


customer_id,payment_id,amount
343,17517,8.99
347,17529,8.99
347,17532,8.99
348,17535,8.99
349,17540,8.99
379,17648,8.99
403,17747,8.99
409,17775,8.99
423,17817,8.99
431,17853,8.99


+ amount sütunundaki değerleri 8 ve 9 arasında olan satırları döndürdü.

In [27]:
%%sql 

SELECT customer_id, payment_id, amount
FROM payment
WHERE amount NOT BETWEEN 8 AND 9
LIMIT 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


customer_id,payment_id,amount
341,17503,7.99
341,17504,1.99
341,17505,7.99
341,17506,2.99
341,17507,7.99
341,17508,5.99
342,17509,5.99
342,17510,5.99
342,17511,2.99
343,17512,4.99


+ amount sütunundaki değerleri 8 ve 9 olmayan satırları döndürdü.

In [28]:
%%sql 

SELECT customer_id, payment_id, amount, payment_date
FROM payment
WHERE payment_date BETWEEN '2007-02-07' AND '2007-02-15';

 * postgresql://postgres:***@localhost:5432/dvdrental
27 rows affected.


customer_id,payment_id,amount,payment_date
368,17610,0.99,2007-02-14 23:25:11.996577
370,17617,6.99,2007-02-14 23:33:58.996577
402,17743,4.99,2007-02-14 23:53:34.996577
416,17793,2.99,2007-02-14 21:21:59.996577
432,17854,5.99,2007-02-14 23:07:27.996577
481,18051,2.99,2007-02-14 22:03:35.996577
512,18155,6.99,2007-02-14 22:57:03.996577
516,18173,4.99,2007-02-14 21:23:39.996577
546,18276,1.99,2007-02-14 23:10:43.996577
561,18322,2.99,2007-02-14 23:52:46.996577


+ payment_date sütunundaki tarihleri '2007-02-07' ve '2007-02-15' arasındakileri döndürdü.

#### LIKE 

+ Aradığımız verinin ne olduğunu tam hatırlamadığımız ancak belirli bir kısmını hatırladığımız durumlarda, o hatırladığımız kısmı kullanarak aradığımız veriyi bulmamızda yardımcı olur. Mesela, bir müşteri bulmak istiyoruz ama onun adını tam olarak hatırlamıyoruz. Ancak, adının Jen gibi bir şeyle başladığını hatırlıyoruz...

+ Metinleri (Text) filtrelemede kullanılır.

Aşağıdaki sorgularda LIKE işlevini kullanalım.  

In [29]:
%%sql

SELECT first_name, last_name
FROM customer
WHERE first_name LIKE 'Jen%';

 * postgresql://postgres:***@localhost:5432/dvdrental
3 rows affected.


first_name,last_name
Jennifer,Davis
Jennie,Terry
Jenny,Castro


+ Jen'den sonra gelen **" % "** operatörü, "Jen" ile başlayan ve "Jen"'den sonra herhangi bir ifade bulunduran satırları döndürdü.  

In [30]:
%%sql 

SELECT first_name, last_name
FROM customer 
WHERE first_name LIKE '_her%'
ORDER BY first_name;

 * postgresql://postgres:***@localhost:5432/dvdrental
4 rows affected.


first_name,last_name
Cheryl,Murphy
Sherri,Rhodes
Sherry,Marshall
Theresa,Watson


+ **" _ " (alt çizgi)** işareti, "her" ifadesinden önce herhangi bir ifade bulunduran satırların da dönmesini ve **" % "** işareti, "her" ifadesinden sonra ifade bulunduran satırların dönmesini sağladı.  

In [31]:
%%sql 

SELECT first_name, last_name
FROM customer
WHERE first_name NOT LIKE 'Jen%'
ORDER BY first_name
LIMIT 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


first_name,last_name
Aaron,Selby
Adam,Gooch
Adrian,Clary
Agnes,Bishop
Alan,Kahn
Albert,Crouse
Alberto,Henning
Alex,Gresham
Alexander,Fennell
Alfred,Casillas


+ "Jen" ile başlamayan ilk 10 satırı döndürdü.

#### IS NULL  

+ Bir değerin NULL olup olmadığını kontrol etmek için kullanılır.

Aşağıdaki sorguda, CREATE TABLE işlevi ile bir veritabanı oluşturalım. Oluşturacağımız veritabanı üzerinde IS NULL işlevini uygulayalım. 

In [32]:
%%sql 

CREATE TABLE contacts(
    id SERIAL,
    first_name VARCHAR(50) NOT NULL,
    last_name VARCHAR(50) NOT NULL,
    email VARCHAR(255) NOT NULL,
    phone VARCHAR(15),
    PRIMARY KEY (id)
);

 * postgresql://postgres:***@localhost:5432/dvdrental
(psycopg2.errors.DuplicateTable) relation "contacts" already exists

[SQL: CREATE TABLE contacts(
    id SERIAL,
    first_name VARCHAR(50) NOT NULL,
    last_name VARCHAR(50) NOT NULL,
    email VARCHAR(255) NOT NULL,
    phone VARCHAR(15),
    PRIMARY KEY (id)
);]
(Background on this error at: https://sqlalche.me/e/14/f405)


Oluşturduğumuz veritabanına iki kişiyi ekleyelim, birinin telefon numarası vardır ve diğerinin yoktur.

In [33]:
%%sql 

INSERT INTO contacts(first_name, last_name, email, phone)
VALUES ('John','Doe','john.doe@example.com',NULL),
    ('Lily','Bush','lily.bush@example.com','(408-234-2764)');

 * postgresql://postgres:***@localhost:5432/dvdrental
2 rows affected.


[]

NULL ile telefon numarası olmayan kişiyi bulalım.

In [34]:
%%sql 

SELECT id, first_name, last_name, email, phone
FROM contacts
WHERE phone = NULL;

 * postgresql://postgres:***@localhost:5432/dvdrental
0 rows affected.


id,first_name,last_name,email,phone


+ Deyim satır döndürmez. Bunun nedeni, WHERE yan tümcesindeki phone = NULL ifadesinin her zaman false döndürmesidir.

IS NULL ile telefon numarası olmayan kişiyi bulmaya çalışalım.

In [35]:
%%sql 

SELECT id, first_name, last_name, email, phone
FROM contacts
WHERE phone IS NULL;

 * postgresql://postgres:***@localhost:5432/dvdrental
6 rows affected.


id,first_name,last_name,email,phone
1,John,Doe,john.doe@example.com,
3,John,Doe,john.doe@example.com,
5,John,Doe,john.doe@example.com,
7,John,Doe,john.doe@example.com,
9,John,Doe,john.doe@example.com,
11,John,Doe,john.doe@example.com,


In [36]:
%%sql

SELECT
    id,
    first_name,
    last_name,
    email,
    phone
FROM
    contacts
WHERE
    phone IS NOT NULL;

 * postgresql://postgres:***@localhost:5432/dvdrental
6 rows affected.


id,first_name,last_name,email,phone
2,Lily,Bush,lily.bush@example.com,(408-234-2764)
4,Lily,Bush,lily.bush@example.com,(408-234-2764)
6,Lily,Bush,lily.bush@example.com,(408-234-2764)
8,Lily,Bush,lily.bush@example.com,(408-234-2764)
10,Lily,Bush,lily.bush@example.com,(408-234-2764)
12,Lily,Bush,lily.bush@example.com,(408-234-2764)


In [37]:
%%sql 

SELECT COUNT(*) AS count_phones
FROM contacts
WHERE phone IS NULL

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


count_phones
6


+ Kaç tane verinin NULL olduğunu döndürdük. 

# Aggregate Functions (Toplama İşlevleri)

SQL, bir veri kümesinin tamamını, alt kümelerini ve tek tek kayıtlarını daha iyi anlamak için yakınlaştırıp uzaklaştırmanıza olanak tanır. Toplama işlevlerini kullanarak verileri özetlemeyi öğrenecek ve sorgular içinde temel aritmetik hesaplamalar yapmayı öğreneceğiz.

### < Summarizing Data (Verileri Özetlemek) > 

SQL'in toplama işlevlerini kullanarak verileri özetleyeceğiz. 'dvdrental' veritabanının, payment tablosunun, amount sütunu üzerinde denemelerimizi yapacağız.

In [38]:
%%sql

SELECT amount
FROM payment
LIMIT 10; 

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


amount
7.99
1.99
7.99
2.99
7.99
5.99
5.99
5.99
2.99
4.99


####  AVG()

+ Girilen sütununun ortalamasını hesaplar.

In [39]:
%%sql

SELECT AVG(amount) AS avg_amount
FROM payment

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


avg_amount
4.200605645382296


#### SUM()

+ Girilen sütundaki değerlerin toplamını hesaplar.

In [40]:
%%sql 

SELECT SUM(amount) AS sum_amount
FROM payment

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


sum_amount
61312.04


#### MAX() VE MIN() 

+ Girilen sütundaki max ve min değerleri döndürürler.

In [41]:
%%sql 

SELECT MIN(amount) AS min_amount
FROM payment

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


min_amount
0.0


In [42]:
%%sql 

SELECT MAX(amount) AS max_amount
FROM payment

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


max_amount
11.99


### < Summarizing Subsets (Alt Kümeleri Özetlemek) >  

Bu bölümde, verilerimizden daha fazla bilgi edinebilmek için bir önceki bölümde gördüğümüz işlevleri WHERE ile kullanacağız ve yeni bir işlev daha öğreneceğiz.

Aşağıdaki sorgularda, 'dvdrental' veritabanının film tablosu üzerinde denemelerimizi yapalım. 

In [43]:
%%sql 

SELECT SUM(length) AS sum_length
FROM film
WHERE release_year = 2006

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


sum_length
115272


+ Yayın yılı 2006 olan filmlerin sürelerinin uzunluğunu topladık.

In [44]:
%%sql 

SELECT AVG(length) AS avg_length
FROM film
WHERE release_year = 2006

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


avg_length
115.272


+ Yayın yılı 2006 olan filmlerin sürelerinin uzunluğunun ortalamasını hesapladık.

In [45]:
%%sql

SELECT MAX(length) AS max_length
FROM film
WHERE release_year = 2006

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


max_length
185


+ Yayın yılı 2006 olan filmlerin sürelerinin uzunluğu max olanı döndürdük.

In [46]:
%%sql

SELECT MIN(length) AS min_length
FROM film
WHERE release_year = 2006

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


min_length
46


+ Yayın yılı 2006 olan filmlerin sürelerinin uzunluğu min olanı döndürdük.

#### ROUND() 

+ Bir sayıyı, belirli ondalık sayıya yuvarlamak için kullanılır.

  2 Adet Parametresi Vardır:

      -> number_to_round = Yuvarlamak istediğimiz sayı 

      -> decimal_places = Yuvarlamak istediğimiz basamak

Aşağıdaki sorguda, film tablosundaki length sütununun ortalaması üzerinde ROUND() işlevini deneyelim.

In [47]:
%%sql 

SELECT ROUND(AVG(length), 2) AS avg_length
FROM film
WHERE release_year >= 2006;

 * postgresql://postgres:***@localhost:5432/dvdrental
1 rows affected.


avg_length
115.27


+ Normalde ortalamsı '115.2720000000000000' olan length sütununun ortalamasını virgülden sonra 2 basamaklı olacak şekilde yuvarladık.

# Sorting and Grouping (Sıralama ve Gruplama)

Bu bölümde, verileri nasıl sıralayacağımızı ve gruplandıracağınızı öğreneceğiz. Bu beceriler, kritik iş içgörülerini ortaya çıkarmamıza ve trendleri ve performansı belirlememize yardımcı olarak analizlerinizi yeni bir düzeye taşıyacaktır.

### < Sorting Results (Sonuçları Sıralamak) > 

Yukarıdaki bölümlerde gördüğümüz ORDER BY işlevinin örneklerini daha da derinleştireceğiz.

In [48]:
%%sql 

SELECT title
FROM film 
ORDER BY release_year ASC
LIMIT 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


title
Grosse Wonderful
Airport Pollock
Bright Encounters
Academy Dinosaur
Ace Goldfinger
Adaptation Holes
Affair Prejudice
African Egg
Agent Truman
Chamber Italian


+ Sıraladığımız alanı SELECT ile seçmek zorunda değiliz. 

In [49]:
%%sql

SELECT title, length 
FROM film 
ORDER BY length DESC
LIMIT 10; 

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


title,length
Soldiers Evolution,185
Sweet Brotherhood,185
Gangs Pride,185
Pond Seattle,185
Home Pity,185
Chicago North,185
Control Anthem,185
Darn Forrester,185
Muscle Bright,185
Worst Banger,185


+ title ve length sütunlarını döndürdük ancak sadece length sütununu sıraladık.

SQL sorgusu döndürülürken, döndürme sırası şu şekilde gerçekleşir: 

1-) FROM

2-) WHERE

3-) SELECT

4-) **ORDER BY**

5-) LIMIT

### < Grouping Data (Verileri Gruplandırmak) > 

Sonuçlarımızı gruplandırmayı göreceğiz.

#### GROUP BY  

+ SELECT ifadesinden döndürülen satırları gruplara ayırır.

Döndürülme sıralaması şu şekildedir: 

1-) FROM 

2-) WHERE

3-) **GROUP BY**

4-) HAVING

5-) SELECT

6-) DISTINCT

7-) ORDER BY

8-) LIMIT

In [50]:
%%sql 

SELECT rating, COUNT(title) AS title_count
FROM film
GROUP BY rating;

 * postgresql://postgres:***@localhost:5432/dvdrental
5 rows affected.


rating,title_count
PG,194
R,195
NC-17,210
PG-13,223
G,178


+ title sütununda bulunan değerleri, rating sütununa göre gruplandırdık. Sonuç olarak her rating türünde kaç tane eleman olduğunu görmüş olduk.

In [51]:
%%sql 

SELECT customer_id, SUM(amount) AS sum_amount
FROM payment
GROUP BY customer_id
LIMIT 10; 

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


customer_id,sum_amount
1,114.7
2,123.74
3,130.76
4,81.78
5,134.65
6,84.75
7,130.72
8,85.77
9,78.8
10,94.76


+ customer_id sütununundaki her bir benzersiz değer için, amount sütunundaki değerlerin toplanmış halini bulduk. Sonuç olarak her müşteriye ödenen toplam tutarı bulmuş olduk.

In [52]:
%%sql 

SELECT customer_id, SUM(amount) AS sum_amount
FROM payment
GROUP BY customer_id 
ORDER BY SUM(amount) DESC
LIMIT 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


customer_id,sum_amount
148,211.55
526,208.58
178,194.61
137,191.62
144,189.6
459,183.63
181,167.67
410,167.62
236,166.61
403,162.67


+ Her müşteriye ödenen toplam tutarı, sıralanmış bir şekilde yazdık.

In [53]:
%%sql 

SELECT customer_id, staff_id, SUM(amount)
FROM payment
GROUP BY staff_id, customer_id
ORDER BY customer_id
LIMIT 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
10 rows affected.


customer_id,staff_id,sum
1,1,60.85
1,2,53.85
2,1,55.86
2,2,67.88
3,1,59.88
3,2,70.88
4,1,49.88
4,2,31.9
5,1,63.86
5,2,70.79


+ amount (ödeme) sütunundaki değerlerin, customer_id ve staff_id sütunlarında karşılık gelen değerlerinin toplanmış halini gruplandırdık. customer_id ve staff_id'nin birleşiminde ortaya çıkan her bir benzersiz değerin amount sütununa karşılık gelen değerlerin toplamını bulduk. Evet biraz karışık oldu. 

#### HAVING 

+ Bir grup veya küme için bir arama koşulunu belirtir. HAVING yan tümcesi, belirli bir koşula göre grupları veya toplamaları filtrelemek için genellikle GROUP BY yan tümcesiyle birlikte kullanılır. WHERE'den farkı, WHERE bireysel kayıtları filtrelerken, HAVING gruplandırılmış kayıtları filtreler.

Döndürülme sırası: 

1-) FROM 

2-) WHERE

3-) GROUP BY

4-) **HAVING**

5-) SELECT

6-) DISTINCT

7-) ORDER BY

8-) LIMIT

In [54]:
%%sql

SELECT customer_id, SUM(amount)
FROM payment
GROUP BY customer_id 
HAVING SUM(amount) > 200; 

 * postgresql://postgres:***@localhost:5432/dvdrental
2 rows affected.


customer_id,sum
526,208.58
148,211.55


+ amount sütunundaki değerlerin toplamını, customer_id'deki eşsiz değerlere göre gruplandırdık ve toplamı 200'ün üzerinde olan değerleri döndürdük.

In [55]:
%%sql 

SELECT rating, COUNT(title)
FROM film
GROUP BY rating
HAVING COUNT(title) > 10;

 * postgresql://postgres:***@localhost:5432/dvdrental
5 rows affected.


rating,count
PG,194
R,195
NC-17,210
PG-13,223
G,178


+ Her rating türü için kaç tane title olduğunu gruplandırdık ve 10'dan büyük olanları döndürdük. 