## 1. Sqlite
Sqlite merupakan salah satu bagian dari light-weight database yang cenderung lebih ringan dibanding dengan jenis RDBMS lainnya seperti mysql ataupun postgresql

In [2]:
# import sqlite package
import sqlite3
import pandas as pd

In [3]:
#membuat database baru dengan sqlite 
conn = sqlite3.connect('/Users/jojomac/introduction_python/database/test_db.db/')

In [4]:
#cur atau cursor untuk menyatakan koneksi sqlite yang sedang aktif
cur = conn.cursor()

## 2. Basic Query

### 2.1 CREATE
CREATE meruapakan salah satu kueri yang digunakan untuk Data Defenition Languange (DDL) untuk membuat database baru

In [5]:
#create table employee
cur.execute('''CREATE TABLE employee (
              id INT, 
              name TEXT, 
              departement TEXT
            )''')

<sqlite3.Cursor at 0x114bcc440>

In [6]:
#create tabel departement
cur.execute('''CREATE TABLE departement (
              id INT, 
              departement_name TEXT
            )''')

<sqlite3.Cursor at 0x114bcc440>

In [7]:
#mengecek table yang masuk ke database test_db
cur.execute("SELECT name FROM sqlite_master WHERE type = 'table';")
print(cur.fetchall())


[('employee',), ('departement',)]


In [8]:
#insert data ke tabel yang baru dibuat
cur.execute("INSERT INTO employee VALUES (1,'Rian','HR'),(2,'Giggs','IT')")
cur.execute("INSERT INTO departement VALUES ('D01','HR')")

<sqlite3.Cursor at 0x114bcc440>

In [9]:
#commit digunakan apabila dilakukan perubahan pada database 
conn.commit()

In [10]:
pd.read_sql_query("SELECT * FROM employee", conn)

Unnamed: 0,id,name,departement
0,1,Rian,HR
1,2,Giggs,IT


In [11]:
pd.read_sql_query("SELECT * FROM departement", conn)

Unnamed: 0,id,departement_name
0,D01,HR


In [12]:
#open sample database 
conn_1 = sqlite3.connect('/Users/jojomac/introduction_python/database/chinook.db')

#membuat cursor
c_1 = conn_1.cursor()

In [13]:
c_1.execute("SELECT name FROM sqlite_master where type = 'table'")

<sqlite3.Cursor at 0x114bcf8c0>

In [14]:
#cek kolom yang ada pada sample database
print(c_1.fetchall())

[('albums',), ('sqlite_sequence',), ('artists',), ('customers',), ('employees',), ('genres',), ('invoices',), ('invoice_items',), ('media_types',), ('playlists',), ('playlist_track',), ('tracks',), ('sqlite_stat1',)]


### 2.2 SELECT
SELECT merupakan kueri yang digunakan untuk get atau fetch data dari database

In [15]:
sqlite_sample = pd.read_sql_query('select * from albums', conn_1)

In [16]:
sqlite_sample

Unnamed: 0,AlbumId,Title,ArtistId
0,1,For Those About To Rock We Salute You,1
1,2,Balls to the Wall,2
2,3,Restless and Wild,2
3,4,Let There Be Rock,1
4,5,Big Ones,3
...,...,...,...
342,343,Respighi:Pines of Rome,226
343,344,Schubert: The Late String Quartets & String Qu...,272
344,345,Monteverdi: L'Orfeo,273
345,346,Mozart: Chamber Music,274


In [17]:
#select column dari database
pd.read_sql_query("select AlbumId from albums", conn_1)

Unnamed: 0,AlbumId
0,1
1,4
2,2
3,3
4,5
...,...
342,342
343,344
344,345
345,346


### 2.3 LIMIT 
Limit digunakan untuk membatasi return value yang di get dari database, mirip seperti head pada pandas

In [18]:
pd.read_sql_query("select AlbumId from albums limit 5", conn_1)

Unnamed: 0,AlbumId
0,1
1,4
2,2
3,3
4,5


### 2.4 DISTINCT
DISTINCT digunakan untuk mereturn value yang unique dari sebuah kolom yang ada pada tabel

In [19]:
pd.read_sql_query("select distinct ArtistId from albums", conn_1)

Unnamed: 0,ArtistId
0,1
1,2
2,3
3,4
4,5
...,...
199,271
200,272
201,273
202,274


### 2.5 WHERE 

WHERE digunakan untuk menyatakan kondisi yang diambil dari sebuah kolom pada sebuah table.

In [20]:
pd.read_sql_query("select AlbumId, Title from albums where ArtistId = 271 ", conn_1)

Unnamed: 0,AlbumId,Title
0,342,"Locatelli: Concertos for Violin, Strings and C..."


### 2.6 AND

And digunakan untuk menambah kondisi yang diperlukan ketika melakukan return dari table, dengan ketentuan setiap kondisi harus bernilai True

In [21]:
pd.read_sql_query("select Title from albums where ArtistId = 271 and AlbumId = 342", conn_1)

Unnamed: 0,Title
0,"Locatelli: Concertos for Violin, Strings and C..."


### 2.7 OR
And digunakan untuk menambah kondisi yang diperlukan ketika melakukan return dari table, dengan ketentuan salah satu kondisi harus bernilai True

In [22]:
pd.read_sql_query("select ArtistId, AlbumId, Title from albums where ArtistId = 271 or AlbumId = 250", conn_1)

Unnamed: 0,ArtistId,AlbumId,Title
0,271,342,"Locatelli: Concertos for Violin, Strings and C..."
1,156,250,"The Office, Season 2"


### 2.8 IN

In digunakan ketika ingin mengembalikan sebuah value dari sebuah kolom dengan kondisi lebih dari 1, misalnya kita ingin mengembalikan artist id dengan nilai 371, 260 maka kita menggunakan in , sedangkan apabila cuma 1 value kita dapat menggunakan = 

In [23]:
pd.read_sql_query("select ArtistId, AlbumId, Title from albums where ArtistId IN(271, 148, 156)  ", conn_1)

Unnamed: 0,ArtistId,AlbumId,Title
0,148,228,"Heroes, Season 1"
1,156,249,"The Office, Season 1"
2,156,250,"The Office, Season 2"
3,156,251,"The Office, Season 3"
4,271,342,"Locatelli: Concertos for Violin, Strings and C..."


### 2.9 GROUP BY AND AGGREGATION

Group by digunakan untuk mengelompokkan suatu kolom , biasanya groupby didampingi dengan fungsi aggregasi untuk melakukan perhitungan, seperti perhitungan jumlah , ataupun mencari rata-rata, dll.

In [24]:
#mencari jumlah albumId berdasarkan ArtistId
pd.read_sql_query("select ArtistId, count(AlbumId) as jumlah_album from albums group by ArtistId",conn_1)

Unnamed: 0,ArtistId,jumlah_album
0,1,2
1,2,2
2,3,1
3,4,1
4,5,1
...,...,...
199,271,1
200,272,1
201,273,1
202,274,1


### 2.10 MULTIPLE GROUPBY 
Multiple Groupby dilakukan untuk melakukan group by dengan lebih dari 1 kolom 

In [25]:
#mencari jumlah albumId berdasarkan ArtistId
pd.read_sql_query("select Title, ArtistId, count(AlbumId) as jumlah_album from albums group by 1, 2",conn_1)

Unnamed: 0,Title,ArtistId,jumlah_album
0,...And Justice For All,50,1
1,20th Century Masters - The Millennium Collecti...,179,1
2,"A Copland Celebration, Vol. I",230,1
3,A Matter of Life and Death,90,1
4,A Real Dead One,90,1
...,...,...,...
342,Warner 25 Anos,6,1
343,Weill: The Seven Deadly Sins,264,1
344,Worlds,202,1
345,Zooropa,150,1


### 2.11 HAVING

Having penggunaan nya sangat mirip dengan where dimana kita melakukan return data berdasarkan kondisi tertentu, bedanya having biasanya didampingin dengan aggregating data , having juga digunakan setelah grouping atau group by sedangkan where digunakan sebelum group by 

In [26]:
#mencari jumlah albumId berdasarkan ArtistId
pd.read_sql_query("select ArtistId, count(AlbumId) as jumlah_album from albums group by ArtistId having count(AlbumId) > 2 ",conn_1)

Unnamed: 0,ArtistId,jumlah_album
0,8,3
1,21,4
2,22,14
3,27,3
4,50,10
5,51,3
6,58,11
7,59,3
8,68,3
9,82,4


### 2.12 ORDER BY 
ORDER BY digunakan untuk mengurutkan atau sorting kolom yang di return dan biasanya diikuti dengan keyword DESC atau ASC untuk menyatakan bentuk kembalian returnya (Descending atau Ascending) default valuenya adalah Ascending

In [28]:
#mencari jumlah albumId berdasarkan ArtistId
pd.read_sql_query("select ArtistId, count(AlbumId) as jumlah_album from albums group by ArtistId having jumlah_album > 1 order by jumlah_album DESC",conn_1)

Unnamed: 0,ArtistId,jumlah_album
0,90,21
1,22,14
2,58,11
3,50,10
4,150,10
5,114,6
6,118,5
7,21,4
8,82,4
9,84,4


### 2.13 BETWEEN AND 

Between and merupakan keyword yang diguanan untuk mereturn value pada range tertentu.

In [35]:
#mencari jumlah album Id
#mencari jumlah albumId berdasarkan ArtistId
pd.read_sql_query(""" 
                SELECT ArtistId, COUNT(AlbumId) AS jumlah_album
                    FROM albums
                GROUP BY ArtistId
                HAVING jumlah_album BETWEEN 9 AND 22
                ORDER BY jumlah_album DESC""",conn_1)

Unnamed: 0,ArtistId,jumlah_album
0,90,21
1,22,14
2,58,11
3,50,10
4,150,10


### 2.14 LIKE
Like merupakan keyword yang digunakan untuk mencari berdasarkan kata kunci like diikuti dengan tanda '%'<br>
1. LIKE 'abc%' digunakan untuk mencari kata berawalan abc<br>
2. LIKE '%abc' digunakan untuk mencari kata dengan akhiran abc<br>
3. LIKE '%abc%' digunakan untuk mencari kata yang mengandung abc

In [37]:
pd.read_sql_query(""" 
                SELECT * from albums where
                  title like '%one' """,conn_1)

Unnamed: 0,AlbumId,Title,ArtistId
0,81,One By One,84
1,95,A Real Dead One,90
2,96,A Real Live One,90


In [38]:
pd.read_sql_query(""" 
                SELECT * from albums where
                  title like 'the%' """,conn_1)

Unnamed: 0,AlbumId,Title,ArtistId
0,13,The Best Of Billy Cobham,10
1,20,The Best Of Buddy Guy - The Millenium Collection,15
2,47,The Best of Ed Motta,37
3,48,The Essential Miles Davis [Disc 1],68
4,49,The Essential Miles Davis [Disc 2],68
5,50,The Final Concerts (Disc 2),58
6,66,The Battle Rages On,58
7,72,The Cream Of Clapton,81
8,77,The Real Thing,82
9,82,The Colour And The Shape,84


In [39]:
pd.read_sql_query(""" 
                SELECT * from albums where
                  title like '%song%' """,conn_1)

Unnamed: 0,AlbumId,Title,ArtistId
0,137,The Song Remains The Same (Disc 1),22
1,138,The Song Remains The Same (Disc 2),22
2,262,Quiet Songs,197
