# Osa 3: Tietokannan ja taulujen luonti
Tässä osassa luodaan tietokanta, johon lisätään erilaisia tauluja.

## Tietokannan luominen
Tietokannan voi luoda useammalla eri tavalla.

<br></br>
### createdb
createdb on komentorivityökalu helpottamaan tietokannan luomista. Helpoimmillaan uuden tietokannan luominen onnistuukin komennolla:
```sh
createdb uuden_tietokannan_nimi
```
<img src="img/createdb.png" alt="createdb" style="width: 700px;"/>

> Kuten psql, myös createdb lukee tietokannan yhteysparametrit ympäristömuuttujista.

<br></br>
### PgAdmin
Kuten miltei kaikkeen muuhunkin, PgAdmin tarjoaa myös tietokantojen luomiseen ja poistamiseen graafisen ratkaisun: Klikkaa oikealla tietokantayhteydesta **> Create > Database**. 
<img src="img/createdb_pgadmin.gif" alt="createdb_pgadmin" style="width: 700px;"/>

### SQL
Perinteisin tapa tietokantojen luomiseen käy kuitenkin SQL:n kautta. Alla olevan komennon voi suorittaa psql:n tai PgAdminin [Query Toolin](H2_tyokalut.ipynb#Kyselytyökalun-käyttäminen-(Query-Tool)) avulla:

```sql
CREATE DATABASE uuden_tietokannan_nimi
```

## Tietokannan poistaminen

### dropdb
dropdb samoin kuin createdb on komentorivityökalu. Helpoimmillaan tietokannan voi poistaa komennolla:
```sh
dropdb poistettavan_tietokannan_nimi
```

<br></br>
### SQL
Samaan tapaan kuin luotaessa
```sql
DROP DATABASE poistettavan_tietokannan_nimi
```


## **Harjoitus 3.1**: Luo uusi tietokanta
Luo uusi tietokanta "koulutus" `createdb`:n, `pgAdmin`:in tai `psql`:n avulla.

<br></br>
### Tarkistus
Aja alla oleva solu yhdistääksesi luomaasi koulutus-tietokantaan ([SQL-solujen ohje](H1_jupyter_tutuksi.ipynb#SQL-solujen-ajaminen)).

In [6]:
# Lataa SQL-lisäosa
%load_ext sql
# Luo tietokantayhteys tietokantaan koulutus
from ipygis import get_connection_url
c_url = get_connection_url(dbname='koulutus')
%sql $c_url

The sql extension is already loaded. To reload it, use:
  %reload_ext sql



## Taulujen luominen
PostgreSQL tarjoaa monipuolisen tavan luoda tauluja, näkymiä ja materialisoituja näkymiä.


In [7]:
# Luo tietokantayhteys tietokantaan koulutus
from ipygis import get_connection_url
c_url = get_connection_url(dbname='koulutus')
%sql $c_url

Luodaan yksinkertainen tietokantataulu *kurssi* siten, että sillä on kentät koodi, nimi, pvm, tyyli ja kesto.

In [8]:
%%sql
DROP TABLE IF EXISTS kurssi CASCADE;

CREATE TABLE kurssi (
    koodi    varchar(5) CONSTRAINT firstkey PRIMARY KEY,
    nimi     text NOT NULL,
    pvm      date,
    tyyli    text,
    kesto    integer CHECK (kesto > 0)
);

COMMENT ON COLUMN kurssi.kesto IS 'Kurssin kesto tunteina';

 * postgresql://postgres:***@postgres_training:5432/koulutus
Done.
Done.
Done.


[]

Tauluja voi luoda myös SQL-kyselyiden tuloksien perusteella. Luodaan yksinkertainen taulu, johon tulisi kurssi-taulun rivit, joiden kesto on yksi.

In [9]:
%%sql
DROP TABLE IF EXISTS kurssi_1;

CREATE TABLE kurssi_1 AS (
    SELECT koodi, nimi, pvm, tyyli, 1 kesto FROM kurssi WHERE kesto = 1
);

 * postgresql://postgres:***@postgres_training:5432/koulutus
Done.
0 rows affected.


[]

Luonnollisestikin näkymä olisi järkevämpi vaihtoehto äskeiseen:

In [10]:
%%sql
DROP VIEW IF EXISTS kurssi_1_view;

CREATE view kurssi_1_view AS (
    SELECT koodi, nimi, pvm, tyyli, kesto FROM kurssi WHERE kesto = 1
);

 * postgresql://postgres:***@postgres_training:5432/koulutus
Done.
Done.


[]

### Rivien lisääminen
Tauluun voidaan lisätä rivejä `INSERT`-komennoilla, tai esimerkiksi kyselyjen tuloksien avulla

In [11]:
%%sql

INSERT INTO kurssi(koodi, nimi, pvm, tyyli, kesto) VALUES
    ('A1111', 'PG-peruskurssi', '2020-10-01', 'Jupyter', '15');

 * postgresql://postgres:***@postgres_training:5432/koulutus
1 rows affected.


[]

PostgreSQL:n avulla voi lisätä myös useamman rivin yhdellä kertaa ja jos arvot ovat samassa järjestyksessä, kuin kentät, ei kenttien nimiä tarvitse antaa

In [12]:
%%sql

INSERT INTO kurssi VALUES
    ('A1112', 'PG-kertaus', '2020-10-03', 'Jupyter', '1'),
    ('C1111', 'PG-peruskurssi', '2021-10-01', 'Jupyter', '15'),
    ('C1112', 'PG-seuraavan_vuoden', '2021-10-03', 'Jupyter', '1');

 * postgresql://postgres:***@postgres_training:5432/koulutus
3 rows affected.


[]

Rivejä voi lisätä myös kyselyjen tuloksena. Tässä hyödynnetään samalla  `WITH`-kyselyitä (CTE, Common Table Expressions).
```sql
WITH alikysely AS (SELECT 1 a, 2 b)

SELECT * FROM alikysely WHERE a = 1;
```

In [13]:
%%sql
WITH kertauskurssi AS (SELECT * FROM kurssi WHERE nimi like '%kertaus%')

INSERT INTO kurssi (
    SELECT 'B1111',  nimi, pvm, tyyli 
    FROM kertauskurssi
);

 * postgresql://postgres:***@postgres_training:5432/koulutus
1 rows affected.


[]

### Kyselyjen tekeminen
Tarkistetaan, että rivit ilmeistyivät tauluun. Tyypillisesti tähtikyselyitä tehdessä muista käyttää `LIMIT`-ehtoa rajoittaaksesi rivien määrää:

In [14]:
%sql SELECT * FROM kurssi LIMIT 10;

 * postgresql://postgres:***@postgres_training:5432/koulutus
5 rows affected.


koodi,nimi,pvm,tyyli,kesto
A1111,PG-peruskurssi,2020-10-01,Jupyter,15.0
A1112,PG-kertaus,2020-10-03,Jupyter,1.0
C1111,PG-peruskurssi,2021-10-01,Jupyter,15.0
C1112,PG-seuraavan_vuoden,2021-10-03,Jupyter,1.0
B1111,PG-kertaus,2020-10-03,Jupyter,


`WITH`-syntaksin avulla:

In [15]:
%%sql

WITH kertauskurssit AS (SELECT * FROM kurssi WHERE nimi LIKE '%kertaus%')
SELECT * FROM kertauskurssit ORDER BY koodi DESC;

 * postgresql://postgres:***@postgres_training:5432/koulutus
2 rows affected.


koodi,nimi,pvm,tyyli,kesto
B1111,PG-kertaus,2020-10-03,Jupyter,
A1112,PG-kertaus,2020-10-03,Jupyter,1.0


Tarksitetaan vielä näkymän rivit:

In [16]:
%sql SELECT * FROM kurssi_1_view LIMIT 10;

 * postgresql://postgres:***@postgres_training:5432/koulutus
2 rows affected.


koodi,nimi,pvm,tyyli,kesto
A1112,PG-kertaus,2020-10-03,Jupyter,1
C1112,PG-seuraavan_vuoden,2021-10-03,Jupyter,1


## **Harjoitus 3.2**
Harjoituksena on luoda uusi tietokantataulu `etunimet`, joka vastaa tiedoston [etunimet.csv](/edit/data/etunimet.csv) muotoa. Katso edeltäviä esimerkkejä kenttien tietotyyppien päättelemiseksi.

In [17]:
%%sql
DROP TABLE IF EXISTS etunimet;

CREATE ...


 * postgresql://postgres:***@postgres_training:5432/koulutus
Done.
(psycopg2.errors.SyntaxError) syntax error at or near ".."
LINE 1: CREATE ...
               ^

[SQL: CREATE ...]
(Background on this error at: http://sqlalche.me/e/13/f405)


In [18]:
%%sql
DROP TABLE IF EXISTS etunimet;

CREATE TABLE etunimet (
  nimi text NOT NULL,
  lukumaara integer NOT NULL,
  sukupuoli text NOT NULL
)

 * postgresql://postgres:***@postgres_training:5432/koulutus
Done.
Done.


[]

Nyt lisää tiedoston sisältö tauluun. Tämän voi tehdä SQL:n avulla seuraavasti (superuser-käyttäjällä):

```sql
COPY etunimet(nimi, lukumaara, sukupuoli)
FROM '/home/oppilas/pg-training/Harjoitukset/data/<tiedoston-nimi>'
CSV HEADER;
```

tai [psql](H2_tyokalut.ipynb#psql): avulla. Tällöin ei tarvitse olla superuser-käyttäjä (muista kirjautua oikeaan tietokantaan `\c`komennolla):

```
\COPY etunimet FROM '/home/oppilas/pg-training/Harjoitukset/data/<tiedoston-nimi>' WITH CSV HEADER
```
> HEADER kuvaa sitä, että csv-tiedoston ensimmäinen rivi jätetään huomioimatta, sillä se sisältää sarakkeiden nimet.

Lisää tiedoston sisältö tauluun valitsemallasi tavalla.

In [19]:
%%sql



 * postgresql://postgres:***@postgres_training:5432/koulutus


In [20]:
%%sql

COPY etunimet(nimi, lukumaara, sukupuoli)
FROM '/home/oppilas/pg-training/Harjoitukset/data/etunimet.csv'
CSV HEADER

 * postgresql://postgres:***@postgres_training:5432/koulutus
21916 rows affected.


[]

### Tarkistus
Varmistu, että luomassasi taulussa on oikea määrä rivejä ja tutustu halutessasi dataan.

In [21]:
etunimet = %sql SELECT * FROM etunimet ORDER BY lukumaara DESC LIMIT 100;
assert len(etunimet) == 100, 'Taulussa ei ole edes sataa riviä. Tarkista yllä olevat kohdat ja poista tarvittaessa taulut DROP TABLE -komennolla'
etunimet

 * postgresql://postgres:***@postgres_training:5432/koulutus
100 rows affected.


nimi,lukumaara,sukupuoli
Juhani,285594,M
Maria,199656,N
Olavi,142900,M
Antero,138080,M
Tapani,136173,M
Johannes,134544,M
Helena,123632,N
Anneli,121314,N
Tapio,115625,M
Johanna,112331,N


<a rel="license" href="http://creativecommons.org/licenses/by-nd/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nd/4.0/88x31.png" />