 # Opis notatnika
 W tym notatniku skupimy się na stworzeniu dedykowanej bazy danych wraz ze strukturą tabel. Jednak w tym momencie nie będziemy jej uzupełniać danymi - tym zajmiemy się w kolejnej części.
 
 Ponownie wcielasz się w rolę Data Engineera, którego zadaniem jest dostarczenie klientowi bazy danych, która będzie używana do celów analityczno-raportowych. Bazy danych są podstawowym źródłem pracy dla Analityków Danych.
 
 Plik wraz ze strukturą bazy znajdziesz w folderze `sql/database_schema.sql`. 

 > W tym zadaniu konieczne jest posiadanie zainstalowanego `Postgres` na swoim komputrze. Jeżeli z jakichś powodów został on usunięty po kursie `Python - Analiza Danych`, należy ponownie dokonać instalacji.

 > Posiadając działającą instancję serwera, można stworzyć po prostu nową bazę np. `airlines`. Stworzenie bazy danych powinno odbyć się w notatniku poprzez stworzenie obiektu cursor i wywołaniu zapytań znajdujących się w pliku .sql.

 W trakcie rozwiązywania tego notatnika przydadzą się następujące materiały:
 - `Python - analiza danych -> Przygotowanie do kursu -> Podstawy SQL - Praca samodzielna -> Instalacja bazy danych`
 - `Python - analiza danych -> Moduł 1 -> Dzień 3 - PostgreSQL -> SQL i Python`
 - `Python - analiza danych -> Prework -> Podstawy SQL - Praca samodzielna -> Instalacja bazy danych -> Przygotowanie bazy danych`
 
Inicjację bazy danych wykonaj w notatniku, nie bezpośrednio na Postgresie.

 Tutaj zaimportuj potrzebne biblioteki

In [46]:
import psycopg2
from psycopg2 import connect

 ## Połączenie z bazą danych
 Tutaj uzupełnij konfigurację połączenia

In [80]:
username = 'postgres'
password = 'SQLisFun'

host = 'localhost'
database = 'airlines'
port = None

Tutaj zdefiniuj zmienną `con` oraz `cursor`

In [81]:
con = psycopg2.connect(user=username, password=password, host=host, database=database)
print("Połączenie udane.")
cursor = con.cursor()


Połączenie udane.


In [82]:
#create_db_query = "CREATE DATABASE airlines"

 ## Wczytanie pliku `database_schema.sql`
 Z katalogu `sql` wczytaj plik `database_schema.sql`

In [83]:
schema = open(r'C:\Users\urszu\OneDrive\Pulpit\CodersLab - cwiczenia\Projekt koncowy\sql\database_schema.sql')
schema = str(schema.read())
print(schema)

DROP TABLE IF EXISTS public.aircraft CASCADE;
CREATE TABLE IF NOT EXISTS public.aircraft
(
    id serial,
    manufacture_year bigint,
    tail_num text,
    number_of_seats double precision
)
;

CREATE OR REPLACE VIEW public.v_aircraft_blocker AS
SELECT 1 FROM public.aircraft LIMIT 1;

DROP TABLE IF EXISTS public.airport_weather CASCADE;
CREATE TABLE IF NOT EXISTS public.airport_weather
(
    id serial,
    station text,
    name text,
    date text,
    awnd double precision,
    pgtm double precision,
    prcp double precision,
    snow double precision,
    snwd double precision,
    tavg double precision,
    tmax double precision,
    tmin double precision,
    wdf2 double precision,
    wdf5 double precision,
    wsf2 double precision,
    wsf5 double precision,
    wt01 double precision,
    wt02 double precision,
    wt03 double precision,
    wt04 double precision,
    wt05 double precision,
    wt06 double precision,
    wt07 double precision,
    wt08 double precision,
    

In [84]:
schema_updated = schema.replace('\n', ' ')
schema_updated

'DROP TABLE IF EXISTS public.aircraft CASCADE; CREATE TABLE IF NOT EXISTS public.aircraft (     id serial,     manufacture_year bigint,     tail_num text,     number_of_seats double precision ) ;  CREATE OR REPLACE VIEW public.v_aircraft_blocker AS SELECT 1 FROM public.aircraft LIMIT 1;  DROP TABLE IF EXISTS public.airport_weather CASCADE; CREATE TABLE IF NOT EXISTS public.airport_weather (     id serial,     station text,     name text,     date text,     awnd double precision,     pgtm double precision,     prcp double precision,     snow double precision,     snwd double precision,     tavg double precision,     tmax double precision,     tmin double precision,     wdf2 double precision,     wdf5 double precision,     wsf2 double precision,     wsf5 double precision,     wt01 double precision,     wt02 double precision,     wt03 double precision,     wt04 double precision,     wt05 double precision,     wt06 double precision,     wt07 double precision,     wt08 double precision,    

 W tym miejscu odpowiednio rozdziel zawartość pliku `database_schema.sql` na mniejsze kwerendy używając `;`

In [85]:
separated = schema_updated.split(';')

print(separated)

['DROP TABLE IF EXISTS public.aircraft CASCADE', ' CREATE TABLE IF NOT EXISTS public.aircraft (     id serial,     manufacture_year bigint,     tail_num text,     number_of_seats double precision ) ', '  CREATE OR REPLACE VIEW public.v_aircraft_blocker AS SELECT 1 FROM public.aircraft LIMIT 1', '  DROP TABLE IF EXISTS public.airport_weather CASCADE', ' CREATE TABLE IF NOT EXISTS public.airport_weather (     id serial,     station text,     name text,     date text,     awnd double precision,     pgtm double precision,     prcp double precision,     snow double precision,     snwd double precision,     tavg double precision,     tmax double precision,     tmin double precision,     wdf2 double precision,     wdf5 double precision,     wsf2 double precision,     wsf5 double precision,     wt01 double precision,     wt02 double precision,     wt03 double precision,     wt04 double precision,     wt05 double precision,     wt06 double precision,     wt07 double precision,     wt08 double p

In [86]:
separated[0]

'DROP TABLE IF EXISTS public.aircraft CASCADE'

 W tym miejscu wykonaj każdą z kwerend, aby zainicjować strukturę bazy danych

In [87]:
for i in separated:
    cursor.execute(i)

 Zatwierdznie wszystkich operacji na bazie, czyli stworzenie tabel

In [88]:
con.commit()

 ### Sprawdzenie
 Uruchom kod poniżej, aby sprawdzić, czy ta część została poprawnie wykonana

In [89]:
def check_if_table_exists(table_name):
    msg = f"Sprawdzam czy istnieje tabela {table_name}"
    print(msg)

    query = f"select 1 from {table_name}"
    # jeżeli tabela nie istnieje, ten krok zwróci wyjątek
    cursor.execute(query)
    print('OK!')


In [90]:
tables_to_test = [
    'aircraft',
    'airport_weather',
    'flight',
    'airport_list'
]

In [91]:
for table in tables_to_test:
    check_if_table_exists(table)

Sprawdzam czy istnieje tabela aircraft
OK!
Sprawdzam czy istnieje tabela airport_weather
OK!
Sprawdzam czy istnieje tabela flight
OK!
Sprawdzam czy istnieje tabela airport_list
OK!


In [92]:
con.close()
msg = "Wszystko wygląda OK :) Możesz przejść do kolejnego zadania."
print(msg)

Wszystko wygląda OK :) Możesz przejść do kolejnego zadania.


 # Podsumowanie
 Za pomocą tego notatnika została zbudowana w sposób automatyczny nasza docelowa baza danych. Dzięki temu nie musimy się już martwić o jej ręczną przebudowę - w ramach potrzeby wystarczy włączyć notatnik.
 Wykonując kolejny notatnik, sprawimy, że w tabelach pojawią się również dane potrzebne do przeprowadzenia późniejszej analizy oraz wykorzystywane w raportowaniu.