 # Opis notatnika
 W tym notatniku skupimy się na stworzeniu dedykowanej bazy danych wraz ze strukturą tabel. Jednak w tym momencie nie będziemy jej uzupełniać danymi - tym zajmiemy się w kolejnej części.
 
 Ponownie wcielasz się w rolę Data Engineera, którego zadaniem jest dostarczenie klientowi bazy danych, która będzie używana do celów analityczno-raportowych. Bazy danych są podstawowym źródłem pracy dla Analityków Danych.
 
 Plik wraz ze strukturą bazy znajdziesz w folderze `sql/database_schema.sql`. 

 > W tym zadaniu konieczne jest posiadanie zainstalowanego `Postgres` na swoim komputrze. Jeżeli z jakichś powodów został on usunięty po kursie `Python - Analiza Danych`, należy ponownie dokonać instalacji.

 > Posiadając działającą instancję serwera, można stworzyć po prostu nową bazę np. `airlines`. Stworzenie bazy danych powinno odbyć się w notatniku poprzez stworzenie obiektu cursor i wywołaniu zapytań znajdujących się w pliku .sql.

 W trakcie rozwiązywania tego notatnika przydadzą się następujące materiały:
 - `Python - analiza danych -> Przygotowanie do kursu -> Podstawy SQL - Praca samodzielna -> Instalacja bazy danych`
 - `Python - analiza danych -> Moduł 1 -> Dzień 3 - PostgreSQL -> SQL i Python`
 - `Python - analiza danych -> Prework -> Podstawy SQL - Praca samodzielna -> Instalacja bazy danych -> Przygotowanie bazy danych`
 
Inicjację bazy danych wykonaj w notatniku, nie bezpośrednio na Postgresie.

 Tutaj zaimportuj potrzebne biblioteki

In [4]:
import psycopg2
from psycopg2 import sql

 ## Połączenie z bazą danych
 Tutaj uzupełnij konfigurację połączenia

In [5]:
username = ''
password = '' ## trzeba wpisac swoje dane
host = 'localhost'
port = 5432
database = 'airlines'

Tutaj zdefiniuj zmienną `con` oraz `cursor`

In [6]:
con = psycopg2.connect(
    user=username,
    password=password,
    host=host,
    port=port
)

con.autocommit = True

cursor = con.cursor()

create_database_query = sql.SQL("CREATE DATABASE {}").format(
    sql.Identifier(database)
)

cursor.execute(create_database_query)

cursor.close()
con.close()

In [7]:
con = psycopg2.connect(
    user=username,
    password=password,
    host=host,
    port=port,
    database=database
)
cursor = con.cursor()

 ## Wczytanie pliku `database_schema.sql`
 Z katalogu `sql` wczytaj plik `database_schema.sql`

In [8]:
with open('../sql/database_schema.sql', 'r') as file:
        queries = file.read().split(';')

 W tym miejscu odpowiednio rozdziel zawartość pliku `database_schema.sql` na mniejsze kwerendy używając `;`

 W tym miejscu wykonaj każdą z kwerend, aby zainicjować strukturę bazy danych

In [9]:
for query in queries:
        if query.strip():  
            cursor.execute(query)

 Zatwierdznie wszystkich operacji na bazie, czyli stworzenie tabel

In [10]:
con.commit()

 ### Sprawdzenie
 Uruchom kod poniżej, aby sprawdzić, czy ta część została poprawnie wykonana

In [11]:
def check_if_table_exists(table_name):
    msg = f"Sprawdzam czy istnieje tabela {table_name}"
    print(msg)

    query = f"select 1 from {table_name}"
    cursor.execute(query)
    print('OK!')

In [12]:
tables_to_test = [
    'aircraft',
    'airport_weather',
    'flight',
    'airport_list'
]

In [13]:
for table in tables_to_test:
    check_if_table_exists(table)

Sprawdzam czy istnieje tabela aircraft
OK!
Sprawdzam czy istnieje tabela airport_weather
OK!
Sprawdzam czy istnieje tabela flight
OK!
Sprawdzam czy istnieje tabela airport_list
OK!


In [14]:
con.close()
msg = "Wszystko wygląda OK :) Możesz przejść do kolejnego zadania."
print(msg)

Wszystko wygląda OK :) Możesz przejść do kolejnego zadania.


 # Podsumowanie
 Za pomocą tego notatnika została zbudowana w sposób automatyczny nasza docelowa baza danych. Dzięki temu nie musimy się już martwić o jej ręczną przebudowę - w ramach potrzeby wystarczy włączyć notatnik.
 Wykonując kolejny notatnik, sprawimy, że w tabelach pojawią się również dane potrzebne do przeprowadzenia późniejszej analizy oraz wykorzystywane w raportowaniu.