# Настройка PostgreSQL и баз данных для SQL-упражнений и тренажёра интервью

Этот ноутбук поможет вам установить PostgreSQL, создать нужные базы данных, пользователей, загрузить таблицы и импортировать все данные.

📌 Что именно настраивается:
1. База данных `flight_booking` — используется в [ноутбуке с SQL-упражнениями](https://nbviewer.org/github/alex-sokolov2011/ds_interview_prep_resources/blob/main/sql/PostgreSQL_Exercises.ipynb).
2. База данных `interview_sql_postgres` — используется в [ноутбуке-тренажёре для подготовки к интервью](https://nbviewer.org/github/alex-sokolov2011/ds_interview_prep_resources/blob/main/sql/PostgreSQL_Interview_Trainer.ipynb).

💡 В этом ноутбуке вы сначала пройдёте все шаги вручную, чтобы понимать, как всё устроено:  
установка PostgreSQL, создание схем, загрузка CSV, проверка структуры таблиц и тестовые запросы.

🛠️ А потом — сможете использовать готовые скрипты, которые делают всё то же самое автоматически:
- [initialize_flight_booking_db.sh](https://github.com/alex-sokolov2011/ds_interview_prep_resources/tree/main/sql/initialize_flight_booking_db.sh)
- [init_interview_db.sh](https://github.com/alex-sokolov2011/ds_interview_prep_resources/tree/main/sql/init_interview_db.sh)

В будущем эти скрипты сэкономят вам кучу времени: они позволяют разворачивать нужную БД перед началом работы с ноутбуками в один клик.

🧑‍💻 Подходит для Ubuntu и других Debian-подобных систем. Если вы на Mac или другой ОС — команды можно адаптировать под своё окружение.


## Инициализация PostgreSQL и базы данных flight_booking

Убедитесь, что пакеты PostgreSQL уже установлены на вашей системе

Команда ниже выводит список всех установленных пакетов, связанных с PostgreSQL.  
Если вывод пустой — значит PostgreSQL ещё не установлен

In [None]:
!dpkg -l | grep postgresql

Проверьте версию установленного PostgreSQL, чтобы убедиться, что он установлен корректно и доступен из командной строки

In [None]:
!psql --version

### Установка PostgreSQL 14 на Ubuntu 20.04.6 LTS

Для работы с упражнениями в этом ноутбуке вам потребуется установленный PostgreSQL версии 14.  
Если вы используете Ubuntu 20.04.6 LTS, выполните следующие шаги из терминала:

> 💡 Обратите внимание: команды требуют `sudo`-доступ. Если у вас нет прав суперпользователя, обратитесь к администратору системы.

1. Откройте терминал (например, GNOME Terminal).
2. Добавьте репозиторий PostgreSQL:
```sh
sudo sh -c 'echo "deb http://apt.postgresql.org/pub/repos/apt $(lsb_release -cs)-pgdg main" > /etc/apt/sources.list.d/pgdg.list'
```

3. Импортируйте ключи:  
```sh
wget --quiet -O - https://www.postgresql.org/media/keys/ACCC4CF8.asc | sudo apt-key add -
```

4. Обновите индексы пакетов:  
```sh
sudo apt-get update
```

5. Установите PostgreSQL 14 и дополнительные утилиты:  
```sh
sudo apt-get install postgresql-14 postgresql-contrib
```

После выполнения всех шагов PostgreSQL 14 будет установлен на вашей системе


Проверьте, какие пакеты PostgreSQL уже установлены в системе

In [4]:
!dpkg -l | grep postgresql

ii  postgresql-12                              12.22-2.pgdg20.04+1                   amd64        The World's Most Advanced Open Source Relational Database
ii  postgresql-14                              14.17-1.pgdg20.04+1                   amd64        The World's Most Advanced Open Source Relational Database
ii  postgresql-client-12                       12.22-2.pgdg20.04+1                   amd64        front-end programs for PostgreSQL 12
ii  postgresql-client-14                       14.17-1.pgdg20.04+1                   amd64        front-end programs for PostgreSQL 14
ii  postgresql-client-common                   274.pgdg20.04+1                       all          manager for multiple PostgreSQL client versions
ii  postgresql-common                          274.pgdg20.04+1                       all          PostgreSQL database-cluster manager
ii  postgresql-common-dev                      274.pgdg20.04+1                       all          extension build tool for multiple Postgr

Проверьте, какая версия PostgreSQL установлена и доступна из терминала

In [9]:
!which psql

/usr/bin/psql


In [6]:
!psql --version

psql (PostgreSQL) 14.17 (Ubuntu 14.17-1.pgdg20.04+1)


Давайте создадим PostgreSQL-пользователя и базу данных, которые будут использоваться в ноутбуке PostgreSQL_Exercises.ipynb


1. Откройте терминал GNOME и выполните следующую команду, чтобы переключиться на системного пользователя `postgres`:
```sh
sudo -i -u postgres
```

2. Запустите интерактивную оболочку PostgreSQL:
```sh
psql
```

3. В интерактивной оболочке выполните следующие SQL-команды:
```sql
-- Удалите базу данных, если она уже существует
DROP DATABASE IF EXISTS flight_booking;

-- Удалите пользователя admin, если он уже существует
DROP USER IF EXISTS admin;

-- Создайте новую базу данных
CREATE DATABASE flight_booking;

-- Создайте пользователя admin с паролем 'admin'
CREATE USER admin WITH ENCRYPTED PASSWORD 'admin';

-- Предоставьте пользователю admin все права на базу данных flight_booking
GRANT ALL PRIVILEGES ON DATABASE flight_booking TO admin;
```

4. Выйдите из интерактивной оболочки `psql`:
```sh
\q
```

5. Выйдите из пользователя `postgres`:
```sh
exit
```

> ⚠️ Не забудьте запомнить логин/пароль `admin/admin` — они будут использоваться при подключении к базе данных из Jupyter Notebook, хотя эти настройки уже прописаны во всех скриптах и будут заполняться автоматичски.


In [None]:
# Импортируйте схему базы данных flight_booking из SQL-файла, расположенного в директории ./data  
# Этот шаг создаст таблицы, необходимые для выполнения SQL-заданий в ноутбуке

!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -f ./data/flight_booking_schema_PostgreSQL.sql

DROP TABLE
DROP TABLE
DROP TABLE
DROP TABLE
CREATE TABLE
CREATE TABLE
CREATE TABLE
CREATE TABLE


In [None]:
# Проверьте, что таблицы успешно созданы в базе данных flight_booking
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\dt+"

                                       List of relations
 Schema |     Name     | Type  | Owner | Persistence | Access method |    Size    | Description 
--------+--------------+-------+-------+-------------+---------------+------------+-------------
 public | company      | table | admin | permanent   | heap          | 0 bytes    | 
 public | pass_in_trip | table | admin | permanent   | heap          | 0 bytes    | 
 public | passenger    | table | admin | permanent   | heap          | 0 bytes    | 
 public | trip         | table | admin | permanent   | heap          | 8192 bytes | 
(4 rows)



In [None]:

# Проверьте структуру таблицы Company, чтобы убедиться, что она была создана корректно!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\d company"

                      Table "public.company"
 Column |          Type          | Collation | Nullable | Default 
--------+------------------------+-----------+----------+---------
 id     | integer                |           | not null | 
 name   | character varying(255) |           | not null | 
Indexes:
    "company_pkey" PRIMARY KEY, btree (id)
Referenced by:
    TABLE "trip" CONSTRAINT "trip_company_fkey" FOREIGN KEY (company) REFERENCES company(id)



In [None]:
# Загрузите данные в таблицу Company из CSV-файла company_table.csv, расположенного в папке data`
# Команда \copy используется для импорта данных непосредственно из CSV в PostgreSQL
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\copy Company FROM './data/company_table.csv' DELIMITER ',' CSV HEADER;"

COPY 5


In [None]:
# Проверьте, что данные были успешно загружены в таблицу Company, выполнив запрос SELECT *
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "SELECT * FROM Company;"

 id |    name    
----+------------
  1 | Don_avia
  2 | Aeroflot
  3 | Dale_avia
  4 | air_France
  5 | British_AW
(5 rows)



In [None]:
# Проверьте структуру таблицы Trip, чтобы убедиться, что она была создана корректно
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\d Trip"

                          Table "public.trip"
  Column   |           Type           | Collation | Nullable | Default 
-----------+--------------------------+-----------+----------+---------
 id        | integer                  |           | not null | 
 company   | integer                  |           | not null | 
 plane     | character varying(255)   |           | not null | 
 town_from | character varying(255)   |           | not null | 
 town_to   | character varying(255)   |           | not null | 
 time_out  | timestamp with time zone |           |          | 
 time_in   | timestamp with time zone |           |          | 
Indexes:
    "trip_pkey" PRIMARY KEY, btree (id)
Foreign-key constraints:
    "trip_company_fkey" FOREIGN KEY (company) REFERENCES company(id)
Referenced by:
    TABLE "pass_in_trip" CONSTRAINT "pass_in_trip_trip_fkey" FOREIGN KEY (trip) REFERENCES trip(id)



In [None]:
# Проверьте текущую временную зону PostgreSQL. Это поможет вам заметить влияние временных настроек на формат 
# и интерпретацию даты и времени в будущих заданиях.  
# Позже эта проверка будет автоматически пропущена в .sh-скрипте

!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "SHOW TIME ZONE"

    TimeZone     
-----------------
 Europe/Belgrade
(1 row)



In [None]:
# Загрузите данные в таблицу Trip из CSV-файла trip_table.csv, расположенного в папке data`
# Команда \copy используется для импорта данных непосредственно из CSV в PostgreSQL
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\copy Trip FROM './data/trip_table.csv' DELIMITER ',' CSV HEADER;"

COPY 22


In [None]:
# Проверьте, что данные были успешно загружены в таблицу Trip, выполнив запрос SELECT *
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "SELECT * FROM Trip;"

  id  | company | plane  |   town_from   |    town_to    |        time_out        |        time_in         
------+---------+--------+---------------+---------------+------------------------+------------------------
 1100 |       4 | Boeing | Rostov-on-Don | Paris         | 2025-03-01 15:30:00+01 | 2025-03-01 18:50:00+01
 1101 |       4 | Boeing | Paris         | Rostov-on-Don | 2025-03-01 09:12:00+01 | 2025-03-01 12:45:00+01
 1123 |       3 | TU-154 | Rostov-on-Don | Vladivostok   | 2025-03-01 17:20:00+01 | 2025-03-02 04:40:00+01
 1124 |       3 | TU-154 | Vladivostok   | Rostov-on-Don | 2025-03-01 10:00:00+01 | 2025-03-01 20:50:00+01
 1145 |       2 | IL-86  | Moscow        | Rostov-on-Don | 2025-03-01 10:35:00+01 | 2025-03-01 12:23:00+01
 1146 |       2 | IL-86  | Rostov-on-Don | Moscow        | 2025-03-01 18:55:00+01 | 2025-03-01 21:01:00+01
 1181 |       1 | TU-134 | Rostov-on-Don | Moscow        | 2025-03-01 07:12:00+01 | 2025-03-01 09:01:00+01
 1182 |       1 | TU-134 | Moscow  

In [None]:
# Проверьте структуру таблицы Passenger, чтобы убедиться, что она была создана корректно
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\d Passenger"

                     Table "public.passenger"
 Column |          Type          | Collation | Nullable | Default 
--------+------------------------+-----------+----------+---------
 id     | integer                |           | not null | 
 name   | character varying(255) |           | not null | 
Indexes:
    "passenger_pkey" PRIMARY KEY, btree (id)
Referenced by:
    TABLE "pass_in_trip" CONSTRAINT "pass_in_trip_passenger_fkey" FOREIGN KEY (passenger) REFERENCES passenger(id)



In [None]:
# Загрузите данные в таблицу Passenger из CSV-файла
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\copy Passenger FROM './data/passengers_table.csv' DELIMITER ',' CSV HEADER;"

COPY 33


In [None]:
# Проверьте, что данные в таблицу Passenger были загружены корректно
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "SELECT * FROM Passenger;"

 id |         name         
----+----------------------
  1 | Bruce Willis
  2 | George Clooney
  3 | Kevin Costner
  4 | Donald Sutherland
  5 | Jennifer Lopez
  6 | Ray Liotta
  7 | Samuel L. Jackson
  8 | Nicole Kidman
  9 | Alan Rickman
 10 | Kurt Russell
 11 | Harrison Ford
 12 | Russell Crowe
 13 | Steve Martin
 14 | Michael Caine
 15 | Angelina Jolie
 16 | Mel Gibson
 17 | Michael Douglas
 18 | John Travolta
 19 | Sylvester Stallone
 20 | Tommy Lee Jones
 21 | Catherine Zeta-Jones
 22 | Antonio Banderas
 23 | Kim Basinger
 24 | Sam Neill
 25 | Gary Oldman
 26 | ClINT Eastwood
 27 | Brad Pitt
 28 | Johnny Depp
 29 | Pierce Brosnan
 30 | Sean Connery
 31 | Bruce Willis
 37 | Mullah Omar
 38 | Leonardo Grant-Baker
(33 rows)



In [None]:
# Проверьте структуру таблицы Pass_in_trip, чтобы убедиться, что она была создана корректно
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\d Pass_in_trip"

                     Table "public.pass_in_trip"
  Column   |          Type          | Collation | Nullable | Default 
-----------+------------------------+-----------+----------+---------
 id        | integer                |           | not null | 
 trip      | integer                |           |          | 
 passenger | integer                |           | not null | 
 place     | character varying(255) |           |          | 
Indexes:
    "pass_in_trip_pkey" PRIMARY KEY, btree (id)
Foreign-key constraints:
    "pass_in_trip_passenger_fkey" FOREIGN KEY (passenger) REFERENCES passenger(id)
    "pass_in_trip_trip_fkey" FOREIGN KEY (trip) REFERENCES trip(id)



In [None]:
# Загрузите данные в таблицу Pass_in_trip из CSV-файла
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\copy Pass_in_trip FROM './data/pass_in_trip_table.csv' DELIMITER ',' CSV HEADER;"


COPY 34


In [None]:
# Проверьте, что данные в таблицу Pass_in_trip были загружены корректно
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "SELECT * FROM Pass_in_trip;"

 id | trip | passenger | place 
----+------+-----------+-------
  1 | 1100 |         1 | 1a
  2 | 1123 |         3 | 2a
  3 | 1123 |         1 | 4c
  4 | 1123 |         6 | 4b
  5 | 1124 |         2 | 2d
  6 | 1145 |         3 | 2c
  7 | 1181 |         1 | 1a
  8 | 1181 |         6 | 1b
  9 | 1181 |         8 | 3c
 10 | 1181 |         5 | 1b
 11 | 1182 |         5 | 4b
 12 | 1187 |         8 | 3a
 13 | 1188 |         8 | 3a
 14 | 1182 |         9 | 6d
 15 | 1145 |         5 | 1d
 16 | 1187 |        10 | 3d
 17 | 8882 |        37 | 1a
 18 | 7771 |        37 | 1c
 19 | 7772 |        37 | 1a
 20 | 8881 |        37 | 1d
 21 | 7778 |        10 | 2a
 22 | 7772 |        10 | 3a
 23 | 7771 |        11 | 4a
 24 | 7772 |        11 | 1b
 25 | 7771 |        11 | a4
 26 | 7772 |        12 | 1d
 27 | 7773 |        13 | 2d
 28 | 7772 |        13 | 2d
 29 | 8882 |        14 | 3d
 30 | 7771 |        14 | 4d
 31 | 7771 |        14 | d4
 32 | 7772 |        14 | 1c
 33 |      |        31 | 9f
 34 | 7772 |

In [None]:
# Убедитесь, что все таблицы успешно созданы и содержат данные
!PGPASSWORD=admin psql -U admin -d flight_booking -h localhost -c "\dt+"

                                       List of relations
 Schema |     Name     | Type  | Owner | Persistence | Access method |    Size    | Description 
--------+--------------+-------+-------+-------------+---------------+------------+-------------
 public | company      | table | admin | permanent   | heap          | 8192 bytes | 
 public | pass_in_trip | table | admin | permanent   | heap          | 8192 bytes | 
 public | passenger    | table | admin | permanent   | heap          | 8192 bytes | 
 public | trip         | table | admin | permanent   | heap          | 16 kB      | 
(4 rows)



In [13]:
# Подключение к базе данных PostgreSQL из Jupyter Notebook с помощью магических команд %sql
# Загрузите расширение SQL и установите соединение с базой данных flight_booking
%load_ext sql
%sql postgresql://admin:admin@localhost/flight_booking

The sql extension is already loaded. To reload it, use:
  %reload_ext sql


In [14]:
# Настройка отображения результатов SQL-запросов в стиле таблицы (по умолчанию)
%config SqlMagic.style = '_DEPRECATED_DEFAULT'

In [15]:
# Выполнить запрос для получения версии PostgreSQL, чтобы убедиться, что соединение с базой работает
%sql SELECT version();

 * postgresql://admin:***@localhost/flight_booking
1 rows affected.


version
"PostgreSQL 14.17 (Ubuntu 14.17-1.pgdg20.04+1) on x86_64-pc-linux-gnu, compiled by gcc (Ubuntu 9.4.0-1ubuntu1~20.04.2) 9.4.0, 64-bit"


Проверьте содержимое таблицы Company с помощью SQL-запроса через Jupyter

In [16]:
%%sql 
SELECT * 
  FROM Company;

 * postgresql://admin:***@localhost/flight_booking
5 rows affected.


id,name
1,Don_avia
2,Aeroflot
3,Dale_avia
4,air_France
5,British_AW


In [17]:
# Просмотрите список всех активных SQL-соединений
%sql -l

{'postgresql://admin:***@localhost/flight_booking': <sql.connection.Connection at 0x7f8f652d1340>}

In [19]:
# Отключите соединение с базой данных
%sql --close postgresql://admin:***@localhost/flight_booking

In [None]:
# Сделайте скрипт initialize_flight_booking_db.sh исполняемым
!chmod +x initialize_flight_booking_db.sh

Запустите скрипт инициализации базы данных ниже

Этот скрипт выполняет всё то же, что мы только что делали вручную: создание схемы, загрузка данных, базовая настройка.  

В будущем он сэкономит нам время, мы будем всегда его вызыват, когда нужно будет быстро развернуть `flight_booking` локально перед выполнением упражнений


In [None]:

!./initialize_flight_booking_db.sh

- Начало инициализации базы данных flight_booking
-- Шаг 1: Загрузка схемы базы данных...
DROP TABLE
DROP TABLE
DROP TABLE
DROP TABLE
CREATE TABLE
CREATE TABLE
CREATE TABLE
CREATE TABLE
-- Шаг 2: Импорт данных в таблицы из файлов CSV...
COPY 5
COPY 22
COPY 33
COPY 34
INSERT 0 1
-- Шаг 3: Проверка правильности создания базы данных...
                                       List of relations
 Schema |     Name     | Type  | Owner | Persistence | Access method |    Size    | Description 
--------+--------------+-------+-------+-------------+---------------+------------+-------------
 public | company      | table | admin | permanent   | heap          | 8192 bytes | 
 public | pass_in_trip | table | admin | permanent   | heap          | 8192 bytes | 
 public | passenger    | table | admin | permanent   | heap          | 8192 bytes | 
 public | trip         | table | admin | permanent   | heap          | 16 kB      | 
(4 rows)

- База данных успешно инициализирована и готова к использованию 

## Инициализация базы данных interview_sql_postgres

Давайте создадим базу данных interview_sql_postgres, которые будут использоваться в ноутбуке PostgreSQL_Interview_Trainer.ipynb

1. Откройте терминал GNOME и выполните следующую команду, чтобы переключиться на системного пользователя `postgres`:
```sh
sudo -i -u postgres
```

2. Запустите интерактивную оболочку PostgreSQL:
```sh
psql
```

3. В интерактивной оболочке `psql` выполните следующие команды:

```sql
-- Удалите базу данных, если она существует
DROP DATABASE IF EXISTS interview_sql_postgres;

-- Создайте базу данных
CREATE DATABASE interview_sql_postgres;

-- Дайте пользователю admin все привилегии на базу данных flight_booking
GRANT ALL PRIVILEGES ON DATABASE interview_sql_postgres TO admin;
```

3. Выйдите из интерактивной оболочки `psql`:

```sql
\q
```
4. Выйдите из пользователя `postgres`:
```sql
exit
```


In [None]:
# Импортируйте схему базы данных interview_schema_PostgreSQL из SQL-файла, расположенного в директории ./data  
# Этот шаг создаст таблицы, необходимые для запуска ноутбука с вопросами и ответами 

!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -f ./data/interview_schema_PostgreSQL.sql

DROP TABLE
DROP TABLE
DROP TABLE
DROP TABLE
CREATE TABLE
CREATE TABLE
CREATE TABLE
CREATE TABLE


In [None]:
# Проверьте, что таблицы успешно созданы в базе данных interview_sql_postgres
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "\dt+"

                                         List of relations
 Schema |      Name       | Type  | Owner | Persistence | Access method |    Size    | Description 
--------+-----------------+-------+-------+-------------+---------------+------------+-------------
 public | answer          | table | admin | permanent   | heap          | 8192 bytes | 
 public | question        | table | admin | permanent   | heap          | 8192 bytes | 
 public | topic           | table | admin | permanent   | heap          | 8192 bytes | 
 public | user_statistics | table | admin | permanent   | heap          | 8192 bytes | 
(4 rows)



In [None]:
# Проверьте структуру таблицы topic, чтобы убедиться, что она была создана корректно
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "\d topic"

                                  Table "public.topic"
   Column    |  Type   | Collation | Nullable |                 Default                 
-------------+---------+-----------+----------+-----------------------------------------
 topic_id    | integer |           | not null | nextval('topic_topic_id_seq'::regclass)
 name        | text    |           | not null | 
 description | text    |           |          | 
Indexes:
    "topic_pkey" PRIMARY KEY, btree (topic_id)
    "topic_name_key" UNIQUE CONSTRAINT, btree (name)
Referenced by:
    TABLE "question" CONSTRAINT "question_topic_id_fkey" FOREIGN KEY (topic_id) REFERENCES topic(topic_id) ON DELETE CASCADE



In [None]:
# Загрузите данные в таблицу topic из CSV-файла
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "\copy topic FROM './data/topics.csv' DELIMITER ',' CSV HEADER;"

COPY 5


In [None]:
# Проверьте, что данные в таблицу topic были загружены корректно
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "SELECT * FROM topic;"

 topic_id |             name              |                         description                         
----------+-------------------------------+-------------------------------------------------------------
        1 | Основы SQL                    | Базовые понятия SQL: SELECT, WHERE, JOIN
        2 | Индексы и оптимизация         | Использование индексов и анализ производительности запросов
        3 | Хранимые процедуры и триггеры | Создание и применение хранимых процедур и триггеров
        4 | Работа с JSONB                | Манипуляции с JSONB-данными в PostgreSQL
        5 | Транзакции и изоляция         | ACID, уровни изоляции, deadlocks
(5 rows)



In [None]:
# Проверьте структуру таблицы question, чтобы убедиться, что она была создана корректно
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "\d question"

                                                Table "public.question"
      Column      |            Type             | Collation | Nullable |                    Default                    
------------------+-----------------------------+-----------+----------+-----------------------------------------------
 question_id      | integer                     |           | not null | nextval('question_question_id_seq'::regclass)
 topic_id         | integer                     |           | not null | 
 question_text    | text                        |           | not null | 
 difficulty_level | integer                     |           | not null | 
 created_at       | timestamp without time zone |           |          | now()
Indexes:
    "question_pkey" PRIMARY KEY, btree (question_id)
    "question_question_text_key" UNIQUE CONSTRAINT, btree (question_text)
Check constraints:
    "question_difficulty_level_check" CHECK (difficulty_level >= 1 AND difficulty_level <= 5)
Foreign-key constra

In [None]:
# Загрузите данные в таблицу question из CSV-файла
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "\copy question FROM './data/questions.csv' DELIMITER ',' CSV HEADER;"

COPY 6


In [None]:
# Проверьте, что данные в таблицу question были загружены корректно
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "SELECT * FROM question;"

 question_id | topic_id |                              question_text                              | difficulty_level |     created_at      
-------------+----------+-------------------------------------------------------------------------+------------------+---------------------
           1 |        1 | Что делает оператор SELECT?                                             |                1 | 2025-03-15 00:00:00
           2 |        1 | Чем отличается INNER JOIN от LEFT JOIN?                                 |                2 | 2025-03-15 00:00:00
           3 |        2 | Как работает B-Tree индекс в PostgreSQL?                                |                3 | 2025-03-15 00:00:00
           4 |        3 | Когда использовать BEFORE и AFTER триггеры?                             |                3 | 2025-03-15 00:00:00
           5 |        4 | Какие преимущества JSONB перед JSON в PostgreSQL?                       |                2 | 2025-03-15 00:00:00
           6 |        5 |

In [None]:
# Проверьте структуру таблицы answer, чтобы убедиться, что она была создана корректно
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "\d answer"

                                  Table "public.answer"
   Column    |  Type   | Collation | Nullable |                  Default                  
-------------+---------+-----------+----------+-------------------------------------------
 answer_id   | integer |           | not null | nextval('answer_answer_id_seq'::regclass)
 question_id | integer |           | not null | 
 answer_text | text    |           | not null | 
 is_correct  | boolean |           | not null | false
Indexes:
    "answer_pkey" PRIMARY KEY, btree (answer_id)
Foreign-key constraints:
    "answer_question_id_fkey" FOREIGN KEY (question_id) REFERENCES question(question_id) ON DELETE CASCADE



In [None]:
# Загрузите данные в таблицу answer из CSV-файла
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "\copy answer FROM './data/answers.csv' DELIMITER ',' CSV HEADER NULL AS '';"

COPY 24


In [None]:
# Проверьте, что данные в таблицу answer были загружены корректно
!
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "SELECT * FROM answer;"

 answer_id | question_id |                                                     answer_text                                                     | is_correct 
-----------+-------------+---------------------------------------------------------------------------------------------------------------------+------------
         1 |           1 | SELECT используется для выборки данных из таблицы.                                                                  | t
         2 |           1 | SELECT создаёт новую таблицу в базе данных.                                                                         | f
         3 |           1 | SELECT обновляет данные в существующей таблице.                                                                     | f
         4 |           1 | SELECT удаляет строки из таблицы.                                                                                   | f
         5 |           2 | INNER JOIN возвращает только совпадающие строки, а LEFT JOIN также вклю

In [None]:
# Убедитесь, что все таблицы успешно созданы и содержат данные
!PGPASSWORD=admin psql -U admin -d interview_sql_postgres -h localhost -c "\dt+"

                                         List of relations
 Schema |      Name       | Type  | Owner | Persistence | Access method |    Size    | Description 
--------+-----------------+-------+-------+-------------+---------------+------------+-------------
 public | answer          | table | admin | permanent   | heap          | 48 kB      | 
 public | question        | table | admin | permanent   | heap          | 16 kB      | 
 public | topic           | table | admin | permanent   | heap          | 16 kB      | 
 public | user_statistics | table | admin | permanent   | heap          | 8192 bytes | 
(4 rows)



In [None]:
# Подключение к базе данных PostgreSQL из Jupyter Notebook с помощью магических команд %sql
# Загрузите расширение SQL и установите соединение с базой данных interview_sql_postgres

%reload_ext sql
%sql postgresql://admin:admin@localhost/interview_sql_postgres

In [None]:
# Настройка отображения результатов SQL-запросов в стиле таблицы (по умолчанию)
%config SqlMagic.style = '_DEPRECATED_DEFAULT'

In [None]:
# Выполнить запрос для получения версии PostgreSQL, чтобы убедиться, что соединение с базой работает
%sql SELECT version();

 * postgresql://admin:***@localhost/interview_sql_postgres
1 rows affected.


version
"PostgreSQL 14.17 (Ubuntu 14.17-1.pgdg20.04+1) on x86_64-pc-linux-gnu, compiled by gcc (Ubuntu 9.4.0-1ubuntu1~20.04.2) 9.4.0, 64-bit"


Проверьте содержимое таблицы question с помощью SQL-запроса через Jupyter

In [54]:
%%sql 
SELECT * 
  FROM question;

 * postgresql://admin:***@localhost/interview_sql_postgres
6 rows affected.


question_id,topic_id,question_text,difficulty_level,created_at
1,1,Что делает оператор SELECT?,1,2025-03-15 00:00:00
2,1,Чем отличается INNER JOIN от LEFT JOIN?,2,2025-03-15 00:00:00
3,2,Как работает B-Tree индекс в PostgreSQL?,3,2025-03-15 00:00:00
4,3,Когда использовать BEFORE и AFTER триггеры?,3,2025-03-15 00:00:00
5,4,Какие преимущества JSONB перед JSON в PostgreSQL?,2,2025-03-15 00:00:00
6,5,Что такое MVCC и как PostgreSQL использует его для изоляции транзакций?,4,2025-03-15 00:00:00


In [None]:
# Просмотрите список всех активных SQL-соединений
%sql -l

{'postgresql://admin:***@localhost/interview_sql_postgres': <sql.connection.Connection at 0x7f17f268aa30>}

In [None]:
# Отключите соединение с базой данных
%sql --close postgresql://admin:***@localhost/interview_sql_postgres

In [None]:
# Сделайте скрипт initialize_flight_booking_db.sh исполняемым
! chmod +x init_interview_db.sh

Запустите скрипт инициализации базы данных ниже

Этот скрипт выполняет всё то же, что мы только что делали вручную: создание схемы, загрузка данных, базовая настройка.  

В будущем он сэкономит нам время, мы будем всегда его вызыват, когда нужно будет быстро развернуть `interview_sql_postgres` локально перед изучением вопросов, которые могут задать на интервью


In [60]:
! ./init_interview_db.sh

- Начало инициализации базы данных interview_sql_postgres
-- Шаг 1: Загрузка схемы базы данных...
DROP TABLE
DROP TABLE
DROP TABLE
DROP TABLE
CREATE TABLE
CREATE TABLE
CREATE TABLE
CREATE TABLE
-- Шаг 2: Импорт данных в таблицы из файлов CSV...
COPY 5
COPY 6
COPY 24
-- Шаг 3: Проверка правильности создания базы данных...
                                         List of relations
 Schema |      Name       | Type  | Owner | Persistence | Access method |    Size    | Description 
--------+-----------------+-------+-------+-------------+---------------+------------+-------------
 public | answer          | table | admin | permanent   | heap          | 16 kB      | 
 public | question        | table | admin | permanent   | heap          | 16 kB      | 
 public | topic           | table | admin | permanent   | heap          | 16 kB      | 
 public | user_statistics | table | admin | permanent   | heap          | 8192 bytes | 
(4 rows)

- База данных успешно инициализирована и готова к исполь