# PostgreSQL Interview Trainer

Добро пожаловать в **PostgreSQL Interview Trainer** – интерактивный ноутбук для подготовки к техническим собеседованиям по SQL.  
Этот ноутбук поможет вам проверить и укрепить свои знания PostgreSQL, потренироваться на реальных вопросах и оценить уровень подготовки.  

## 📌 Как это работает?  

- Вы выбираете тему или проходите вопросы в случайном порядке.  
- Для каждого вопроса предлагаются 4 варианта ответа, из которых только один верный.  
- После выбора ответа вы получите пояснение и статистику.  
- Вопросы, на которые даны неверные ответы, будут предложены для повторного изучения через заданное время.  

## 🎯 Что включает тренировка?  

1️⃣ **Вопросы с реальных собеседований** – собраны на основе опыта дата-аналитиков, инженеров и дата-сайентистов.  
2️⃣ **Разные уровни сложности** – от базового SQL до продвинутых тем, включая индексы, оптимизацию и работу с JSONB.  
3️⃣ **Статистика ответов** – помогает отслеживать прогресс и сосредоточиться на слабых местах.  

## 🚀 Как использовать этот ноутбук?  

1. Убедитесь, что у вас установлен **PostgreSQL** и ноутбук подключен к базе.  
2. Выполните код ниже, чтобы загрузить вопросы и начать тренировку.  
3. Отвечайте на вопросы, изучайте разбор ответов и совершенствуйте SQL-навыки!  

🔹 **Подключение к базе в Jupyter:**  
```
%load_ext sql  
%sql postgresql://admin:admin@localhost/interview_sql_postgres  
```  

Готовы? Жмите "Run" и начинаем! 🚀  
```

## Инициализация библиотек и подключение к базы данных вопросов для интервью

In [4]:
# Импорт библиотек
import warnings

import psycopg2
import pandas as pd
import ipywidgets as widgets
from IPython.display import display, Markdown

# Подавление предупреждений UserWarning от pandas
warnings.filterwarnings('ignore', category=UserWarning, message="pandas only supports SQLAlchemy connectable")


In [5]:
# параметры подключения к базе данных
DB_CONFIG = {
    "dbname": "interview_sql_postgres",
    "user": "admin",
    "password": "admin",
    "host": "localhost",
    "port": "5432"
}

## Вспомогательные функции

In [6]:
def get_topics():
    # Получает список всех тем из базы данных.
    # Возвращает DataFrame с колонками topic_id и name.
    with psycopg2.connect(**DB_CONFIG) as conn:
        query = "SELECT topic_id, name FROM topic"
        return pd.read_sql(query, conn)

def get_questions(topic_id, min_difficulty=-1):
    """
    Получает вопросы по теме и минимальной сложности.
    Если topic_id == -1 и min_difficulty == -1, возвращает все вопросы.
    """
    with psycopg2.connect(**DB_CONFIG) as conn:
        conditions = []
        if topic_id != -1:
            conditions.append(f"topic_id = {topic_id}")
        if min_difficulty != -1:
            conditions.append(f"difficulty_level >= {min_difficulty}")

        where_clause = f"WHERE {' AND '.join(conditions)}" if conditions else ""
        query = f"""
                    SELECT question_id, question_text, link, created_at 
                      FROM question 
                    {where_clause}
                """
        # display(pd.read_sql(query, conn))
        return pd.read_sql(query, conn)

def check_answer(answer_id):
    # Проверяет, является ли ответ с заданным ID правильным.
    # Возвращает булево значение: True — если правильный, False — если нет.
    answer_id = int(answer_id)
    with psycopg2.connect(**DB_CONFIG) as conn:
        query = "SELECT is_correct FROM answer WHERE answer_id = %s"
        params = (answer_id,)
        result = pd.read_sql(query, conn, params=params)
        return result['is_correct'].iloc[0]

def update_statistics(user_id, question_id, is_correct):
    # Обновляет статистику пользователя по вопросу:
    # - увеличивает количество попыток,
    # - увеличивает количество правильных ответов, если is_correct == True,
    # - обновляет дату последней попытки.
    # Если записи не существует — создаёт новую.
    with psycopg2.connect(**DB_CONFIG) as conn:
        query = f"""
        INSERT INTO user_statistics (user_id, question_id, attempts, correct_attempts, last_attempt)
        VALUES ('{user_id}', {question_id}, 1, {1 if is_correct else 0}, NOW())
        ON CONFLICT (user_id, question_id) DO UPDATE
        SET attempts = user_statistics.attempts + 1,
            correct_attempts = user_statistics.correct_attempts + {1 if is_correct else 0},
            last_attempt = NOW()
        """
        with conn.cursor() as cursor:
            cursor.execute(query)
            conn.commit()

def show_analytics(user_id):
    # Показывает аналитику по темам для конкретного пользователя:
    # - количество всех отвеченных вопросов по теме,
    # - количество правильных ответов.
    # Возвращает DataFrame с названием темы, общим числом попыток и числом правильных ответов.
    with psycopg2.connect(**DB_CONFIG) as conn:
        query = f"""
        SELECT t.name, COUNT(*) as total_questions, SUM(us.correct_attempts) as correct_answers
        FROM user_statistics us
        JOIN question q ON us.question_id = q.question_id
        JOIN topic t ON q.topic_id = t.topic_id
        WHERE us.user_id = '{user_id}'
        GROUP BY t.name
        """
        return pd.read_sql(query, conn)
    
def auto_height(text, line_height=16, min_height=40, max_height=400, wrap_limit=100):
    """
    Вычисляет адекватную высоту Textarea по содержимому, включая переносы строк.
    wrap_limit — кол-во символов в строке до визуального переноса.
    """
    lines = text.split('\n')
    estimated_lines = sum((len(line) // wrap_limit + 1) for line in lines)
    height = min(max(estimated_lines * line_height, min_height), max_height)
    return widgets.Layout(width='100%', height=f'{height}px')


In [None]:
def create_settings_interface():
    """
    Создаёт интерактивный интерфейс настроек с помощью виджетов Jupyter.

    Функция позволяет пользователю выбрать:
    - Тему из базы данных (или 'Все темы');
    - Интервал повторения вопроса, если на него был дан неверный ответ (10, 30 или 60 минут);
    - Уровень сложности вопроса (от 1 до 5, либо 'Любая сложность').

    После нажатия кнопки "Сохранить настройки", выбранные значения сохраняются
    в глобальные переменные: selected_topic, selected_interval, selected_difficulty,
    и отображается сообщение о том, что настройки успешно сохранены.
    """
   # Получение списка тем
    topics = get_topics()
    topic_options = [('Все темы', -1)] + [(row['name'], row['topic_id']) for index, row in topics.iterrows()]

    # Виджет выбора темы
    topic_dropdown = widgets.Dropdown(
        options=topic_options,
        description='Тема:',
    )

    # Виджет выбора интервала (с коротким описанием)
    interval_dropdown = widgets.Dropdown(
        options=[('10 минут', 10), ('30 минут', 30), ('60 минут', 60)],
        description='Интервал:',
    )

    # Пояснение к интервалу
    interval_help = widgets.HTML(
        "<span style='font-size: 12px; color: gray;'>Интервал повторения вопроса при ошибке</span>"
    )

    # Объединяем интервал и пояснение в один блок
    interval_block = widgets.HBox([interval_dropdown, interval_help])

    # Виджет выбора уровня сложности
    difficulty_dropdown = widgets.Dropdown(
        options=[
            ('Любая сложность', -1),
            ('1 - Лёгкие (простые SELECT, базовые операции)', 1),
            ('2 - Ниже среднего (простые JOIN, базовые подзапросы)', 2),
            ('3 - Средние (сложные JOIN, подзапросы, JSONB, CTE)', 3),
            ('4 - Выше среднего (партиционирование, рекурсия)', 4),
            ('5 - Сложные (оптимизация, MVCC, глубокий анализ)', 5)
        ],
        description='Сложность:'
    )

    # Кнопка для сохранения настроек
    save_button = widgets.Button(
        description='Сохранить настройки',
        button_style='success'
    )

    output = widgets.Output()

    # Глобальные переменные для хранения настроек
    global selected_topic, selected_interval, selected_difficulty
    selected_topic = None
    selected_interval = None
    selected_difficulty = None

    # Обработчик нажатия кнопки
    def on_save_button_clicked(b):
        global selected_topic, selected_interval, selected_difficulty
        selected_topic = topic_dropdown.value
        selected_interval = interval_dropdown.value
        selected_difficulty = difficulty_dropdown.value
        with output:
            output.clear_output()
            print(
                f"Настройки сохранены: Тема - {topic_dropdown.label}, "
                f"Интервал - {interval_dropdown.label} минут, "
                f"Сложность - {difficulty_dropdown.label}"
            )
            display(widgets.HTML("<b>Настройки сохранены. Вы можете перейти к следующему шагу.</b>"))

    save_button.on_click(on_save_button_clicked)

    # Отображение всех виджетов
    display(topic_dropdown, interval_block, difficulty_dropdown, save_button, output)

In [30]:
current_question_index = 4



def display_question(topic_id, min_difficulty):
    """
    Функция отображает вопрос и ответы в специальном виджете для выбранной темы 
    """
    global current_question_index
    questions = get_questions(topic_id, min_difficulty)
    
    if questions.empty:
        display(widgets.HTML("<b>Нет вопросов для выбранной темы.</b>"))
        return
    
    questions = questions.sort_values(by='created_at', ascending=True)

    if current_question_index >= len(questions):
        display(widgets.HTML("<b>Все вопросы пройдены.</b>"))
        return
    
    question = questions.iloc[current_question_index]
    question_id = question['question_id']
    question_text = question['question_text']
    question_link = question['link']
    
    with psycopg2.connect(**DB_CONFIG) as conn:
        query = f"SELECT answer_id, answer_text FROM answer WHERE question_id = {question_id}"
        answers = pd.read_sql(query, conn)
    
    # Перемешиваем ответы случайным образом
    answers = answers.sample(frac=1).reset_index(drop=True)

    # Отображение вопроса
    question_textarea = widgets.Textarea(
        value=question_text,
        layout=auto_height(question_text)
    )

    # Отображение ответов
    answer_textareas = [
        widgets.Textarea(value=answer['answer_text'], layout=auto_height(answer['answer_text']))
        for index, answer in answers.iterrows()
    ]
    answer_buttons = [
        widgets.Button(description='Выбрать', layout=widgets.Layout(width='20%'))
        for _ in answers.iterrows()
    ]

    output = widgets.Output()

    def on_button_click(b):
        selected_index = answer_buttons.index(b)
        selected_answer_id = answers.iloc[selected_index]['answer_id']
        is_correct = check_answer(selected_answer_id)
        update_statistics('user_id', question_id, is_correct)
        with output:
            output.clear_output()
            display(widgets.HTML(
                f"<b>{'Правильно!' if is_correct else 'Неправильно!'}</b> "
                f"<a href='{question_link}' target='_blank'>Ссылка на доку</a>"
            ))

    for button in answer_buttons:
        button.on_click(on_button_click)

    # Кнопка "Следующий вопрос"
    next_question_button = widgets.Button(
        description='Следующий вопрос',
        button_style='info'
    )

    def on_next_question_button_clicked(b):
        global current_question_index
        current_question_index += 1
        output.clear_output()
        display_question(topic_id, min_difficulty)

    next_question_button.on_click(on_next_question_button_clicked)

    # Кнопка "Завершить"
    finish_button = widgets.Button(
        description='Завершить',
        button_style='danger'
    )

    def on_finish_button_clicked(b):
        with output:
            output.clear_output()
            display(widgets.HTML("<b>Вы можете перейти к следующему шагу.</b>"))

    finish_button.on_click(on_finish_button_clicked)

    # Отображение всего интерфейса
    display(question_textarea)
    for textarea, button in zip(answer_textareas, answer_buttons):
        display(widgets.HBox([textarea, button]))
    display(next_question_button, finish_button, output)


In [35]:
create_settings_interface()

Dropdown(description='Тема:', options=(('Все темы', -1), ('Базовый SQL', 1), ('Подзапросы', 2), ('Соединения (…

HBox(children=(Dropdown(description='Интервал:', options=(('10 минут', 10), ('30 минут', 30), ('60 минут', 60)…

Dropdown(description='Сложность:', options=(('Любая сложность', -1), ('1 - Лёгкие (простые SELECT, базовые опе…

Button(button_style='success', description='Сохранить настройки', style=ButtonStyle())

Output()

In [36]:
display_question(selected_topic, selected_difficulty)

Textarea(value='Допустим, у тебя есть две таблицы: `flights` с информацией о рейсах и `bookings`, где хранятся…

HBox(children=(Textarea(value='Для этого нужен PRIMARY KEY – ограничение, которое делает столбец уникальным ид…

HBox(children=(Textarea(value='Для этого нужен UNIQUE KEY – ограничение, которое запрещает дублирование значен…

HBox(children=(Textarea(value='Для этого нужен CHECK – ограничение, которое проверяет выполнение условия перед…

HBox(children=(Textarea(value='Для этого нужен FOREIGN KEY – ограничение, которое связывает одну таблицу с дру…

Button(button_style='info', description='Следующий вопрос', style=ButtonStyle())

Button(button_style='danger', description='Завершить', style=ButtonStyle())

Output()

Textarea(value='Как в PostgreSQL однозначно идентифицировать каждую строку в таблице?\n', layout=Layout(height…

HBox(children=(Textarea(value='Для этого нужен первичный ключ (PRIMARY KEY) – уникальный идентификатор записи.…

HBox(children=(Textarea(value='Для этого нужен уникальный ключ (UNIQUE KEY) – он обеспечивает уникальность зна…

HBox(children=(Textarea(value='Для этого нужен внешний ключ (FOREIGN KEY) – он связывает одну таблицу с другой…

HBox(children=(Textarea(value='Для этого нужен индекс (INDEX) – он ускоряет поиск данных в таблице и обеспечив…

Button(button_style='info', description='Следующий вопрос', style=ButtonStyle())

Button(button_style='danger', description='Завершить', style=ButtonStyle())

Output()

Textarea(value='У нас есть таблица report_questions:\n| topic_id | difficulty_level | question_count |\n| ----…

HBox(children=(Textarea(value='SELECT\xa0*,\xa0\n\xa0\xa0\xa0\xa0\xa0\xa0\xa0SUM(question_count)\xa0OVER\xa0(O…

HBox(children=(Textarea(value='SELECT\xa0*,\xa0\n\xa0\xa0\xa0\xa0\xa0\xa0\xa0SUM(question_count)\xa0OVER\xa0(P…

HBox(children=(Textarea(value='SELECT\xa0*,\xa0\n\xa0\xa0\xa0\xa0\xa0\xa0\xa0SUM(question_count)\xa0OVER\xa0(O…

HBox(children=(Textarea(value='SELECT *, \n       SUM(question_count) OVER (ORDER BY topic_id , difficulty_lev…

Button(button_style='info', description='Следующий вопрос', style=ButtonStyle())

Button(button_style='danger', description='Завершить', style=ButtonStyle())

Output()

Textarea(value='Если в LEFT JOIN поменять местами таблицы A и B (они разные), изменится ли результат?\n', layo…

HBox(children=(Textarea(value='Нет, результат останется тем же, так как порядок таблиц в LEFT JOIN не имеет зн…

HBox(children=(Textarea(value='Да, LEFT JOIN всегда берёт все строки из левой таблицы (A) и добавляет к ним со…

HBox(children=(Textarea(value='Да, но только если в таблицах A и B есть одинаковые столбцы. Порядок таблиц в L…

HBox(children=(Textarea(value='Нет, результат останется тем же, так как LEFT JOIN всегда возвращает все строки…

Button(button_style='info', description='Следующий вопрос', style=ButtonStyle())

Button(button_style='danger', description='Завершить', style=ButtonStyle())

Output()

In [11]:
def display_analytics(user_id):
    analytics = show_analytics(user_id)
    display(analytics)
    
    weak_topics = analytics[analytics['correct_answers'] / analytics['total_questions'] < 0.5]
    if not weak_topics.empty:
        display(widgets.HTML("<b>Рекомендуемые темы для повторения:</b>"))
        for index, row in weak_topics.iterrows():
            display(widgets.HTML(f"- {row['name']}"))

display_analytics('user_id')

Unnamed: 0,name,total_questions,correct_answers
0,Подзапросы,1,1
1,Базовый SQL,18,29
2,Оконные функции,1,1
3,CTE и рекурсивные запросы,1,1
4,Индексы и оптимизация запросов,6,6
5,EXPLAIN ANALYZE и оптимизация,3,4
6,Ограничения и транзакции,3,4
7,Соединения (JOIN),5,5
