# Примеры заданий по live coding c решениями с собесодований

Добро пожаловать в этот Jupyter Notebook! Если вы готовитесь к собеседованиям на роль Data Scientist, этот материал может быть для вас полезным.

## Что вы найдете в этом ноутбуке:

1. **Реальные задачи с собеседований:** Все задачи, представленные здесь, были собраны с реальных собеседований. 
2. **Подробные решения и объяснения:** Для каждой задачи предоставлены подробные решения с объяснениями. Я делюсь своим процессом мышления и почему был выбран именно этот подход или метод.

Цель этого ноутбука - помочь вам лучше подготовиться к собеседованиям с live coding, дать понимание типов задач, которые могут быть заданы, и предложить эффективные методы их решения. Независимо от того, являетесь ли вы начинающим или опытным специалистом, я надеюсь, что найдете здесь что-то полезное для себя.

Удачи в подготовке и на собеседованиях!

### Задача 1. Разработка класса аналог множества, только с генерацией случайного элемента

Необходимо разработать класс `RandomizedSet`, который обладает следующими характеристиками:

- Добавление элемента (`add`) и его удаление (`delete`) должны выполняться за время O(1).
- Возможность генерации случайного элемента (`get_random`) из множества за время O(1).

#### Структура класса:

```python
class RandomizedSet:
    def __init__(self) -> None:
        # Конструктор класса

    def add(self, element: int) -> None:
        # Метод для добавления элемента в множество

    def delete(self, element: int) -> None:
        # Метод для удаления элемента из множества

    def get_random(self) -> int:
        # Метод для получения случайного элемента из множества


randomized_set = RandomizedSet()
randomized_set.add(1)
randomized_set.add(2)
randomized_set.add(1)
assert randomized_set.get_random() in [1, 2] # Должен вернуть 1 или 2 с равной вероятностью
assert randomized_set.get_random() in [1, 2] # Должен вернуть 1 или 2 с равной вероятностью
randomized_set.delete(1)
assert randomized_set.get_random() == 2 # Должен вернуть 2, так как 1 был удален
```

***задача с собеса X5***

**Решение задачи 1**:

In [9]:
import random

class RandomizedSet:
    def __init__(self) -> None:
        self.indexes = {}  # Словарь для хранения элементов и их индексов
        self.items = []  # Список для хранения элементов

    def add(self, item: int) -> None:  # O(1)
        if item not in self.indexes:  # Проверяем, что элемента еще нет в множестве
                                      # O(1) <= Операция проверки наличия элемента в хэш-таблице, 
                                      # каковой является словарь в Python (self.dict в данном случае), 
                                      # в среднем выполняется за время O(1)
            self.indexes[item] = len(self.items)
            self.items.append(item)

    def delete(self, item: int) -> None:  # O(1)
        if item in self.indexes:  # Проверяем, что элемент существует
            index = self.indexes.pop(item)  # Удаляем элемент из словаря и получаем его индекс
            # Заменяем удаляемый элемент последним элементом в списке
            last_item = self.items[-1]  
            self.items[index] = last_item
            self.indexes[last_item] = index
            self.items.pop()  # Удаляем последний элемент

    def get_random(self) -> int:
        return random.choice(self.items)  # Возвращаем случайный элемент из списка

In [10]:
randomized_set = RandomizedSet()
randomized_set.add(1)
randomized_set.add(2)
randomized_set.add(1)
randomized_set.get_random()  # Должен вернуть 1 или 2 с равной вероятностью



2

In [11]:
randomized_set.get_random()  # Должен вернуть 1 или 2 с равной вероятностью

2

In [12]:
randomized_set.delete(1)
randomized_set.get_random()  # Должен вернуть 2, так как 1 был удален

2

Возможности для ускорения кода к задаче 1:
- в нашем случае, если большинство операций delete действительно будут проводиться над существующими элементами, использование try/except может быть оправданным. Использование блока try/except вместо проверки if может быть эффективным в сценариях, когда исключения (ошибки) случаются редко. В Python обработка исключений при отсутствии ошибок может быть даже немного быстрее, чем проверка условий, поскольку это упрощает поток управления. Однако, если исключения случаются часто, это может быть менее эффективным, поскольку обработка исключений в Python относительно медленная.

Вот как это может выглядеть:
```python
def delete(self, item: int) -> None:  # O(1)
    try:
        index = self.indexes.pop(item)  # Удаляем элемент из словаря и получаем его индекс
        last_item = self.items[-1]  
        self.items[index] = last_item
        self.indexes[last_item] = index
        self.items.pop()  # Удаляем последний элемент
    except KeyError:
        pass  # Элемента нет в множестве, ничего не делаем
```

In [14]:
class RandomizedSet_try:
    def __init__(self) -> None:
        self.indexes = {}  # Словарь для хранения элементов и их индексов
        self.items = []  # Список для хранения элементов

    def add(self, item: int) -> None:  # O(1)
        if item not in self.indexes:  # Проверяем, что элемента еще нет в множестве
                                      # O(1) <= Операция проверки наличия элемента в хэш-таблице, 
                                      # каковой является словарь в Python (self.dict в данном случае), 
                                      # в среднем выполняется за время O(1)
            self.indexes[item] = len(self.items)
            self.items.append(item)

    def delete(self, item: int) -> None:  # O(1)
        try:
            index = self.indexes.pop(item)  # Удаляем элемент из словаря и получаем его индекс
            # Заменяем удаляемый элемент последним элементом в списке
            last_item = self.items[-1]  
            self.items[index] = last_item
            self.indexes[last_item] = index
            self.items.pop()  # Удаляем последний элемент
        except KeyError:
            pass  # Элемента нет в множестве, ничего не делаем

    def get_random(self) -> int:
        return random.choice(self.items)  # Возвращаем случайный элемент из списка

In [28]:
test_set = RandomizedSet()
for i in range(int(10e6)):
    test_set.add(i)

In [25]:
test_set_1 = RandomizedSet()
test_set_2 = RandomizedSet_try()


In [31]:
%%timeit -n 10
# Удаление элементов из test_set_1 (используется метод с проверкой if)
test_set_1.items = test_set.items[:]
test_set_1.indexes = dict(test_set.indexes)
for i in range(10000):
    test_set_1.delete(i)

1.15 s ± 37.3 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [32]:
%%timeit -n 10
# Удаление элементов из test_set_2 (используется метод с try/except)
test_set_2.items = test_set.items[:]
test_set_2.indexes = dict(test_set.indexes)
for i in range(10000):
    test_set_2.delete(i)

1.27 s ± 60.3 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


вывод: Время не сильно отличается. Казалось бы версия2 с трай не делает одну операцию сравнения и должна работать быстрее. Но нет. А давайте тогда попробуем поудалять несуществующие элементы. Кажется в этом случаем версия2 с трай должна выполняться дольше из-за обработки ошибки.

In [29]:
%%timeit -n 10
# Удаление элементов из test_set_1 (используется метод с проверкой if)
test_set_1.items = test_set.items[:]
test_set_1.indexes = dict(test_set.indexes)
for i in range(10000):
    test_set_1.delete(-i)

928 ms ± 53.2 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [30]:
%%timeit -n 10
# Удаление элементов из test_set_2 (используется метод с try/except)
test_set_2.items = test_set.items[:]
test_set_2.indexes = dict(test_set.indexes)
for i in range(10000):
    test_set_2.delete(-i)

847 ms ± 8.87 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


Опять не верно. Версия 2 работает не намного, но быстрее. Заодно прошли тему возможного вопроса, помогает ли ускорить процесс замена if на try/except