# Множество (Multiplicity)

**Основные операции:**

1. **Добавление элемента:** Множество позволяет добавлять новые элементы. Если элемент уже присутствует, он не будет добавлен повторно.

2. **Проверка наличия элемента:** Можно проверить, содержится ли определённый элемент в множестве.

3. **Удаление элемента:** Элемент можно удалить из множества, если он там присутствует.

**Устройство множества:**

* Каждый элемент в множестве имеет своё уникальное значение, называемое хэш-кодом.
* Функция хэширования вычисляет для каждого элемента это значение.
* Элемент помещается в список (или другую структуру данных) под индексом, соответствующим его хэш-коду.

Множество обеспечивает эффективный доступ и операции с элементами благодаря использованию хэширования.

**Термины:**

* F(X) = X % setsize - хеш-функция
* myset (список списков) - хеш-таблица
* Совпадение значений хеш-функции для разных параметров - коллизия

# Задачи

### Условие задачи

Мы хотим создать структуру данных, которая будет представлять собой мультимножество, способное хранить до 10 элементов. Мультимножество позволяет добавлять элементы, проверять их наличие и удалять элементы, учитывая возможность повторяющихся значений.

### Описание алгоритма

Наше мультимножество будет реализовано с использованием хэш-таблицы (списка списков). Основные операции будут выполняться следующим образом:

1. **Добавление элемента (`add`):**
   - Элемент добавляется в мультимножество.
   - Для этого элемента вычисляется хэш-код, который определяет индекс в основном списке (массиве) мультимножества.
   - Элемент добавляется в список, соответствующий этому индексу.

2. **Проверка наличия элемента (`contains`):**
   - Для проверки наличия элемента также вычисляется его хэш-код.
   - Элемент ищется в списке, соответствующем индексу, который был вычислен с помощью хэш-кода.

3. **Удаление элемента (`delete`):**
   - Элемент удаляется из мультимножества.
   - Вычисляется хэш-код элемента.
   - Элемент удаляется из списка, соответствующего вычисленному хэш-коду.

In [1]:
class MultiSet:
    def __init__(self, setsize=10):
        self.setsize = setsize
        self.myset = [[] for _ in range(setsize)]

    def add(self, x):
        hash_code = hash(x) % self.setsize
        self.myset[hash_code].append(x)

    def contains(self, x):
        hash_code = hash(x) % self.setsize
        return x in self.myset[hash_code]

    def delete(self, x):
        hash_code = hash(x) % self.setsize
        x_list = self.myset[hash_code]
        for i in range(len(x_list)):
            if x_list[i] == x:
                x_list[i], x_list[-1] = x_list[-1], x_list[i]  # swap with the last element
                x_list.pop()  # remove the last element (which is x)
                return

In [2]:
multiset = MultiSet(setsize=5)

# Добавляем элементы в мультимножество
multiset.add(5)
multiset.add(10)
multiset.add(15)
multiset.add(5)  # добавляем повторяющийся элемент

# Проверяем наличие элемента
print(f"Contains 10: {multiset.contains(10)}")  # True
print(f"Contains 20: {multiset.contains(20)}")  # False

# Удаляем элемент
multiset.delete(5)

# Проверяем изменения
print(f"Contains 5 after deletion: {multiset.contains(5)}")  # True

Contains 10: True
Contains 20: False
Contains 5 after deletion: True


### Условие задачи

Дан массив целых чисел `nums` и целое число `x`. Необходимо найти два различных числа из массива, сумма которых равна `x`. Если такие числа найдены, вернуть их. Если такой пары не существует, вернуть (0, 0).

### Описание алгоритма

Для решения задачи используется метод перебора (brute force), который имеет временную сложность \( O(N^2) \), где \( N \) — количество элементов в массиве `nums`.

1. **Перебор чисел А и В:**
   - Вложенными циклами перебираются все возможные пары чисел из массива `nums`.
   - Внешний цикл идет по индексу `i` от 0 до `N-1`.
   - Внутренний цикл идет по индексу `j` от `i+1` до `N`.

2. **Проверка суммы:**
   - Для каждой пары чисел (nums[i], nums[j]) проверяется условие: `nums[i] + nums[j] == x`.
   - Если условие выполняется, то возвращается кортеж (nums[i], nums[j]).

3. **Возврат результата:**
   - Если весь массив просмотрен и не найдена пара чисел с суммой `x`, возвращается кортеж (0, 0).


In [None]:
def two_terms_with_sum_x(nums, x):
    for i in range(len(nums)):
        for j in range(i + 1, len(nums)):
            if nums[i] + nums[j] == x:
                return nums[i], nums[j]
    return 0, 0

# Пример использования
nums = [2, 7, 11, 15, 3, 6]
x = 9
result = two_terms_with_sum_x(nums, x)
print(f"Два числа с суммой {x}: {result}")  # Вывод: (2, 7), так как 2 + 7 = 9


### Условие задачи

Дан массив целых чисел `nums` и целое число `x`. Необходимо найти два различных числа из массива, сумма которых равна `x`. Если такие числа найдены, вернуть их. Если такой пары не существует, вернуть (0, 0).

### Описание алгоритма

Для решения задачи используется метод хэширования (hashing), который имеет временную сложность \( O(N) \), где \( N \) — количество элементов в массиве `nums`.

1. **Использование множества для хранения предыдущих чисел:**
   - Создается пустое множество `prevnums`, которое будет хранить все числа, которые были обработаны до текущего момента.

2. **Перебор элементов массива:**
   - Итерируемся по массиву `nums`.
   - Для каждого текущего числа `nownum` проверяем, есть ли число `x - nownum` уже в множестве `prevnums`.

3. **Поиск суммы:**
   - Если число `x - nownum` уже есть в множестве `prevnums`, то возвращаем пару `(nownum, x - nownum)` как результат.

4. **Добавление текущего числа в множество:**
   - Если число `x - nownum` не найдено в `prevnums`, добавляем текущее число `nownum` в множество `prevnums` для последующих проверок.

5. **Возврат результата:**
   - Если весь массив просмотрен и не найдена пара чисел с суммой `x`, возвращается кортеж `(0, 0)`.


In [None]:
def two_terms_with_sum_x(nums, x):
    prevnums = set()
    for nownum in nums:
        if x - nownum in prevnums:
            return nownum, x - nownum
        prevnums.add(nownum)
    return 0, 0

# Пример использования
nums = [2, 7, 11, 15, 3, 6]
x = 9
result = two_terms_with_sum_x(nums, x)
print(f"Два числа с суммой {x}: {result}")  # Вывод: (2, 7), так как 2 + 7 = 9

### Условие задачи

Дан словарь `dictionary` и текст `text`, представленный в виде списка слов. Требуется для каждого слова из текста проверить, содержится ли оно в словаре `dictionary`, или же содержится ли хотя бы одно из слов, полученных из слов словаря путем удаления одной буквы. Вернуть список булевых значений, где `True` указывает на наличие слова в словаре или его "похожих" вариантов, а `False` - на отсутствие.

### Описание алгоритма

Алгоритм состоит из двух основных шагов:

1. **Формирование "хороших" слов:**
   - Создается множество `goodwords`, в котором инициализируются все слова из словаря `dictionary`.
   - Для каждого слова из словаря генерируются все возможные варианты удаления одной буквы.
   - Сложность этого шага составляет \( O(NK) \), где \( N \) - количество слов в словаре, а \( K \) - средняя длина слова в словаре.

2. **Проверка слов из текста:**
   - Для каждого слова из текста проверяется, содержится ли оно в множестве `goodwords`.
   - Это делается за \( O(1) \) благодаря хэшированию множества.

3. **Возврат результата:**
   - Результатом является список булевых значений, где каждое значение указывает на наличие соответствующего слова из текста в словаре или его "хороших" вариантах.


In [6]:
def words_in_dict(dictionary, text):
    goodwords = set(dictionary)
    for word in dictionary:
        for delpos in range(len(word)):
            goodwords.add(word[:delpos] + word[delpos+1:])
    ans = []
    for word in text:
        ans.append(word in goodwords)
    return ans

# Пример использования
dictionary = ["apple", "banana", "cherry", "date"]
text = ["apple", "bananas", "cherry", "grape"]
result = words_in_dict(dictionary, text)
print(result)  # Вывод: [True, False, True, False]

[True, False, True, False]


**Объяснение примера**

- В данном примере словарь `dictionary` содержит слова `["apple", "banana", "cherry", "date"]`, а текст `text` содержит слова `["apple", "bananas", "cherry", "grape"]`.
- Для каждого слова в словаре генерируются "хорошие" варианты, удаляя одну букву.
- После формирования множества `goodwords` оно содержит также слова, такие как `"aple"`, `"aple"`, `"pple"`, `"appl"`, `"banan"`, `"banna"`, и т.д.
- Функция `words_in_dict` проверяет каждое слово из текста на наличие в множестве `goodwords`.
- Результат работы функции для данного примера будет `[True, True, True, False]`, так как слова `"apple"`, `"banana"`, и `"cherry"` есть в словаре или их "хороших" вариантах, а слово `"grape"` не содержится.

Этот алгоритм эффективно решает задачу проверки наличия слов из текста в словаре или их похожих вариантов за время \( O(NK + M) \), где \( M \) - количество слов в тексте.