# Множества

Что должно уметь делать множество?
- Добавлять элемент
- Проверять налчие в множестве
- Удалять элемент

Хэш-функция - преобразующая из большого числа в маленькое

В хэш-таблице порядок не важен

In [None]:
# Делаем своё множество
setsize = 10
myset = [[] for _ in range(setsize)] # грубо говоря, массив массивов (список списков)

def add(x):
    myset[x % setsize].append(x) # хэшируем и добавляем

def find(x):
    for now in myset[x % setsize]: # ищем линейным поиском
        if now == x:
            return True
    return False

def delete(x):
    xlist = myset[x % setsize] # выделяем массив по индексу
    for i in range(len(xlist)):
        if xlist[i] == x:
            xlist[i], xlist[len(xlist) - 1] = xlist[len(xlist) - 1], xlist[i] # питонический способ поменять местами две переменных
            # ^ также своп необязателен, т.к. мы все равно удаляем последний элемент, и его значение мы могли бы подставить в удаляемый элемент ^
            xlist.pop()
            return

Выше мы реализовали **мульти**множество, т.к. ни при одной операции мы не проверяем, есть ли ещё такой элемент

Если нужно реализовать только множество, то в операции добавления нужно добавить проверку на **уникальность** элемента

### Термины

F(x) = x % setsize - **хеш-функция**

myset (список списков) - **хеш-таблица**

**Коллизия** - совпадение значений хеш-функции для разных параметров

- Хеш-функций много, остаток от деления - вполне неплохая

### Что можно хранить в множестве эффективно

- В целом, всё что угодно - в компьютере все состоит из чисел
- *Эффективно* - только **неизменяемые** объекты! Для неизменяемых объектов можно посчитать хэш-функцию при создании
- Хэш-функция должна давать равномерное распределение

# Амортизированная сложность

Проблемы с хеш-таблицей:

Если у них слишком большой размер - ест много памяти O(N)

Слишком маленький размер - большой коэффициент заполнения, медленный поиск, удаление O(K/N)

Хочется иметь разумный баланс, например, коэффициент заполнения - не больше единицы (K <= N). Тогда все операции в среднем будут занимать О(1)

### Просто решение
Таблица заполнилась - увеличим ее размер вдвое!

**Амортизированная сложность** - среднее время выполнения операции (условно). Если всего операций N и на это ушло O(N) времени, то амортизированная сложность операции - О(1)


In [8]:
from sys import getsizeof
lis = [1]
print(getsizeof(lis))
lis.append(2)
print(getsizeof(lis))
lis.append(3)
print(getsizeof(lis))
lis.append(5)
print(getsizeof(lis))
lis.append(1000)
print(getsizeof(lis))
lis.append(1000)
print(getsizeof(lis))

64
96
96
96
96
128


Задача 1

Дана последовательность положительных чисел длиной N и число X

Нужно найти такие A и B что A+X=X или вернуть 0,0

In [10]:
inplist = list(int(i) for i in input().split())
x = int(input())
ost_set = set()

for i in inplist:
    if i in ost_set:
        print(x-i, i)
        break
    else:
        ost_set.add(x-i)
    


3 8
