# Множества (set)

Есть ещё один мощный и полезный для многих задач встроенный тип коллекций `set()`. Как и в математике, множества неупорядоченны и содержат лишь уникальные элементы. Чтобы создать множество нужно передать в конструктор класса `set()` любую другую коллекцию:

In [None]:
L1 = [1, 2, 3]
L2 = [1, 2, 3, 2, 3, 2, 2, 2, 2, 3, 1, 2, 4]
S1 = set(L1)
S2 = set(L2)

print(f'L1 = {L1}')
print(f'L2 = {L2}')
print(f'\nS1 = set(L1) = {S1}')
print(f'S2 = set(L2) = {S2}')
print(f'\nВ списке L2 всего {len(S2)} уникальных элементов')

Помимо подсчёта уникальных элементов, в python реализована алгебра множеств (причём довольно быстрая). Операции и операторы:
* x in set1 - проверка на принадлежность элемента x множеству s
* set1.add(x) - добавляет в set1 элемент x, изменяет объект set1
* set1.remove(x) - удаляет элемент x из множества set1, изменяет объект set1
* set1 == set2 - проверка множеств на равенство
* set1 >= set2 - проверка, является ли set2 подмножеством set1
* set1 | set2 | set3 | ... - объединение множеств
* set1 & set2 & set3 & ... - пересечение множеств
* set1 - set2 - вычитание элементов множества set2 из set1
* set1 ^ set2 - разница множеств, то есть, выводит все элементы, которые лежат в set1, но не в set2 и те, которые лежат в set2, но не в set1.

А теперь по порядку. Проверка на принадлежность:

In [None]:
L1 = [1, 2, 3]
S1 = set(L1)

print(f'S1 = {S1}')
print(f'\n1 in S1 = {1 in S1}')
print(f'9 in S1 = {9 in S1}')

Добавление и удаление элементов:

In [None]:
L1 = [1, 2, 3]
S1 = set(L1)
S2 = set(L1)

S1.add(4)
S2.remove(1)

print(f'S1 = {S1}')
print(f'S2 = {S2}')

Сравнение:

In [None]:
L1 = [1, 2, 3]
S1 = set(L1)
S2 = set(L1)

S1.add(4)
S2.remove(1)

print(f'S1 = {S1}')
print(f'S2 = {S2}')
print(f'\nS1 == S2 = {S1 == S2}')
print(f'S1 == S1 = {S1 == S1}')
print(f'\nS1 >= S2 = {S1 >= S2}')
print(f'S1 <= S2 = {S1 <= S2}')

Объединение, пересечение, разность и взаимная разность:

In [None]:
L1 = [1, 2, 3]
L2 = [3, 4, 5]

S1 = set(L1)
S2 = set(L2)

print(f'\nS1 = {S1}')
print(f'S1 = {S2}')

print('\nКоммутативные операции:')
print(f'Объединение: S1 | S2 = {S1 | S2}')
print(f'Пересечение: S1 & S2 = {S1 & S2}')
print(f'Взаимная разность: S1 ^ S2 = {S1 ^ S2}')

print('\nНекоммутативные операции:')
print(f'Разность: S1 - S2 = {S1 - S2}')
print(f'Разность: S2 - S1 = {S2 - S1}')

# Кортежи (tuple)

И ещё один встроенный тип коллекций в python это `tuple`. В принципе, можно рассматривать их как неизменяемые списки. Кортежи записываются в круглых скобках с перечислением элементов через запятую:

In [None]:
tup = (2, 4, 8)

print(f'tup = {tup}')
print(f'tup[0] = {tup[0]}')
print(f'tup[:1] = {tup[:2]}')
print(f'len(tup) = {len(tup)}')

Круглые скобки можно опускать

In [None]:
tup = 2, 4, 8

print(f'tup = {tup}')

Такую запись можно использовать для множественного присвоения:

In [1]:
x, y = 2, 4

print(f'x = {x}')
print(f'y = {y}')

x = 2
y = 4


Или для обмена значениями:

In [None]:
x = 'икс'
y = 'игрек'
x, y = y, x

print(f'x = {x}')
print(f'y = {y}')

Кортежи являются неизменяемыми:

In [2]:
tup = (1, 2, 3)
tup[0] = 4

TypeError: 'tuple' object does not support item assignment

Соответственно для них отсутствуют методы, которые изменяют объект:

In [3]:
tup = (1, 2, 3)
tup.append(4)

AttributeError: 'tuple' object has no attribute 'append'

# Counter

Ещё одной интересной стандартной коллекцией является счётчик. Однако, в ядре его нет и его импортируют из стандартного модуля collections. 

Судя по названию, используется для подсчёта различных объектов. Ведёт себя счётчик практически как словарь:

In [None]:
from collections import Counter

c = Counter()

for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:
    c[word] += 1

print(f'c = {c}')
print(f"c['blue'] = {c['blue']}")
print(f"c['yellow'] = {c['yellow']}")

Очевидные отличия от словаря - обращение к несуществующему элементу возвращает `0` вместо `KeyError`. Однако, это ещё не всё.

Счётчик можно красиво инициализировать итерируемым объектом:

In [None]:
c = Counter('Ехал Путин через Путин'.split())
print(f'c = {c}')

А так же красиво апдейтнуть:

In [None]:
c = Counter('Ехал Путин через Путин'.split())
c.update('Видит Путин в Путин Путин'.split())
print(f'c = {c}')

Апдейтить можно и другим счётчиком 

In [None]:
c = Counter('Ехал Путин через Путин'.split())
s = Counter('Видит Путин в Путин Путин'.split()) # s - значит sчётчик

print(f'c = {c}')
print(f's = {s}')

c.update(s)
print(f'\nc (updated) = {c}')

Ну и, наконец, имеет удобный метод `Counter.most_common()`, который выводит подсчитанные элементы по их частоте в убывающем порядке. В качестве аргумента можно передать целое число чтобы ограничить количество элементов:

In [None]:
c = Counter('Ехал Путин через Путин'.split())
c.update('Видит Путин в Путин Путин'.split())

print(f'c = {c}')
print(f'\nc.most_common() = {c.most_common()}')
print(f'c.most_common(1) = {c.most_common(1)}')
