Множество **(set)** в Python — это изменяемая неупорядоченная коллекция. Элементы множества — уникальные значения неизменяемых типов.

- В множество можно добавлять элементы и удалять их: `set` — **изменяемая** коллекция.

- Множество — **неупорядоченная коллекция**, к элементам нельзя обратиться по индексам или автоматически вывести их по порядку.

- Просто так изменить отдельный элемент в множестве нельзя: элементами множества могут быть только неизменяемые объекты (например, числа, строки и кортежи).

- Элементы множества должны быть уникальны. Не получится добавить в множество ещё один элемент со значением, которое уже есть в этом множестве.


In [30]:
# Множество объявляется при помощи фигурных скобок.
grains = {'пшеница', 'рожь', 'овёс', 'кукуруза', 'рис', 10, ('ячмень', 'горох')}

print(grains)

{('ячмень', 'горох'), 'овёс', 'кукуруза', 10, 'рожь', 'рис', 'пшеница'}


***
## Объявление множества при помощи фигурных скобок

Создать множество можно перечислив значения в фигурных скобках `{}` — таких же, как и при объявлении словаря.

In [31]:
# Объявление множества:
tomato_ratings = {5.0, 4.1, 4.3, 4.7, 4.7, 3.8}
print(tomato_ratings)
# Вывод в консоль: {5.0, 4.3, 3.8, 4.1, 4.7}
# Порядок элементов не соответствует порядку при объявлении.

print(type(tomato_ratings))
# Вывод в консоль: <class 'set'>

{3.8, 4.3, 5.0, 4.7, 4.1}
<class 'set'>


> Объявить пустое множество через запись `empty = {}` не получится: будет создан пустой словарь. Фигурные скобки применяются при объявлении обоих этих типов, но пустые скобки создадут именно словарь.

***
## Объявление множества функцией `set()`

Множество можно создать через встроенную функцию. Эта же функция приводит данные других типов к типу set.

In [32]:
# Вызов функции set() без аргументов создаст пустое множество:
empty = set()
print('Содержимое переменной empty:', empty)
print('Тип переменной empty:', type(empty))

# Приведём список к типу set.
# Объявляем список...
vegetables = ['Помидоры', 'Огурцы', 'Баклажаны', 'Перец', 'Капуста']

# ...и преобразуем список в множество:
vegetables_set = set(vegetables)
print('Множество, созданное из списка vegetables:', vegetables_set)
print(type(vegetables_set))

# А что будет, если элементы в списке дублируются?
# Ведь множество может содержать только уникальные элементы!

double_vegetables = [
    'Помидоры',
    'Огурцы',
    'Баклажаны',
    'Баклажаны',  # Дублирующееся значение.
    'Огурцы',    # Дублирующееся значение.
    'Помидоры',  # Дублирующееся значение.
]
double_vegetables_set = set(double_vegetables)
# Напечатаем для сравнения и список...
print('Список с дублями:', double_vegetables)
# ...и множество, которое получилось из этого списка:
print('Множество, созданное из списка с дублями:', double_vegetables_set)

Содержимое переменной empty: set()
Тип переменной empty: <class 'set'>
Множество, созданное из списка vegetables: {'Огурцы', 'Баклажаны', 'Капуста', 'Помидоры', 'Перец'}
<class 'set'>
Список с дублями: ['Помидоры', 'Огурцы', 'Баклажаны', 'Баклажаны', 'Огурцы', 'Помидоры']
Множество, созданное из списка с дублями: {'Помидоры', 'Огурцы', 'Баклажаны'}


> Если список с дублирующимися элементами преобразовать в множество, дублирующиеся значения будут удалены из множества, количество элементов станет меньше и все они будут уникальными.

***
## Элемент множества — неизменяемый объект

Элементом множества не могут быть данные изменяемых типов, например списки.

In [33]:
# Объявим set, элементами которого будут списки:
vegetables = ['Томат', 'Огурец', 'Кабачок', 'Баклажан']
vegetable_prices = [100, 50, 70, 120]
vegetables_set = {vegetables, vegetable_prices}

print(vegetables_set)

TypeError: unhashable type: 'list'

> Из списка множество будет создано лишь в том случае, если элементы списка — неизменяемые объекты.

In [34]:
# В set() передан список элементов типа int:
price_list = [100, 50, 120, 80, 80, 40]
price_set = set(price_list)

# Множество успешно создано
print(price_set)
# Будет напечатано: {100, 50, 40, 80, 120}

# А в этом списке один из элементов содержит вложенный список:
new_price_list = [100, 50, [120, 130], 80, 40]

# При преобразовании списка в множество
# программа выдаст ошибку:
price_set = set(new_price_list)
print(price_set)
# Будет напечатано: TypeError: unhashable type: 'list'

{100, 40, 80, 50, 120}


TypeError: unhashable type: 'list'

> Множество можно создать и из словаря: оно будет содержать только ключи. Ключи словаря — неизменяемые объекты, потому проблем не возникнет.

In [35]:
# Создаём словарь: коллекцию, каждый элемент которой состоит из пары "овощ: цена".
# Ключи словаря - неизменяемые объекты.
# Каждый ключ в словаре уникален.
vegetable_prices = {'Томат': 100, 'Огурец': 50}

# В set() передан словарь.
vegetable_names = set(vegetable_prices)

print(vegetable_names)
# Будет напечатано: {'Томат', 'Огурец'}
# В результате получилось множество,
# состоящее из ключей исходного словаря.

{'Томат', 'Огурец'}


***
## Добавление элемента

Множество — изменяемая коллекция, элементы можно удалять и добавлять.

Для добавления элемента в множество применяют `set.add()`. Это очень похоже на операцию для списков `list.append()`.

Если добавляемый элемент уже есть в множестве, ничего не произойдёт, множество не изменится.

In [1]:
vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
# Сохраним id ячейки памяти, на которую ссылается vegetables:
start_id = id(vegetables)
# Напечатаем этот id:
print('ID множества vegetables:', start_id)

# Добавим элемент:
set.add(vegetables, 'капуста')
# Убедимся, что множество изменилось:
print('Изменённое множество:', vegetables)

# Убедимся, что множество - то же, что и было
print('Объект в памяти тот же?', id(vegetables) == start_id)

# Попробуем добавить ещё томат в множество:
set.add(vegetables, 'томат')
print('Добавили ещё один томат. Но его нет в множестве!', vegetables)

ID множества vegetables: 1197552287520
Изменённое множество: {'томат', 'баклажан', 'капуста', 'огурец', 'лук'}
Объект в памяти тот же? True
Добавили ещё один томат. Но его нет в множестве! {'томат', 'баклажан', 'капуста', 'огурец', 'лук'}


***
## Удаление элемента множества

Для удаления элемента есть три способа: `set.remove(<set>, element)`, `set.discard(<set>, element)` и `set.pop(<set>)`.

Операции `set.remove()` и `set.discard()` очень схожи: обе они удаляют элемент из множества. 

Разница между ними в том, как они себя ведут при попытке удалить элемент, которого нет в множестве. 

Если попытаться удалить несуществующий элемент:

- `set.remove()` выдаст ошибку, выполнение программы остановится;
- `set.discard()` проигнорирует эту попытку и не вызовет ошибку.

Операция `set.discard()` кажется более безопасной в ситуациях, когда неизвестно, существует ли элемент в множестве или нет. Однако если нет уверенности, что нужный элемент есть в множестве и нужно обработать случаи его отсутствия, операция `set.remove()` окажется предпочтительнее: она немедленно уведомит об ошибке, тогда как в случае применения `set.discard()` никто даже и не узнает об отсутствии элемента.

In [2]:
vegetables = {'томат', 'огурец', 'баклажан', 'лук'}

# Удаление существующего элемента
set.remove(vegetables, 'баклажан')
print('Удалили элемент "Баклажан":', vegetables)

set.discard(vegetables, 'лук')
print('Удалили элемент "Лук"', vegetables)
# Вывод в терминал: {'томат', 'огурец'}

# Удаление несуществующего элемента через set.discard()
set.discard(vegetables, 'картошка')
print('Попытались удалить несуществующий элемент через set.discard():', vegetables)
# Вывод в терминал: {'томат', 'огурец'}

# Удаление несуществующего элемента через set.remove()
# И тут возникнет ошибка:
# KeyError: 'картошка'
set.remove(vegetables, 'картошка')
print(vegetables)

Удалили элемент "Баклажан": {'томат', 'огурец', 'лук'}
Удалили элемент "Лук" {'томат', 'огурец'}
Попытались удалить несуществующий элемент через set.discard(): {'томат', 'огурец'}


KeyError: 'картошка'

> Функция `set.pop()` удаляет и возвращает случайный элемент множества. Для жеребьёвки отличный вариант, результат предугадать нельзя.

In [3]:
vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
vegetable = vegetables.pop()
print(f'Сегодня на обед - {vegetable}!')
print(f'Оставшиеся овощи: {vegetables}')

Сегодня на обед - томат!
Оставшиеся овощи: {'огурец', 'баклажан', 'лук'}


***
## Очистка множества

Для очистки существующего множества есть функция `set.clear()` — точно как для списков и словарей:

In [4]:
vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
set.clear(vegetables)
print(vegetables)
# Вывод в терминал: set()

set()


***
## Особенности множеств

При работе с множествами доступны инструменты, о которых другие коллекции даже и мечтать не могут. Например, одно из основных свойств множества — уникальность элементов — позволяет применять множества для очистки последовательностей от дубликатов:

In [5]:
vegetables = ['Помидор', 'Огурец', 'Кабачок', 'Баклажан', 'Цветная капуста', 'Огурец', 'Баклажан']
uniq_vegetables = set(vegetables)

print(uniq_vegetables)
# Вывод в терминал: {'Помидор', 'Огурец', 'Кабачок', 'Баклажан', 'Цветная капуста'}
# Дублирующиеся названия удалены!

{'Баклажан', 'Цветная капуста', 'Помидор', 'Кабачок', 'Огурец'}


Напишите программу, которая подсчитает и напечатает количество уникальных символов в строке, без учёта пробелов.

Строка — это коллекция, она может содержать дублирующиеся символы. Преобразуйте строку в множество — и дубликатов не станет.

Перед подсчётом количества символов удалите из множества пробел — элемент со значением `' '`. Для удаления элемента с определённым значением есть специальная функция.

In [10]:
original_phrase = 'съешь же ещё этих мягких французских булок да выпей чаю'
uniq_chars =  set(original_phrase)   # Создайте коллекцию, в которой будут только уникальные элементы.

# Из коллекции uniq_chars удалите элемент, значение которого - пробел. 
uniq_chars.remove(' ')
uniq_chars_count = len(uniq_chars) # Подсчитайте количество элементов в множестве uniq_chars:

# Печатаем результат:
print(uniq_chars_count)

33


In [9]:
original_phrase = 'съешь же ещё этих мягких французских булок да выпей чаю'
uniq_chars =  set(original_phrase)
uniq_chars.remove(' ')
print(uniq_chars)

{'е', 'ц', 'й', 'н', 'б', 'в', 'ё', 'э', 'с', 'к', 'у', 'м', 'ч', 'т', 'щ', 'л', 'ъ', 'ш', 'р', 'ь', 'я', 'з', 'о', 'ф', 'г', 'д', 'п', 'и', 'ю', 'ж', 'ы', 'х', 'а'}


***
## Проверка наличия элемента в множестве

Чтобы определить, есть ли нужный элемент в множестве, применяют оператор `in`. Он работает так же, как и для последовательностей, но поиск выполняется гораздо быстрее — это связано с особенностью хранения множеств в памяти.

Внимание, эксперимент: 

- создадим список из миллиона элементов;
- создадим множество из миллиона элементов;
- проведём поиск заданного значения в списке и в множестве и сравним время, за которое выполняется поиск.

Чтобы засечь время выполнения операции, импортируем в код встроенный модуль `time`.

In [11]:
import time

# Создаётся множество с миллионом элементов (10 в степени 6)
num_set = set(range(10**6))

# Создаём и наполняем список - тоже миллион элементов:
num_list = list(range(10**6))

# Перед началом поиска в переменную start_time сохраняем 
# текущее время в секундах:
start_time = time.time()

# Начинаем проверку "есть ли значение 954365 в множестве num_set":
if 954365 in num_set:
    print(True)
# После выполнения поиска вновь получаем текущее время
# и находим разницу с временем, сохранённым в start_time.
# Печатаем разницу - это и есть время, затраченное на поиск.
print('Поиск элемента в множестве занял', (time.time() - start_time), 'сек.')

# Вновь засекаем текущее время:
start_time = time.time()

# Начинаем проверку "есть ли значение 954365 в списке num_list":
if 954365 in num_list:
    print(True)

print('Поиск элемента в списке занял', (time.time() - start_time), 'сек.')

True
Поиск элемента в множестве занял 0.0 сек.
True
Поиск элемента в списке занял 0.0 сек.


***
## Операции над множествами

Ключевое отличие множеств от других коллекций заключается в том, что над ними можно выполнять операции:

- «поиск пересечения» — найти одинаковые элементы в двух множествах;
- «объединение» — получить множество, состоящее из элементов двух множеств;
- «поиск разности» — найти элементы, присутствующие лишь в одном из двух множеств;
- «поиск симметрической разности» — получить элементы, которые есть в любом из двух множеств, но не присутствуют в обоих сразу.

***
## Пересечение

Поиск «пересечения» (поиск совпадающих элементов) двух коллекций — востребованная операция в программировании: например, пересечением можно найти одинаковые почтовые адреса в двух списках контактов или одинаковые товары в разных интернет-магазинах.

Для поиска пересечения двух множеств применяют оператор `&`(логическое И).

Выражение с этим оператором возвращает новое множество, в котором будут собраны элементы, одновременно присутствующие в обоих исходных множествах: «верни элементы, которые есть в первом И во втором множествах». 

In [12]:
stepan_vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
tonya_vegetables = {'огурец', 'кабачок', 'баклажан', 'морковь'}

# Создаём множество, элементы которого есть в первом И (&) во втором множестве:
common_vegetables = stepan_vegetables & tonya_vegetables
print(common_vegetables)

{'огурец', 'баклажан'}


> Получить пересечение множеств можно и другим способом — для этого есть функция `set.intersection(<set_1>, <set_2>)`:

In [13]:
stepan_vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
tonya_vegetables = {'огурец', 'кабачок', 'баклажан', 'морковь'}

common_vegetables = set.intersection(stepan_vegetables, tonya_vegetables)
print(common_vegetables)

{'огурец', 'баклажан'}


> С помощью этой функции можно получить пересечение множества с любым объектом, все элементы которого — неизменяемые объекты (например, со списком, элементы которого — числа или строки). 

> Это правило справедливо и для других подобных функций — `set.union()`, `set.difference()`, `set.symmetric_difference()`.

***
## Объединение

В результате объединения двух множеств (операция «логическое ИЛИ») будет создано новое множество, содержащее все элементы исходных: «верни элементы, которые есть в первом **ИЛИ** во втором множестве».

Логическое ИЛИ обозначается оператором `|`.

In [14]:
stepan_vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
tonya_vegetables = {'огурец', 'кабачок', 'баклажан', 'морковь'}

# Создаём множество, элементы которого есть в первом ИЛИ (|) во втором множестве:
all_vegetables = stepan_vegetables | tonya_vegetables
print(all_vegetables)
# Вывод в терминал: {'томат', 'огурец', 'баклажан', 'лук', 'кабачок', 'морковь'}

{'томат', 'морковь', 'баклажан', 'кабачок', 'огурец', 'лук'}


> Другой способ объединить два множества — применить функцию `set.union(<set_1>, <set_2>)`.

In [15]:
stepan_vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
tonya_vegetables = {'огурец', 'кабачок', 'баклажан', 'морковь'}

# Создаём множество, элементы которого есть в первом ИЛИ (|) во втором множестве:
all_vegetables = set.union(stepan_vegetables, tonya_vegetables)
print(all_vegetables)
# Вывод в терминал: {'томат', 'огурец', 'баклажан', 'лук', 'кабачок', 'морковь'}

{'томат', 'морковь', 'баклажан', 'кабачок', 'огурец', 'лук'}


***
## Разность множеств

Разность множеств возвращает новое множество, в которое войдут те элементы первого множества, которых нет среди элементов второго: «верни элементы первого множества **за вычетом** тех, что есть во втором». 

Оператор для поиска разности — обычный минус `-`.

In [16]:
stepan_vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
tonya_vegetables = {'огурец', 'кабачок', 'баклажан', 'морковь'}

# Создаём множество, элементы которого есть в первом множестве и отсутствуют во втором:
stepan_unique_vegetables = stepan_vegetables - tonya_vegetables
print(stepan_unique_vegetables)

{'томат', 'лук'}


>Разность можно найти и функцией `set.difference(<set_1>, <set_2>)`:

In [17]:
stepan_vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
tonya_vegetables = {'огурец', 'кабачок', 'баклажан', 'морковь'}

# Используем функцию difference() для определения разницы между двумя множествами:
stepan_unique_vegetables = set.difference(stepan_vegetables, tonya_vegetables)
print(stepan_unique_vegetables)

{'томат', 'лук'}


***
## Симметрическая разность

Симметрической разностью двух множеств будет третье множество, каждый элемент которого принадлежит либо первому, либо второму множеству, но не их пересечению: «верни элементы двух множеств, но исключи элементы, которые есть и в первом, и во втором множестве одновременно».

Для поиска симметрической разности применяют оператор «ка́рет» `^`.

In [18]:
stepan_vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
tonya_vegetables = {'огурец', 'кабачок', 'баклажан', 'морковь'}

# Определяем симметрическую разницу между двумя множествами:
sym_diff_vegetables = stepan_vegetables ^ tonya_vegetables
print(sym_diff_vegetables)
# Вывод в терминал: {'томат', 'лук', 'кабачок', 'морковь'}

{'томат', 'морковь', 'кабачок', 'лук'}


> Симметрическую разность можно найти и с помощью функции `set.symmetric_difference(<set_1>, <set_2>)`:

In [19]:
stepan_vegetables = {'томат', 'огурец', 'баклажан', 'лук'}
tonya_vegetables = {'огурец', 'кабачок', 'баклажан', 'морковь'}

# Создаём множество, состоящее из элементов обоих множеств, 
# с исключением пересекающихся:
sym_diff_vegetables = set.symmetric_difference(stepan_vegetables, tonya_vegetables)
print(sym_diff_vegetables)

{'томат', 'морковь', 'кабачок', 'лук'}


***
# Задача 1

In [25]:
phrase_1 = 'кот зол как лев дай мне сыр дай мне суп'
phrase_2 = 'кто ест сыр тот кот кто ест суп тот нет'


def find_common_words_count(first_string, second_string):


# Преобразуйте строки в списки, разбив их по пробелам.
    first_set = set(first_string.split())
    second_set = set(second_string.split())
# Преобразуйте полученные списки в множества
# (элементами множества будут только уникальные значения из списка).

# Получите пересечение двух множеств - это будет новая коллекция.
    intersection_set = first_set & second_set
# Верните длину получившейся коллекции.
    return len(intersection_set)

common_words_count = find_common_words_count(phrase_1, phrase_2)
print('Общих уникальных слов в предложениях:', common_words_count)

Общих уникальных слов в предложениях: 3


In [24]:
phrase_1 = 'кот зол как лев дай мне сыр дай мне суп'
phrase_2 = 'кто ест сыр тот кот кто ест суп тот нет'
phrase_1_strig = set(phrase_1.split())
print(phrase_1_strig)

{'как', 'дай', 'суп', 'мне', 'кот', 'лев', 'зол', 'сыр'}


***
# Задача 2

In [26]:
# Овощи, которые растут в каждом из огородов
first_garden = {'помидоры', 'огурцы', 'морковь'}
second_garden = {'перец', 'помидоры', 'лук'}

# 1. Овощи, которые растут и в первом, и во втором огороде
common_vegetables = first_garden & second_garden
print('Овощи, растущие и в первом, и во втором огороде:', common_vegetables)

# 2. Овощи, которые растут только в первом огороде
only_first_garden = first_garden - second_garden
print('Овощи, растущие только в первом огороде:', only_first_garden)

# 3. Овощи, которые растут только во втором огороде
only_second_garden = second_garden - first_garden
print('Овощи, растущие только во втором огороде:', only_second_garden)

Овощи, растущие и в первом, и во втором огороде: {'помидоры'}
Овощи, растущие только в первом огороде: {'огурцы', 'морковь'}
Овощи, растущие только во втором огороде: {'перец', 'лук'}
