Центр непрерывного образования

# Программа «Python для автоматизации и анализа данных»

## Множества

<b>Множество</b> — cоставной тип данных, представляющий собой неупорядоченный набор уникальных объектов (элементов множества) под одним именем. Множества изменяемы и чаще всего используются для удаления дубликатов и всевозможных проверок на вхождение.

Чтобы задать множество, нужно в фигурных скобках перечислить его элементы.
Создадим множество из четырех элементов (названий млекопитающих) и выведем на экран:

In [36]:
animals = {'cat', 'dog', 4 , 'wolf'}
print(animals)

{'wolf', 4, 'dog', 'cat'}


После запуска видим иной порядок, чем мы задали. Так происходит потому, что элементы в множестве Python не упорядочены. 

### Cоздание множества

Для создания пустых множеств обязательно вызывать функцию `set()`:

In [37]:
empty = set()

Множество может содержать и строки, и числа.

In [38]:
animals_and_num = {'cat', 5, 'dog', 4, 'fox', 3, 'wolf', 2}
print(animals_and_num)

{2, 3, 4, 5, 'fox', 'dog', 'cat', 'wolf'}


 Обратите внимание, что Python опять выводит элементы множества в случайном порядке. 

Особенностью множества является то, что один  и тот же элемент <b>не может</b> входить в множество несколько раз. 
Элементы не упорядочены и нет возможности отличить один элемент от другого. Поэтому множество содержит только уникальные элементы, что делает его удобным инструментом для удаления дубликатов и проверок на вхождение.

In [39]:
animals = {'cat', 'cat', 'cat', 'dog', 'fox', 'wolf'}
print(animals)

{'cat', 'wolf', 'dog', 'fox'}


### Важно!

Подытожим, у множеств есть три ключевые особенности:
<ul>
<li>Порядок элементов в множестве не определен</li>
<li>Элементы множеств — строки и/или числа</li>
<li>Множество не может содержать одинаковых элементов</li>
</ul>

## Операции над множеством (одним)

`len ()` - вычисление количества элементов множества:

In [41]:
my_set = {'a', 'b', 'c', 'a'}
n = len(my_set)
n

3

#### Добавление элемента в множество

Выполняется с помощью метода `.add()`. Метод - что-то вроде функции, «приклеенной» к конкретному множеству.

Если элемент, равный новому элементу, уже существует в множестве, оно не изменится, поскольку не может содержать одинаковых элементов. Ошибки при этом не произойдет.

In [43]:
my_set = set()
my_set.add('a')
my_set.add('b')
my_set.add('a')
print(my_set)

{'a', 'b'}


#### Удаление элемента

Для удаления есть три метода: \
`.discard()`  - удалить заданный элемент, если он есть в множестве, и ничего не делать, если его нет; \
`.remove()` - удалить заданный элемент, если он есть, и породить ошибку `KeyError`, если нет; \
`.pop()` - удалить некоторый элемент из множества и возвратить его как результат.

In [44]:
my_set = {'a', 'b', 'c'} 
my_set.discard('a')      # будет удален
my_set.discard('boom')   # нет в множестве, ничего не делать
print(my_set)

{'b', 'c'}


In [45]:
my_set.remove('b')       # будет удален
print(my_set) 

{'c'}


In [46]:
my_set.remove('game')    # не в множестве, вызовет ошибку KeyError

KeyError: 'game'

In [47]:
elem = my_set.pop() # удаляет из множества случайный элемент и возвращает его значение
elem

'c'

#### Очистка множества

Очистить множество от всех элементов можно с помощью метода <b>clear</b>:

In [48]:
my_set.clear()

## Операции над множествам

Еще одно очень полезное свойство множеств в Python — возможность выполнять операции над множествами, которые вам могут быть знакомы из математики или логики. Это операции *объединения*, *пересечения* и *разности*. 

Например, с их помощью мы можем решить следующие задачи:
* получим список всех студентов, которые записались хотя бы на один из трех курсов по выбору (*объединение множеств студентов, записавшихся на каждый из курсов*);
* выберем время для консультации, которое удобно всем студентам (*пересечение множеств временных интервалов, которые указал каждый студент как удобные*);
* получим перечень продуктов, которые нужно докупить, чтобы приготовить шоколадный торт (*разность продуктов, перечисленных в рецепте, и тех, которые есть дома*).

Давайте разбираться, как эти операции реализованы в Python.

Представим, что вы и ваш друг снимаете квартиру, и вы решили завести домашнее животное. Хозяева согласны, но только одно! Каждый из вас составил список животных, на которых он согласен. 

In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

print(f'Животные, которых хочу завести я:', *my_pets_list)
print(f'Животные, которых хочет завести мой друг:', *friend_pets_list)

Животные, которых хочу завести я: ужик кошка шиншилла рыбка
Животные, которых хочет завести мой друг: ужик питон собака кошка хамелеон


Множества удобно представлять в виде диаграмм Эйлера — Венна, и мы тоже будем ими пользоваться.  

<img src='https://github.com/rogovich/Data/blob/master/img/eiler_1.png?raw=true' width="300">



* Зеленый круг — животные, которых хотите завести вы. 
* Оранжевый круг — животные, которых хочет завести ваш друг.
* Голубая область на пересечении кругов — животные, которых хотите завести вы оба.

## Объединение

Операция *объединения* множеств A и B создает множество, содержащее все уникальные элементы входящие в оба множества.

<img src='https://github.com/rogovich/Data/blob/master/img/eiler_2.png?raw=true' width="300">

В нашем примере объединением будет список всех животных, которых хотя бы кто-то из вас не против завести

В Python объедение множеств можно получить двумя способами
* `A | B` — с помощью оператора объединения `|` (вертикальная черта)
* `A.union(B)` — с помощью метода множеств `.union()`, который вызывается от одного множества и берет аргументом второе.

Какой бы способ вы ни использовали, для операции объединения порядок множеств не важен. Так, результат объединения `A | B` совпадёт с результатом объединения `B | A`.




In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

# Находим объединение с помощью оператора `|`
print(f'Животные, которых мы не против завести: {my_pets_list | friend_pets_list}')

# Находим объединение с помощью метода `.union()`
print(f'Животные, которых мы не против завести: {my_pets_list.union(friend_pets_list)}')

Животные, которых мы не против завести: {'ужик', 'питон', 'рыбка', 'собака', 'кошка', 'хамелеон', 'шиншилла'}
Животные, которых мы не против завести: {'ужик', 'питон', 'рыбка', 'собака', 'кошка', 'хамелеон', 'шиншилла'}


## Пересечение

Операция *пересечения* множеств A и B создает множество, содержащее только те элементы, которые одновременно входят и в A, и в B.

В нашем примере пересечением будут те животные, которых одновременно хотите завести и вы, и ваш друг — голубая область на рисунке.

<img src='https://github.com/rogovich/Data/blob/master/img/eiler_1.png?raw=true' width="300">

В Python пересечение множеств можно получить двумя способами
* `A & B` — с помощью оператора пересечения `&` (амперсанд)
* `A.intersection(B)` — с помощью метода множеств `.intersection()`, который вызывается от одного множества и берет аргументом второе.

Как и в случае с объединением множеств, порядок множеств для операции пересечения не важен.


In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

# Находим пересечение с помощью оператора `&`
print(f'Животные, которые нравятся нам обоим: {my_pets_list & friend_pets_list}')

# Находим объединение с помощью метода `.intersection()`
print(f'Животные, которые нравятся нам обоим: {my_pets_list.intersection(friend_pets_list)}')

Животные, которые нравятся нам обоим: {'ужик', 'кошка'}
Животные, которые нравятся нам обоим: {'ужик', 'кошка'}


## Разность 

Операция *разности* множеств A и B создает множество, содержащее только те элементы, которые входят в A, но не входят в B (или наоборот).

В нашем примере результатом разности множеств будет либо множество животных, которые нравятся вам, но не нравятся вашему другу, и наоборот.

Животные, которые нравятся мне и не нравятся другу:  
<img src='https://github.com/rogovich/Data/blob/master/img/eiler_4.png?raw=true' width="300">

Животные, которые нравятся другу и не нравятся мне:  
<img src='https://github.com/rogovich/Data/blob/master/img/eiler_3.png?raw=true' width="300">

В Python разность множеств можно получить двумя способами
* `A - B` — с помощью оператора `-` 
* `A.difference(B)` — с помощью метода множеств `.difference()`, который вызывается от одного множества и берет аргументом второе.

**ВАЖНО!** В отличие от операций объединения и пересечения, для операции разности важен порядок элементов. Так `A - B` вернет множество только тех элементов, которые входят в A, но не входят в B. А `B - A` — наоборот.



In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

# Находим разность с помощью оператора `-`
print(f'Животные, которые нравятся мне, но не нравятся другу: {my_pets_list - friend_pets_list}')

# Находим разность с помощью метода `.difference()`
# Обратите внимание, что мы поменяли наши множества местами и результат изменится
print(f'Животные, которые нравятся другу, но не нравятся мне: {friend_pets_list.difference(my_pets_list)}')

Животные, которые нравятся мне, но не нравятся другу: {'шиншилла', 'рыбка'}
Животные, которые нравятся другу, но не нравятся мне: {'питон', 'хамелеон', 'собака'}


## Симметрическая разность

Иногда нам нужно найти все элементы, входящие в A или в B, но не в оба из них одновременно.

В нашем примере это те животные, которых мы точно не заведем (они не нравятся кому-то из вас, а значит в шорт-лист точно не попадут).

<img src='https://github.com/rogovich/Data/blob/master/img/eiler_5.png?raw=true' width="300">

Операция, которая возвращает нам такое множество, называется операцией *симметрической разности*.

В Python симметрическую разность множеств можно получить двумя способами

* `A ^ B` — с помощью оператора `^`
* `A.symmetric_difference(B)` — с помощью метода множеств `.symmetric_difference()`, который вызывается от одного множества и берет аргументом второе.

Здесь, в отличие от разности, порядок множеств опять не важен.

In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

# Находим симметрическую разность с помощью оператора `^`
print(f'Этих животных мы точно заводить не будем: {my_pets_list ^ friend_pets_list}')

# Находим симметрическую разность с помощью метода `.symmetric_difference()`
print(f'Этих животных мы точно заводить не будем: {my_pets_list.symmetric_difference(friend_pets_list)}')

Этих животных мы точно заводить не будем: {'питон', 'рыбка', 'хамелеон', 'собака', 'шиншилла'}
Этих животных мы точно заводить не будем: {'питон', 'рыбка', 'хамелеон', 'собака', 'шиншилла'}


Если вдруг вам так проще, то симметрическую разность можно представить как разность между объединением и пересечением множеств A и B :) Или как объединение разностей `A - B` и `B - A`.

Мы можем выполнять операции над множествами последовательно в одной строке. Операции будут выполняться слева направо, никаких особых приоритетов у операций нет (таких как, например, приоритет умножения над сложением в арифметике). Поэтому не забудьте расставить скобки для определения приоритета операций, если это требуется.


In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

# Найдем симметрическую разность, как разность объединения и пересечения двух множеств
# Обратите внимание, что сейчас скобки расставлены корректно и порядок действий правильный
pets_sym_diff = (my_pets_list | friend_pets_list) - (my_pets_list & friend_pets_list)
print(f'Этих животных мы точно заводить не будем: {pets_sym_diff}')


Этих животных мы точно заводить не будем: {'питон', 'рыбка', 'собака', 'хамелеон', 'шиншилла'}


Давайте разберем по шагам, как сработало наше выражение   
`(my_pets_list | friend_pets_list) - (my_pets_list & friend_pets_list)`

* Сначала вычислим объединение двух множеств в первых скобках — всех животных, которых хотя бы один из вас не против завести. 
`my_pets_list | friend_pets_list`  


In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

pets_union = my_pets_list | friend_pets_list

print(f'Шаг 1. Объединение множеств my_pets_list | friend_pets_list:\n{pets_union}')

Шаг 1. Объединение множеств my_pets_list | friend_pets_list:
{'ужик', 'питон', 'рыбка', 'собака', 'кошка', 'хамелеон', 'шиншилла'}


* Теперь вычислим пересечение двух множеств во вторых скобках — те животные, которые нравятся одновременно вам обоим.
`my_pets_list & friend_pets_list`

In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

pets_union = my_pets_list | friend_pets_list

print(f'Шаг 1. Объединение множеств my_pets_list и friend_pets_list:\n{pets_union}')

pets_intersection = my_pets_list & friend_pets_list
print(f'Шаг 2. Пересечение множеств my_pets_list и friend_pets_list:\n{pets_intersection}')

Шаг 1. Объединение множеств my_pets_list и friend_pets_list:
{'ужик', 'питон', 'рыбка', 'собака', 'кошка', 'хамелеон', 'шиншилла'}
Шаг 2. Пересечение множеств my_pets_list и friend_pets_list:
{'ужик', 'кошка'}


* Теперь найдем разность объединения множеств `pets_union` и пересечения множеств `pets_intersection` — животные, которые нравятся хоть кому-то из вас, минус животные, которые нравятся вам обоим одновременно. Это и есть симметрическая разность по определению.

In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

pets_union = my_pets_list | friend_pets_list

print(f'Шаг 1. Объединение множеств my_pets_list и friend_pets_list:\n{pets_union}')

pets_intersection = my_pets_list & friend_pets_list
print(f'Шаг 2. Пересечение множеств my_pets_list и friend_pets_list:\n{pets_intersection}')

pets_sym_diff = pets_union - pets_intersection
print(f'Шаг 3. Симметрическая разность my_pets_list и friend_pets_list:', pets_sym_diff, sep='\n')
print(f'В симметрической разности этих двух множеств {len(pets_sym_diff)} элементов.')

Шаг 1. Объединение множеств my_pets_list и friend_pets_list:
{'ужик', 'питон', 'рыбка', 'собака', 'кошка', 'хамелеон', 'шиншилла'}
Шаг 2. Пересечение множеств my_pets_list и friend_pets_list:
{'ужик', 'кошка'}
Шаг 3. Симметрическая разность my_pets_list и friend_pets_list:
{'питон', 'рыбка', 'собака', 'хамелеон', 'шиншилла'}
В симметрической разности этих двух множеств 5 элементов.


Давайте посмотрим, что получится, если скобки не расставлять и записать все действия подряд:  
`my_pets_list | friend_pets_list - my_pets_list & friend_pets_list`

In [None]:
pets_sym_diff_error = my_pets_list | friend_pets_list - my_pets_list & friend_pets_list
print(f'Это НЕ симметрическая разность my_pets_list и friend_pets_list:', pets_sym_diff_error, sep='\n')
print(f'В этом множестве {len(pets_sym_diff_error)} элементов')

Это НЕ симметрическая разность my_pets_list и friend_pets_list:
{'ужик', 'питон', 'кошка', 'рыбка', 'хамелеон', 'собака', 'шиншилла'}
В этом множестве 7 элементов


Здесь мы сначала нашли объединение ` my_pets_list | friend_pets_list` (как и в правильном порядке действий), потом разность этого пересечения с множеством `my_pets_list` и эту разность пересекли с множеством `friend_pets_list`. Как мы видим, порядок действий нарушился и ответ получился неправильный — симметрическую разность таким образом мы не нашли.

Попробуйте разобрать этот код по шагам и посмотреть, какие множества получаются на каждом шаге.

## Так кого же заведем?

Как вы уже поняли, заводить мы будем кого-то из тех животных, которые попали в пересечение множеств животных, которые нравятся и вам и вашему другу.

In [None]:
my_pets_list = {'кошка', 'рыбка', 'шиншилла', 'ужик'}
friend_pets_list = {'собака', 'питон', 'ужик', 'кошка', 'хамелеон'}

pets_short_list = my_pets_list & friend_pets_list
print(f'Будем выбирать из: {pets_short_list}')

Будем выбирать из: {'ужик', 'кошка'}


Тут ваш друг напомнил вам про такое прекрасное животное как черепашка. Так как черепашки нравятся вам обоим вы немедленно добавили ее в шорт-лист.

In [None]:
pets_short_list.add('черепашка')
print(f'Будем выбирать из: {pets_short_list}')

Будем выбирать из: {'ужик', 'черепашка', 'кошка'}


Вы решили отправить список финалистов на роль вашего нового питомца на утверждение хозяевам квартиры. Они все еще не против животных, но теперь поставили условие, что животное обязательно должно жить в аквариуме или клетке. Никаких кошек!

In [None]:
pets_cage = {'шиншилла', 'хомячок', 'морская свинка', 'попугайчик', 'канарейка'}
pets_aquarium = {'ужик', 'рыбка', 'хамелено', 'питон', 'черепашка', 'улитка'}

# В выводе увидим пустое множество, потому что ни одно из наших животных не может жить в клетке
print(f'Кто из животных, которые нравятся нам обоим, может жить в клетке:\n{pets_short_list & pets_cage}') 

print(f'Кто из животных, которые нравятся нам обоим, может жить в аквариуме:\n{pets_short_list & pets_aquarium}')

Кто из животных, которые нравятся нам обоим, может жить в клетке:
set()
Кто из животных, которые нравятся нам обоим, может жить в аквариуме:
{'ужик', 'черепашка'}


Ну что ж, покупаем аквариум и выбираем из двух вариантов: ужик или черепашка.

In [None]:
# Пересечение множеств животных из нашего шорт-листа и животных, которые могут жить в аквариуме, — 
# итоговое множество, из которого будем выбирать
pets_final = pets_short_list & pets_aquarium  

pet = input('Ну что, кто здесь лишний? ')
pets_final.remove(pet) # Удалим введенное животное из множества финалистов

print('Решено! Наше домашнее животное —', *pets_final)

Ну что, кто здесь лишний? черепашка
Решено! Наше домашнее животное — ужик


## Сравнение множеств

Чтобы проверить, равны ли два множества, можно использовать оператор `==`.

In [3]:
set1 = {1, 2, 3}
set2 = {3, 2, 1}

if set1 == set2:
    print("Множества одинаковые")
else:
    print("Множества не одинаковые")

Множества одинаковые


Чтобы проверить, является ли одно множество **подмножеством** другого множества, можно использовать оператор `<=`.

In [6]:
set1 = {1, 2, 3}
set2 = {1, 2, 3, 4, 5}

if set1 <= set2:
    print("set1 – это подмножество set2")
else:
    print("set1 не является подмножеством set2")

set1 – это подмножество set2


Чтобы проверить, является ли одно множество **супермножеством** другого множества, можно использовать оператор `>=`.

In [8]:
set1 = {1, 2, 3, 4, 5}
set2 = {1, 2, 3}

if set1 >= set2:
    print("set1 – это супермножество set2")
else:
    print("set1 не является супермножеством set2")

set1 – это супермножество set2


Наконец, чтобы проверить, **строго ли одно множество больше другого** (т.е. содержит ли оно все элементы другого множества и еще хотя бы один элемент), можно использовать оператор `>`.

In [12]:
set1 = {1, 2, 3, 4}
set2 = {1, 2, 3}

if set1 >= set2:
    print("set1 строго больше set2")
else:
    print("set1 не строго больше set2")

set1 строго больше set2


In [None]:
set1 = {1, 2, 3}
set2 = {2, 3, 4}
set3 = {1, 2, 3, 4}

print(set1 == set2)  # False
print(set1 < set2)   # False
print(set1 > set2)   # False
print(set1 <= set2)  # False
print(set1 >= set2)  # False

print(set1 == set3)  # False
print(set1 < set3)   # True
print(set1 > set3)   # False
print(set1 <= set3)  # True
print(set1 >= set3)  # False

**Задача 1.**

Аня и Маша  играют в игру. Аня вводит число, а Маша должна ввести число, в котором есть только те цифры, которые есть в числе Ани.
Если Маша ввела верное число, то выводится "Верное число!". В противном случае "Такое число нельзя использовать("

In [4]:
anya = set(input())
masha = set(input())

print(anya)
print(masha)

123
32
{'2', '1', '3'}
{'2', '3'}


In [5]:
anya & masha

{'2', '3'}

In [6]:
if anya & masha == masha:
    print('Верное число!')
else:
    print('Такое число нельзя использовать(')

Верное число!


**Задача 2.**

В онлайн-магазине существует автоматическая проверка на наличие товаров из корзины пользователя на складе. Маша положила в корзину хлеб, молоко, бананы и манго. Товары на складе указаны в переменной `inventory`.

Напишите программу, которая выдаст Маше "Вы можете оплатить покупку", если все товары есть на складе. И "Один или несколько товаров недоступны к покупке.", если не все товары есть.

In [14]:
masha = {'хлеб', 'молоко', 'бананы', 'манго', 'компьютер'}
inventory = {'хлеб', 'булочка', 'бананы', 'молоко', 'кефир', 'йогурт', 'яблоки', 'помидоры', 'манго'}

# ваш код



Один или несколько товаров недоступны к покупке.


**Задача 3.**

Вам поручили проанализировать список гостей на свадьбе. В качестве данных вам предоставили два множества: гости со стороны жениха (groom) и гости со стороны невесты (bride). При этом некоторые гости есть в списках и жениха, и невесты одновременно. 

Нужно вывести: 

* Количество гостей на свадьбе (помните, что некоторые гости есть в списках и жениха, и невесты одновременно)
* Выведите имена общих гостей жениха и невесты отсортированные по алфавиту
* Выведите имена тех гостей, которые не являются общими гостями жениха и невесты отсортированные по алфавиту
* Выведите имена гостей невесты, но только тех, кто не являются при этом гостями жениха отсортированные по алфавиту

In [None]:
groom = {'Татьяна', 'Мария', 'Ирина', 'Юлия', 'Александр', 'Михаил', 'Максим',
         'Лев', 'Артём', 'Марк', 'Иван', 'Дмитрий', 'Матвей', 'Даниил'}
bride = {'Анастасия', 'Елена', 'Даниил', 'Ольга', 'Наталья', 'Екатерина', 
         'Анна', 'Татьяна', 'Мария', 'Ирина', 'Юлия', 'Марк', 'Иван'}

# ваш код