# Set.

Множество `set` в Python имеет тот же смысл, что понятие множества в математике. `Множество` содержит неупорядоченный набор элементов. Множества поддерживают стандартные математические операции над ними: *объединение, пересечение, разность*. Возможно также добавление и удаление элементов, проверка их принадлежности множеству с помощью оператора `in`. При этом все элементы входят в `set` только один раз, добавление существующего элемента не изменяет множество. Элементами множества могут быть только `неизменяемые` типы, например, его элементами не могут быть списки.

### Таблица по взаимодействию элемента и множества
Операция  | Значение 
---|---
`x in A`  | $x \in A$, принадлежит ли элемент x множеству A 
`x not in A`  | $x \notin A$ — то же, что `not (x in A)`
`A.add(x)`  | добавить элемент x в множество A 
`A.discard(x)`  | удалить элемент x из множества A 
`A.remove(x)`  | удалить элемент x из множества A 
`A.pop()`  | удаляет из множества один случайный элемент и возвращает его 

In [1]:
a = {1, 2, 3}
a.add(4)
print(a)

{1, 2, 3, 4}


In [2]:
a.add(1)
print(a)

{1, 2, 3, 4}


In [3]:
print(0 in a, 1 in a)

False True


Для удаления элементов из множества можно использовать `discard` и `remove`, их поведение различается тогда, когда удаляемый элемент отсутствует в множестве: `discard` не делает ничего, а метод `remove` генерирует исключение `KeyError`, которое вы увидите в одной из ячеек ниже.

In [4]:
a.remove(1)
print(a)

{2, 3, 4}


In [5]:
a.remove(0)
print(a)

KeyError: 0

In [6]:
print(a)

{2, 3, 4}


In [7]:
a.discard(2)
print(a)

{3, 4}


In [8]:
a.discard(0)
print(a)

{3, 4}


Для создания пустого множества или для получения множества из *итерируемого* объекта можно использовать конструктор множеств `set`:

In [9]:
a = set()
print(a)
a.add(1)
print(a)

set()
{1}


Конструкция ниже не работает, потому что фигурные скобки используются для создания пустых словарей `dict`, о которых будет сказано ниже.

In [10]:
a = {}
print(a)
a.add(1)
print(a)

{}


AttributeError: 'dict' object has no attribute 'add'

In [11]:
a = [1, 2, 3, 4]
print(set(a))

{1, 2, 3, 4}


In [12]:
a = [1, 2, 3, 4, 1]
print(set(a))

{1, 2, 3, 4}


In [13]:
a = "abcd"
print(set(a))

{'d', 'b', 'a', 'c'}


In [14]:
a = "abcda"
print(set(a))

{'d', 'b', 'a', 'c'}


Операции над множествами можно записывать как коротко символами, так и названиями соответствующих функций:

In [15]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a.union(b))
print(a | b)

{1, 2, 3, 4, 5, 6}
{1, 2, 3, 4, 5, 6}


In [16]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a.intersection(b))
print(a & b)

{3, 4}
{3, 4}


In [17]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a.difference(b))
print(a - b)

{1, 2}
{1, 2}


Симметрическая разность двух множеств - множество, состоящее из элементов, входящих в одно и только одно из данных множеств:

In [18]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a.symmetric_difference(b))
print(a ^ b)

{1, 2, 5, 6}
{1, 2, 5, 6}


In [19]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a <= b)
print(a.issubset(b))

c = {3, 4}
d = {3, 4, 5, 6}
print(c <= d)
print(c.issubset(d))

False
False
True
True


In [20]:
a = {3, 4, 5, 6}
b = {3, 4, 5, 6}
print(a <= b)
print(a < b)

True
False


Существуют также операции наподобие `+=`, `-=`, `*=`, `/=`, `//=`:

In [21]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a &= b
print(a)

{3, 4}


In [22]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a.intersection_update(b)
print(a)

{3, 4}


In [23]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a |= b
print(a)

{1, 2, 3, 4, 5, 6}


In [24]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a.update(b)
print(a)

{1, 2, 3, 4, 5, 6}


In [25]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a -= b
print(a)

{1, 2}


In [26]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a.difference_update(b)
print(a)

{1, 2}


### Сводная таблица операций с множествами:
Операция  | Альтернатива | Значение 
---|---|---
`A \| B` | `A.union(B)`  | Возвращает множество, являющееся объединением множеств A и B. 
`A \|= B` | `A.update(B)` | Записывает в A объединение множеств A и B. 
`A & B` | `A.intersection(B)`  | Возвращает множество, являющееся пересечением множеств A и B. 
`A &= B` | `A.intersection_update(B)`  | Записывает в A пересечение множеств A и B. 
`A - B` | `A.difference(B)`  | Возвращает разность множеств A и B (элементы, входящие в A, но не входящие в B). 
`A -= B` | `A.difference_update(B)`  | Записывает в A разность множеств A и B. 
`A ^ B` | `A.symmetric_difference(B)`  | Возвращает симметрическую разность множеств A и B (элементы, входящие в A или в B, но не в оба из них одновременно). 
`A ^= B` | `A.symmetric_difference_update(B)`  | Записывает в A симметрическую разность множеств A и B. 
`A <= B` | `A.issubset(B)`  | Возвращает True, если A является подмножеством B. 
`A >= B` | `A.issuperset(B)`  | Возвращает True, если B является подмножеством A. 
`A < B`  | | Эквивалентно A <= B and A != B 
`A > B`  | | Эквивалентно A >= B and A != B 




**Упражнение 0**. Вывести на экран все элементы множества A, которых нет в множестве B. Дописать код ниже.

In [29]:
A = set('bqlpzlkwehrlulsdhfliuywemrlkjhsdlfjhlzxcovt')
B = set('zmxcvnboaiyerjhbziuxdytvasenbriutsdvinjhgik')
print(A-B)

{'l', 'p', 'q', 'w', 'f'}


**Упражнение 1.** Считать через `input` строку, состоящую из 3 слов и найти буквы, входящие в каждое из слов.

In [35]:
A,B,C = [set(x) for x in input().split()]
print(A&B&C)

qwe wwewr rqetrtrg
{'e'}


**Упражнение 2.** Считать через `input` строку, состоящую из произвольного числа слов и найти буквы, входящие в каждое из слов.

In [37]:
A = [set(x) for x in input().split()]
for i in range(len(A)):
    A[i]&=A[i-1]
print(A[-1])

qwerty qwfnldkfdn'an weknkfj'
{'w'}


**Упражнение 3\*.** Считать через `input` несколько чисел через пробел и найти цифры, входящие в каждое из чисел. Использовать `while`.

In [46]:
B = set("0123456789")
for x in input().split():
    B &= set(x)
print(*B)
##==========================================##
B=set()
for i in range(10):
    B.add(i)
for x in input().split():
    C=set()
    x=int(x)
    while x:
        C.add(x%10)
        x//=10
    B&=C
print(*B)  


1298083 342419082 313413
1 3
1298083 342419082 313413
1 3


# Dict.

Кроме множеств также часто используются словари. Элемент словаря `dict` - это пара `ключ: значение`.
Ключи позволяют обращаться к данным не по индексу, как это реализовано в списках, а по любому удобному значению.

### Сводная таблица по операциям со словарями:
Операция  | Значение 
---|---
`value = A[key]` | Получение элемента по ключу. Если элемента с заданным ключом в словаре нет, то возникает исключение KeyError. 
`value = A.get(key)` | Получение элемента по ключу. Если элемента в словаре нет, то get возвращает None. 
`value = A.get(key, default_value)` | То же, но вместо None метод get возвращает default_value. 
`key in A` | Проверить принадлежность ключа словарю. 
`key not in A` | То же, что not key in A. 
`A[key] = value` | Добавление нового элемента в словарь. 
`del A[key]` | Удаление пары ключ-значение с ключом key. Возбуждает исключение KeyError, если такого ключа нет. 
`if key in A: del A[key]` | Удаление пары ключ-значение с предварительной проверкой наличия ключа. 
`value = A.pop(key)` | Удаление пары ключ-значение с ключом key и возврат значения удаляемого элемента.Если такого ключа нет, то возбуждается KeyError. 
`value = A.pop(key, default_value)` | То же, но вместо генерации исключения возвращается default_value. 
`A.pop(key, None)` | Это позволяет проще всего организовать безопасное удаление элемента из словаря. 
`len(A)` | Возвращает количество пар ключ-значение, хранящихся в словаре. 


In [47]:
d = {"Россия": "Москва", "Франция": "Париж", "Германия": "Берлин"}
print(d["Германия"])

Берлин


Такой способ хранения данных в данном случае является более естественным и удобным. Создание словаря и добавление элементов:

In [48]:
d = dict()
d["Россия"] = "Москва"
print(d)

{'Россия': 'Москва'}


Можно обращаться к ключам словаря, к значениям словаря, итерировать по ключам и по парам ключ-значение.

In [66]:
d = {"Россия": "Москва", "Франция": "Париж", "Германия": "Берлин"}
print(d.keys())
print(d.values())

dict_keys(['Россия', 'Франция', 'Германия'])
dict_values(['Москва', 'Париж', 'Берлин'])


In [60]:
for k in d.keys():
    print(d[k])

Москва
Париж
Берлин


In [61]:
for k, v in d.items():
    print(k, v)

Россия Москва
Франция Париж
Германия Берлин


In [62]:
print(d.items())

dict_items([('Россия', 'Москва'), ('Франция', 'Париж'), ('Германия', 'Берлин')])


In [63]:
print(list(d.items()))

[('Россия', 'Москва'), ('Франция', 'Париж'), ('Германия', 'Берлин')]


Можем сортировать такие объекты, например, по странам в лексикографическом порядке:

In [64]:
d = list(d.items())
d = sorted(d, key = lambda x: x[0])
print(d)

[('Германия', 'Берлин'), ('Россия', 'Москва'), ('Франция', 'Париж')]


# Set comprehensions. Dict comprehensions.

Можно генерировать множества и словари по аналогии со списками:

In [56]:
a = [i for i in range(-5, 5)]
print(a)
a = {i for i in range(-5, 5)}
print(a)
a = [abs(i) for i in range(-5, 5)]
print(a)
a = {abs(i) for i in range(-5, 5)}
print(a)

[-5, -4, -3, -2, -1, 0, 1, 2, 3, 4] <class 'list'>
{0, 1, 2, 3, 4, -1, -5, -4, -3, -2} <class 'set'>
[5, 4, 3, 2, 1, 0, 1, 2, 3, 4] <class 'list'>
{0, 1, 2, 3, 4, 5} <class 'set'>


Для определения порядкового номера символа в таблице символов ASCII используется функция `ord`:

In [67]:
s = "a"
print(ord(s))
print(ord('A'), ord('Z'), ord('a'), ord('z'))

97
65 90 97 122


Обратная к ней функция, возвращающая символ по его порядковому номеру - `chr`:

In [69]:
print(chr(65), chr(90), chr(97), chr(122))

A Z a z
 	
 !"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~ ¡¢£¤¥¦§¨©ª«¬­®¯°±²³´µ¶·¸¹º»¼½¾¿ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿ

Создадим словарь, состоящий из пар элементов `номер буквы в таблице ASCII`: `буква`.

In [70]:
d = {i: chr(i) for i in range(65, 91)}
print(d)
print(d[70])

{65: 'A', 66: 'B', 67: 'C', 68: 'D', 69: 'E', 70: 'F', 71: 'G', 72: 'H', 73: 'I', 74: 'J', 75: 'K', 76: 'L', 77: 'M', 78: 'N', 79: 'O', 80: 'P', 81: 'Q', 82: 'R', 83: 'S', 84: 'T', 85: 'U', 86: 'V', 87: 'W', 88: 'X', 89: 'Y', 90: 'Z'}
F


**Упражнение 4.** Создайте аналогичный словарь для маленьких букв, выведите его, затем добавьте в него большие буквы и выведите итоговый словарь.

In [76]:
e = {i: chr(i) for i in range(97, 122)}
print(e)
e.update(d)
print(e)

{97: 'a', 98: 'b', 99: 'c', 100: 'd', 101: 'e', 102: 'f', 103: 'g', 104: 'h', 105: 'i', 106: 'j', 107: 'k', 108: 'l', 109: 'm', 110: 'n', 111: 'o', 112: 'p', 113: 'q', 114: 'r', 115: 's', 116: 't', 117: 'u', 118: 'v', 119: 'w', 120: 'x', 121: 'y'}
{97: 'a', 98: 'b', 99: 'c', 100: 'd', 101: 'e', 102: 'f', 103: 'g', 104: 'h', 105: 'i', 106: 'j', 107: 'k', 108: 'l', 109: 'm', 110: 'n', 111: 'o', 112: 'p', 113: 'q', 114: 'r', 115: 's', 116: 't', 117: 'u', 118: 'v', 119: 'w', 120: 'x', 121: 'y', 65: 'A', 66: 'B', 67: 'C', 68: 'D', 69: 'E', 70: 'F', 71: 'G', 72: 'H', 73: 'I', 74: 'J', 75: 'K', 76: 'L', 77: 'M', 78: 'N', 79: 'O', 80: 'P', 81: 'Q', 82: 'R', 83: 'S', 84: 'T', 85: 'U', 86: 'V', 87: 'W', 88: 'X', 89: 'Y', 90: 'Z'}


**Упражнение 5.** Создайте словарь, в котором каждой букве (как ключу) будет соответствовать ее порядковый номер в алфавите (значение). Рекомендация: использовать функции `keys`, `values` или `items` для словаря из предыдущего упражнения, чтобы создать новый.

In [85]:
g = {p[1]:p[0] for p in e.items()}
print(g)
#print(g.get('q'))

{'a': 97, 'b': 98, 'c': 99, 'd': 100, 'e': 101, 'f': 102, 'g': 103, 'h': 104, 'i': 105, 'j': 106, 'k': 107, 'l': 108, 'm': 109, 'n': 110, 'o': 111, 'p': 112, 'q': 113, 'r': 114, 's': 115, 't': 116, 'u': 117, 'v': 118, 'w': 119, 'x': 120, 'y': 121, 'A': 65, 'B': 66, 'C': 67, 'D': 68, 'E': 69, 'F': 70, 'G': 71, 'H': 72, 'I': 73, 'J': 74, 'K': 75, 'L': 76, 'M': 77, 'N': 78, 'O': 79, 'P': 80, 'Q': 81, 'R': 82, 'S': 83, 'T': 84, 'U': 85, 'V': 86, 'W': 87, 'X': 88, 'Y': 89, 'Z': 90}


**Упражнение 6.** Считайте слово с клавиатуры и найдите для него сумму номеров букв. Если некоторые буквы в слове повторяются (используйте такое слово), нужно считать только по уникальным буквам. Например, для строк 'abc' и 'abcbc' сумма будет 1+2+3=6, для xyz или zyxyz 24+25+26=75

In [97]:
q=list(set(input()))
q=list(map(lambda x: ord(x)-96 ,q))
print(sum(q))

zyxyz
75


# **Упражнение 7.** Считайте с клавиатуры количество пар синонимов, затем сами пары синонимов, затем одно из слов среди этих пар. Выведите его синоним. Допишите код, заменив все TODO. Пример ввода:

    3
    Hello Hi
    Bye Goodbye
    List Array
    Goodbye

In [103]:
n = int(input())
d = dict()
for i in range(n):
    s = input().split()
    # TODO completing a dictionary
    d.update({s[0]:s[1]})
s = input()
# TODO search for the desired synonym
if s in d:
    print(d.get(s))
else:
    for k,v in d.items():
        if(v==s):
            print(k)

"""
#=====
n = int(input())
d = dict()
for i in range(n):
    s = input().split()
    # TODO completing a dictionary
    d.update({s[0]:s[1],s[1]:s[0]})
s = input()
# TODO search for the desired synonym
print(d.get(s))
#=====
n = int(input())
d = dict()
for i in range(n):
    s = input()
    # TODO completing a dictionary
s = input()
# TODO search for the desired synonym
"""

3
Hello Hi
Bye Goodbye
List Array
Goodbye
Bye


'\n#=====\nn = int(input())\nd = dict()\nfor i in range(n):\n    s = input().split()\n    # TODO completing a dictionary\n    d.update({s[0]:s[1],s[1]:s[0]})\ns = input()\n# TODO search for the desired synonym\nprint(d.get(s))\n#=====\nn = int(input())\nd = dict()\nfor i in range(n):\n    s = input()\n    # TODO completing a dictionary\ns = input()\n# TODO search for the desired synonym\n'

# Частотный анализ.

Вместо использования метода `count` для подсчета числа вхождений символа в большой текст лучше использовать `dict`. Для многократного поиска это будет работать быстрее, так как мы заполним словарь за один проход по данному тексту.

In [104]:
s = "abracadabra"
d = dict()
for i in s:
    if i in d:
        d[i] += 1
    else:
        d[i] = 1
print(d)

{'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1}


In [105]:
print(s.count('a'))
print(d['a'])

5
5


In [106]:
s = "abracadabra" * 1000000
print(s[:100])

abracadabraabracadabraabracadabraabracadabraabracadabraabracadabraabracadabraabracadabraabracadabraa


In [109]:
import time
d = dict()
for i in s:
    if i in d:
        d[i] += 1
    else:
        d[i] = 1
t1 = time.time()
print(d['a'])
t2 = time.time()
print(t2 - t1)

5000000
2.047475576400757


In [110]:
t3 = time.time()
print(s.count('a'))
t4 = time.time()
print(t4 - t3)

5000000
0.051982879638671875


**Упражнение 8**. Считайте с клавиатуры строку, удалите из нее все цифры и пробелы. Создайте словарь, в котором ключами будут уникальные символы, а значениями их частота вхождения. Частотой вхождения называется отношение числа вхождений данного символа в исходную строку к числу символов в исходной строке.

In [126]:
s = input()
d = dict()
for i in s:
    if i in d:
        d[i] += 1
    else:
        d[i] = 1
d.pop(' ', None)
for i in range (10):
    d.pop(chr(ord('0')+i), None)
q=sum(d.values())
for i in d.keys():
    if i in d:
        d[i] /= q
print(d)

12 qwqe2 
{'q': 0.5, 'w': 0.25, 'e': 0.25}


# Collections.

Существуют также другие стандартные коллекции, которые позволяют решать некоторые задачи еще проще.

In [127]:
import collections
cnt = collections.Counter()
for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:
    cnt[word] += 1
cnt

Counter({'red': 2, 'blue': 3, 'green': 1})

In [128]:
cnt['red']

2

Можно сократить запись, переимпортировав из библиотеки конкретный модуль:

In [132]:
from collections import Counter
c = Counter(a=4, b=2, c=0, d=-2)
print(sorted(c.elements()))

['a', 'a', 'a', 'a', 'b', 'b']


In [133]:
print(collections.Counter('abracadabra').most_common(3))

[('a', 5), ('b', 2), ('r', 2)]


In [134]:
c = Counter(a=4, b=2, c=0, d=-2)
d = Counter(a=1, b=2, c=3, d=4)
c.subtract(d)
print(c)

Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})


In [135]:
c = Counter(a=10, b=5, c=0)
c.total() # new for Python 3.10+

AttributeError: 'Counter' object has no attribute 'total'

С другими коллекциями вы можете познакомиться самостоятельно, их использование выходит за рамки упражнений и контеста.

In [136]:
print(*set("ddfr"))

r f d
