In [None]:
- title: Занятие 3
- author: Timofey Khirianov
- date: 2024-09-17
- slug: 2024_lpr_lab03
- ipynb_url: download/2024_lpr_lab03.ipynb
- test_link: https://cs.mipt.ru:44367/cgi-bin/new-client?contest_id=20403
- test_comment: Контест для выполнения
- test_link_alt: https://olymp3.vdi.mipt.ru/cgi-bin/new-client?contest_id=20403
- test_comment_alt: (альтернативная ссылка)

# Set.

Множество `set` в Python имеет тот же смысл, что понятие множества в математике. `Множество` содержит неупорядоченный набор элементов. Множества поддерживают стандартные математические операции над ними: *объединение, пересечение, разность*. Возможно также добавление и удаление элементов, проверка их принадлежности множеству с помощью оператора `in`. При этом все элементы входят в `set` только один раз, добавление существующего элемента не изменяет множество. Элементами множества могут быть только `неизменяемые` типы, например, его элементами не могут быть списки.

In [1]:
a = {1, 2, 3}
a.add(4)
print(a)

{1, 2, 3, 4}


In [2]:
a.add(1)
print(a)

{1, 2, 3, 4}


In [3]:
print(0 in a, 1 in a)

False True


Для удаления элементов из множества можно использовать `discard` и `remove`, их поведение различается тогда, когда удаляемый элемент отсутствует в множестве: `discard` не делает ничего, а метод `remove` генерирует исключение `KeyError`, которое вы увидите в одной из ячеек ниже.

In [4]:
a.remove(1)
print(a)

{2, 3, 4}


In [5]:
a.remove(0)
print(a)

KeyError: 0

In [6]:
print(a)

{2, 3, 4}


In [7]:
a.discard(2)
print(a)

{3, 4}


In [8]:
a.discard(0)
print(a)

{3, 4}


Для создания пустого множества или для получения множества из *итерируемого* объекта можно использовать конструктор множеств `set`:

In [9]:
a = set()
print(a)
a.add(1)
print(a)

set()
{1}


Конструкция ниже не работает, потому что фигурные скобки используются для создания пустых словарей `dict`, о которых будет сказано ниже.

In [10]:
a = {}
print(a)
a.add(1)
print(a)

{}


AttributeError: 'dict' object has no attribute 'add'

In [11]:
a = [1, 2, 3, 4]
print(set(a))

{1, 2, 3, 4}


In [12]:
a = [1, 2, 3, 4, 1]
print(set(a))

{1, 2, 3, 4}


In [13]:
a = "abcd"
print(set(a))

{'a', 'c', 'b', 'd'}


In [14]:
a = "abcda"
print(set(a))

{'a', 'c', 'b', 'd'}


Операции над множествами можно записывать как коротко символами, так и названиями соответствующих функций:

In [15]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a.union(b))
print(a | b)

{1, 2, 3, 4, 5, 6}
{1, 2, 3, 4, 5, 6}


In [16]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a.intersection(b))
print(a & b)

{3, 4}
{3, 4}


In [17]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a.difference(b))
print(a - b)

{1, 2}
{1, 2}


Симметрическая разность двух множеств - множество, состоящее из элементов, входящих в одно и только одно из данных множеств:

In [18]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a.symmetric_difference(b))
print(a ^ b)

{1, 2, 5, 6}
{1, 2, 5, 6}


In [19]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a <= b)
print(a.issubset(b))

c = {3, 4}
d = {3, 4, 5, 6}
print(c <= d)
print(c.issubset(d))

False
False
True
True


In [20]:
a = {3, 4, 5, 6}
b = {3, 4, 5, 6}
print(a <= b)
print(a < b)

True
False


Существуют также операции наподобие `+=`, `-=`, `*=`, `/=`, `//=`:

In [21]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a &= b
print(a)

{3, 4}


In [22]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a.intersection_update(b)
print(a)

{3, 4}


In [23]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a |= b
print(a)

{1, 2, 3, 4, 5, 6}


In [24]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a.update(b)
print(a)

{1, 2, 3, 4, 5, 6}


In [25]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a -= b
print(a)

{1, 2}


In [26]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a.difference_update(b)
print(a)

{1, 2}


**Упражнение 0**. Вывести на экран все элементы множества A, которых нет в множестве B. Дописать код ниже.

In [29]:
A = set('bqlpzlkwehrlulsdhfliuywemrlkjhsdlfjhlzxcovt')
B = set('zmxcvnboaiyerjhbziuxdytvasenbriutsdvinjhgik')
A.difference_update(B)
print(C)

{'p', 'q', 'f', 'l', 'w'}


**Упражнение 1.** Считать через `input` строку, состоящую из 3 слов и найти буквы, входящие в каждое из слов.

In [34]:
s = input().split()
a = set(s[0])
b = set(s[1])
c = set(s[2])
print(a&b&c)



{'3'}


**Упражнение 2.** Считать через `input` строку, состоящую из произвольного числа слов и найти буквы, входящие в каждое из слов.

In [36]:
s = list(map(set, input().split()))
c = s[0]
for i in s:
    c.intersection_update(i)
print(c)

{'j', 's', 'a', 'f', 'k', 'd'}


**Упражнение 3\*.** Считать через `input` несколько чисел через пробел и найти цифры, входящие в каждое из чисел. Использовать `while`.

In [3]:
a = list(map(set, input().split()))
c = a[0]
i = 1
while i < len(a):
    c.intersection_update(a[i])
    i += 1
print(c)



{'1', '3', '5'}


# Dict.

Кроме множеств также часто используются словари. Элемент словаря `dict` - это пара `ключ: значение`. Ключи позволяют обращаться к данным не по индексу, как это реализовано в списках, а по любому удобному значению. Пример:

In [4]:
d = {"Россия": "Москва", "Франция": "Париж", "Германия": "Берлин"}
print(d["Германия"])

Берлин


Такой способ хранения данных в данном случае является более естественным и удобным. Создание словаря и добавление элементов:

In [5]:
d = dict()
d["Россия"] = "Москва"
print(d)

{'Россия': 'Москва'}


Можно обращаться к ключам словаря, к значениям словаря, итерировать по ключам и по парам ключ-значение.

In [6]:
d = {"Россия": "Москва", "Франция": "Париж", "Германия": "Берлин"}
print(d.keys())
print(d.values())

dict_keys(['Россия', 'Франция', 'Германия'])
dict_values(['Москва', 'Париж', 'Берлин'])


In [7]:
for k in d.keys():
    print(d[k])

Москва
Париж
Берлин


In [8]:
for k, v in d.items():
    print(k, v)

Россия Москва
Франция Париж
Германия Берлин


In [9]:
print(d.items())

dict_items([('Россия', 'Москва'), ('Франция', 'Париж'), ('Германия', 'Берлин')])


In [10]:
print(list(d.items()))

[('Россия', 'Москва'), ('Франция', 'Париж'), ('Германия', 'Берлин')]


Можем сортировать такие объекты, например, по странам в лексикографическом порядке:

In [11]:
d = list(d.items())
d = sorted(d, key = lambda x: x[0])
print(d)

[('Германия', 'Берлин'), ('Россия', 'Москва'), ('Франция', 'Париж')]


# Set comprehensions. Dict comprehensions.

Можно генерировать множества и словари по аналогии со списками:

In [12]:
a = [i for i in range(-5, 5)]
print(a)
a = {i for i in range(-5, 5)}
print(a)
a = [abs(i) for i in range(-5, 5)]
print(a)
a = {abs(i) for i in range(-5, 5)}
print(a)

[-5, -4, -3, -2, -1, 0, 1, 2, 3, 4]
{0, 1, 2, 3, 4, -1, -5, -4, -3, -2}
[5, 4, 3, 2, 1, 0, 1, 2, 3, 4]
{0, 1, 2, 3, 4, 5}


Для определения порядкового номера символа в таблице символов ASCII используется функция `ord`:

In [13]:
s = "a"
print(ord(s))
print(ord('A'), ord('Z'), ord('a'), ord('z'))

97
65 90 97 122


Обратная к ней функция, возвращающая символ по его порядковому номеру - `chr`:

In [14]:
print(chr(65), chr(90), chr(97), chr(122))

A Z a z


Создадим словарь, состоящий из пар элементов `номер буквы в таблице ASCII`: `буква`.

In [15]:
d = {i: chr(i) for i in range(65, 91)}
print(d)
print(d[70])

{65: 'A', 66: 'B', 67: 'C', 68: 'D', 69: 'E', 70: 'F', 71: 'G', 72: 'H', 73: 'I', 74: 'J', 75: 'K', 76: 'L', 77: 'M', 78: 'N', 79: 'O', 80: 'P', 81: 'Q', 82: 'R', 83: 'S', 84: 'T', 85: 'U', 86: 'V', 87: 'W', 88: 'X', 89: 'Y', 90: 'Z'}
F


**Упражнение 4.** Создайте аналогичный словарь для маленьких букв, выведите его, затем добавьте в него большие буквы и выведите итоговый словарь.

In [16]:
d = {i: chr(i) for i in range(97, 123)}
print(d)
for i in range(65, 91):
    d[i] = chr(i)
print(d)

{97: 'a', 98: 'b', 99: 'c', 100: 'd', 101: 'e', 102: 'f', 103: 'g', 104: 'h', 105: 'i', 106: 'j', 107: 'k', 108: 'l', 109: 'm', 110: 'n', 111: 'o', 112: 'p', 113: 'q', 114: 'r', 115: 's', 116: 't', 117: 'u', 118: 'v', 119: 'w', 120: 'x', 121: 'y', 122: 'z'}
{97: 'a', 98: 'b', 99: 'c', 100: 'd', 101: 'e', 102: 'f', 103: 'g', 104: 'h', 105: 'i', 106: 'j', 107: 'k', 108: 'l', 109: 'm', 110: 'n', 111: 'o', 112: 'p', 113: 'q', 114: 'r', 115: 's', 116: 't', 117: 'u', 118: 'v', 119: 'w', 120: 'x', 121: 'y', 122: 'z', 65: 'A', 66: 'B', 67: 'C', 68: 'D', 69: 'E', 70: 'F', 71: 'G', 72: 'H', 73: 'I', 74: 'J', 75: 'K', 76: 'L', 77: 'M', 78: 'N', 79: 'O', 80: 'P', 81: 'Q', 82: 'R', 83: 'S', 84: 'T', 85: 'U', 86: 'V', 87: 'W', 88: 'X', 89: 'Y', 90: 'Z'}


**Упражнение 5.** Создайте словарь, в котором каждой букве (как ключу) будет соответствовать ее порядковый номер в алфавите (значение). Рекомендация: использовать функции `keys`, `values` или `items` для словаря из предыдущего упражнения, чтобы создать новый.

In [17]:
d1 = {j: i-96 for i,j in zip(d.keys(), d.values()) if i > 90}
print(d1)

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6, 'g': 7, 'h': 8, 'i': 9, 'j': 10, 'k': 11, 'l': 12, 'm': 13, 'n': 14, 'o': 15, 'p': 16, 'q': 17, 'r': 18, 's': 19, 't': 20, 'u': 21, 'v': 22, 'w': 23, 'x': 24, 'y': 25, 'z': 26}


**Упражнение 6.** Считайте слово с клавиатуры и найдите для него сумму номеров букв. Если некоторые буквы в слове повторяются (используйте такое слово), нужно считать только по уникальным буквам. Например, для строк 'abc' и 'abcbc' сумма будет 1+2+3=6, для xyz или zyxyz 24+25+26=75

In [19]:
word = input()
w = set([j for j in word])
print(sum([d1[i] for i in w]))

71


**Упражнение 7.** Считайте с клавиатуры количество пар синонимов, затем сами пары синонимов, затем одно из слов среди этих пар. Выведите его синоним. Допишите код, заменив все TODO. Пример ввода:

    3
    Hello Hi
    Bye Goodbye
    List Array
    Goodbye

In [26]:
n = int(input())
d = dict()
for i in range(n):
    s = input()
    s = s.split()
    d[s[0]] = s[1]
    d[s[1]] = s[0]
s = input()
print(d)
print(d[s])

{'hello': 'hi', 'hi': 'hello', 'bye': 'goodbye', 'goodbye': 'bye', 'list': 'array', 'array': 'list'}
bye


# Частотный анализ.

Вместо использования функции `count` для подсчета числа вхождений символа в большой текст лучше использовать `dict`. Для многократного поиска это будет работать быстрее, так как мы заполним словарь за один проход по данному тексту.

In [27]:
s = "abracadabra"
d = dict()
for i in s:
    if i in d:
        d[i] += 1
    else:
        d[i] = 1
print(d)

{'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1}


In [28]:
print(s.count('a'))
print(d['a'])

5
5


In [29]:
s = "abracadabra" * 1000000
print(s[:100])

abracadabraabracadabraabracadabraabracadabraabracadabraabracadabraabracadabraabracadabraabracadabraa


In [30]:
import time
d = dict()
for i in s:
    if i in d:
        d[i] += 1
    else:
        d[i] = 1
t1 = time.time()
print(d['a'])
t2 = time.time()
print(t2 - t1)

5000000
0.0


In [31]:
t3 = time.time()
print(s.count('a'))
t4 = time.time()
print(t4 - t3)

5000000
0.016953706741333008


**Упражнение 8**. Считайте с клавиатуры строку, удалите из нее все цифры и пробелы. Создайте словарь, в котором ключами будут уникальные символы, а значениями их частота вхождения. Частотой вхождения называется отношение числа вхождений данного символа в исходную строку к числу символов в исходной строке.

In [38]:
a = input()
d = [i for i in a if i not in ('1', '2', '3', '4', '5', '6', '7', '8', '9', '0', ' ')]
s = {}
for i in d:
    if i in s:
        s[i] += 1
    else:
        s[i] = 1
for i in s:
    s[i] /= len(a)
print(s)

{'f': 0.3333333333333333}


# Collections.

Существуют также другие стандартные коллекции, которые позволяют решать некоторые задачи еще проще.

In [39]:
import collections
cnt = collections.Counter()
for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:
    cnt[word] += 1
cnt

Counter({'blue': 3, 'red': 2, 'green': 1})

In [40]:
cnt['red']

2

Можно сократить запись, переимпортировав из библиотеки конкретный модуль:

In [41]:
from collections import Counter
c = Counter(a=4, b=2, c=0, d=-2)
print(sorted(c.elements()))

['a', 'a', 'a', 'a', 'b', 'b']


In [42]:
print(collections.Counter('abracadabra').most_common(3))

[('a', 5), ('b', 2), ('r', 2)]


In [43]:
c = Counter(a=4, b=2, c=0, d=-2)
d = Counter(a=1, b=2, c=3, d=4)
c.subtract(d)
print(c)

Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})


In [44]:
c = Counter(a=10, b=5, c=0)
c.total() # new for Python 3.10+

AttributeError: 'Counter' object has no attribute 'total'

С другими коллекциями вы можете познакомиться самостоятельно, их использование выходит за рамки упражнений и контеста.

In [None]:
#ура, победа! ещё один ноутбук позади!