# Практическое занятие 3

# Dict

**Словари** в Python - неупорядоченные коллекции произвольных объектов с доступом по ключу. Их иногда ещё называют ассоциативными массивами или хеш-таблицами. 
Элемент словаря `dict` - это пара `ключ: значение`. Ключи позволяют обращаться к данным не по индексу, как это реализовано в списках, а по любому удобному значению. Пример:

In [1]:
d = {"Россия": "Москва", "Франция": "Париж", "Германия": "Берлин"}
print(d["Германия"])

Берлин


Такой способ хранения данных в данном случае является более естественным и удобным. Создание словаря и добавление элементов:

In [3]:
d = dict()
print(d)
d["Россия"] = "Москва"
print(d)

{}
{'Россия': 'Москва'}


## Основные методы словарей:

**dict.clear()** - очищает словарь.

**dict.copy()** - возвращает копию словаря.

**classmethod dict.fromkeys(seq[, value])** - создает словарь с ключами из seq и значением value (по умолчанию None).

**dict.get(key[, default])** - возвращает значение ключа, но если его нет, не бросает исключение, а возвращает default (по умолчанию None).

**dict.items()** - возвращает пары (ключ, значение).

**dict.keys()** - возвращает ключи в словаре.

**dict.pop(key[, default])** - удаляет ключ и возвращает значение. Если ключа нет, возвращает default (по умолчанию бросает исключение).

**dict.popitem()** - удаляет и возвращает пару (ключ, значение). Если словарь пуст, бросает исключение KeyError. Помните, что словари неупорядочены.

**dict.setdefault(key[, default])** - возвращает значение ключа, но если его нет, не бросает исключение, а создает ключ со значением default (по умолчанию None).

**dict.update([other])** - обновляет словарь, добавляя пары (ключ, значение) из other. Существующие ключи перезаписываются. Возвращает None (не новый словарь!).

**dict.values()** - возвращает значения в словаре.

Можно обращаться к ключам словаря, к значениям словаря, итерировать по ключам и по парам ключ-значение.

In [21]:
d = {"Россия": "Москва", "Франция": "Париж", "Германия": "Берлин"}
print(d.keys())
print(d.values())

dict_keys(['Россия', 'Франция', 'Германия'])
dict_values(['Москва', 'Париж', 'Берлин'])


In [6]:
for k in d.keys():
    print(d[k])

Москва
Париж
Берлин


In [8]:
for k, v in d.items():
    print(k, v)

Россия Москва
Франция Париж
Германия Берлин


In [9]:
print(d.items())

dict_items([('Россия', 'Москва'), ('Франция', 'Париж'), ('Германия', 'Берлин')])


In [12]:
print(list(d.items()))
print(list(d.items())[0][1])

[('Россия', 'Москва'), ('Франция', 'Париж'), ('Германия', 'Берлин')]
Москва


Можем сортировать такие объекты, например, по странам в лексикографическом порядке:

In [16]:
d = list(d.items())
d = sorted(d, key = lambda x: x[0])
print(d)

[('Германия', 'Берлин'), ('Россия', 'Москва'), ('Франция', 'Париж')]


In [22]:
d = list(d.items())
d = sorted(d, key = lambda x: -(len(x[0])+len(x[1])))
print(d)

[('Германия', 'Берлин'), ('Россия', 'Москва'), ('Франция', 'Париж')]


# Set comprehensions. Dict comprehensions.

Можно генерировать множества и словари по аналогии со списками:

In [23]:
a = [i for i in range(-5, 5)]
print(a)
a = {i for i in range(-5, 5)}
print(a)
a = [abs(i) for i in range(-5, 5)]
print(a)
a = {abs(i) for i in range(-5, 5)}
print(a)

[-5, -4, -3, -2, -1, 0, 1, 2, 3, 4]
{0, 1, 2, 3, 4, -1, -5, -4, -3, -2}
[5, 4, 3, 2, 1, 0, 1, 2, 3, 4]
{0, 1, 2, 3, 4, 5}


Для определения порядкового номера символа в таблице символов ASCII используется функция `ord`:

In [24]:
s = "a"
print(ord(s))
print(ord('A'), ord('Z'), ord('a'), ord('z'))

97
65 90 97 122


Обратная к ней функция, возвращающая символ по его порядковому номеру - `chr`:

In [26]:
print(chr(65), chr(90), chr(97), chr(122))

A Z a z


Создадим словарь, состоящий из пар элементов `номер буквы в таблице ASCII`: `буква`.

In [27]:
d = {i: chr(i) for i in range(65, 91)}
print(d)
print(d[70])

{65: 'A', 66: 'B', 67: 'C', 68: 'D', 69: 'E', 70: 'F', 71: 'G', 72: 'H', 73: 'I', 74: 'J', 75: 'K', 76: 'L', 77: 'M', 78: 'N', 79: 'O', 80: 'P', 81: 'Q', 82: 'R', 83: 'S', 84: 'T', 85: 'U', 86: 'V', 87: 'W', 88: 'X', 89: 'Y', 90: 'Z'}
F


# Частотный анализ.

Вместо использования функции `count` для подсчета числа вхождений символа в большой текст лучше использовать `dict`. Для многократного поиска это будет работать быстрее, так как мы заполним словарь за один проход по данному тексту.

In [29]:
s = "abracadabra"
d = dict()
for i in s:
    if i in d:
        d[i] += 1
    else:
        d[i] = 1
print(d)

{'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1}


In [31]:
print(s.count('a'))
print(d['a'])

5
5


In [38]:
s = "abracadabra" * 1000000
print(s[:100])

abracadabraabracadabraabracadabraabracadabraabracadabraabracadabraabracadabraabracadabraabracadabraa


In [39]:
import time

d = dict()
for i in s:
    if i in d:
        d[i] += 1
    else:
        d[i] = 1
        
t1 = time.time()
print(t1)
print(d['a'])
t2 = time.time()
print(t2 - t1)

1726733601.8974
5000000
0.0009984970092773438


In [40]:
t3 = time.time()
print(s.count('a'))
t4 = time.time()
print(t4 - t3)

5000000
0.00800013542175293


# Collections

Если нужно что-то посчитать, определить количество вхождений или наиболее (наименее) часто встречающихся элементов, используйте объекты класса **Counter**. Для создания таких объектов используется конструктор collections.Counter().

Counter() принимает итерируемый аргумент и возвращает словарь, в котором ключами служат индивидуальные элементы, а значениями – количества повторений элемента в переданной последовательности. 

In [42]:
import collections
cnt = collections.Counter()
for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:
    cnt[word] += 1
cnt

Counter({'red': 2, 'blue': 3, 'green': 1})

In [43]:
cnt['red']

2

Можно сократить запись, переимпортировав из библиотеки конкретный модуль:

In [45]:
from collections import Counter
c = Counter(a=4, b=2, c=0, d=-2)
print(sorted(c.elements()))
print(c)

['a', 'a', 'a', 'a', 'b', 'b']
Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})


In [51]:
print(collections.Counter('abracadabra').most_common(3))

[('a', 5), ('b', 2), ('r', 2)]


In [53]:
c = Counter(a=4, b=2, c=0, d=-2)
d = Counter(a=1, b=2, c=3, d=4)
c.subtract(d)
print(c)

Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})


In [54]:
c = Counter(a=10, b=5, c=0)
c.total() # new for Python 3.10+

AttributeError: 'Counter' object has no attribute 'total'

### OrderedDict

OrderedDict содержит словарь, хранящий порядок добавления ключей. В версии выше Python 3.6 словари запоминают порядок, а для предыдущих версий Python нужно использовать OrderedDict.


In [60]:
import collections

print('Regular dictionary:')
d = {}
d['a'] = 'A'
d['b'] = 'B'
d['c'] = 'C'

for k, v in d.items():
    print(k, v)

print('\nOrderedDict:')
d = collections.OrderedDict()
d['a'] = 'A'
d['b'] = 'B'
d['c'] = 'C'

for k, v in d.items():
    print(k, v)

Regular dictionary:
a A
b B
c C

OrderedDict:
a A
b B
c C


In [61]:
print('\nOrderedDict:')
d = collections.OrderedDict()
d['c'] = 'C'
d['b'] = 'B'
d['a'] = 'A'

for k, v in d.items():
    print(k, v)


OrderedDict:
c C
b B
a A


Изменить порядок ключей в OrderedDict() можно с помощью move_to_end(). Параметр last указывает следует ли переместить элемент в качестве последнего элемента в последовательности ключей (при значении True) или первого (при значении False).

In [64]:
d = collections.OrderedDict(
    [('a', 'A'), ('b', 'B'), ('c', 'C')]
)

print('До изменения:')
for k, v in d.items():
    print(k, v)

d.move_to_end('b')

print('После применения move_to_end():')
for k, v in d.items():
    print(k, v)

d.move_to_end('b', last=False)

print('После применения move_to_end(last=False):')
for k, v in d.items():
    print(k, v)

До изменения:
a A
b B
c C
После применения move_to_end():
a A
c C
b B
После применения move_to_end(last=False):
b B
a A
c C


С другими коллекциями вы можете познакомиться в статье: https://proglib.io/p/ne-izobretat-velosiped-ili-obzor-modulya-collections-v-python-2019-12-15

# Задания

1. Создайте словарь, в котором будут прописные буквы в качестве ключей, а в качестве значений - номер в таблице ASCII кодов. Выведите полученный словарь, затем добавьте в него большие (заглавные) буквы и выведите итоговый словарь.

In [1]:
d = {chr(i): i for i in range(ord('a'), ord('z') + 1)}
print(d)
for i in range(ord('A'), ord('Z') + 1):
    d[chr(i)] = i
print(d)

{'a': 97, 'b': 98, 'c': 99, 'd': 100, 'e': 101, 'f': 102, 'g': 103, 'h': 104, 'i': 105, 'j': 106, 'k': 107, 'l': 108, 'm': 109, 'n': 110, 'o': 111, 'p': 112, 'q': 113, 'r': 114, 's': 115, 't': 116, 'u': 117, 'v': 118, 'w': 119, 'x': 120, 'y': 121, 'z': 122}
{'a': 97, 'b': 98, 'c': 99, 'd': 100, 'e': 101, 'f': 102, 'g': 103, 'h': 104, 'i': 105, 'j': 106, 'k': 107, 'l': 108, 'm': 109, 'n': 110, 'o': 111, 'p': 112, 'q': 113, 'r': 114, 's': 115, 't': 116, 'u': 117, 'v': 118, 'w': 119, 'x': 120, 'y': 121, 'z': 122, 'A': 65, 'B': 66, 'C': 67, 'D': 68, 'E': 69, 'F': 70, 'G': 71, 'H': 72, 'I': 73, 'J': 74, 'K': 75, 'L': 76, 'M': 77, 'N': 78, 'O': 79, 'P': 80, 'Q': 81, 'R': 82, 'S': 83, 'T': 84, 'U': 85, 'V': 86, 'W': 87, 'X': 88, 'Y': 89, 'Z': 90}


2. Создайте словарь, в котором каждой букве (как ключу) будет соответствовать ее порядковый номер в алфавите (значение). Рекомендация: использовать функции `keys`, `values` или `items` для словаря из предыдущего упражнения, чтобы создать новый.

In [3]:
d = {i[1]: i[0] for i in enumerate([chr(j) for j in range(ord('a'), ord('z') + 1)], 1)}
print(d)

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6, 'g': 7, 'h': 8, 'i': 9, 'j': 10, 'k': 11, 'l': 12, 'm': 13, 'n': 14, 'o': 15, 'p': 16, 'q': 17, 'r': 18, 's': 19, 't': 20, 'u': 21, 'v': 22, 'w': 23, 'x': 24, 'y': 25, 'z': 26}


3. Считайте слово с клавиатуры и найдите для него сумму номеров букв. Если некоторые буквы в слове повторяются (используйте такое слово), нужно считать только по уникальным буквам. Например, для строк 'abc' и 'abcbc' сумма будет 1+2+3=6, для xyz или zyxyz 24+25+26=75

In [6]:
d = {i[1]: i[0] for i in enumerate([chr(j) for j in range(ord('a'), ord('z') + 1)], 1)}
print(sum(map(lambda x: d[x], set(input()))))

75


4. Считайте с клавиатуры количество пар синонимов, затем сами пары синонимов, затем одно из слов среди этих пар. Выведите его синоним. Допишите код, заменив все TODO. Пример ввода:

    `3
    Hello Hi
    Bye Goodbye
    List Array
    Goodbye`

In [9]:
n = int(input())
d = dict()
for i in range(n):
    s = input()
    l, r = s.split()
    d[l] = r 
    d[r] = l
s = input()
print(d[s])

Bye


5. Считайте с клавиатуры строку, удалите из нее все цифры и пробелы. Создайте словарь, в котором ключами будут уникальные символы, а значениями их частота вхождения. Частотой вхождения называется отношение числа вхождений данного символа в исходную строку к числу символов в исходной строке.

In [13]:
from collections import Counter

d = Counter(filter(lambda x: x not in {' '} | set(map(str, range(10))), input()))
print(d)

Counter({'h': 6, 'd': 3, 'a': 2, 'b': 2, 'c': 2})


6. Создайте словарь, в котором ключами будут целые числа от 1 до 1000, а значениями квадраты этих чисел. Вычислите сумму значений ключей для чётных ключей.

In [14]:
d = {i: i ** 2 for i in range(1, 1001)}
print(d)

{1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81, 10: 100, 11: 121, 12: 144, 13: 169, 14: 196, 15: 225, 16: 256, 17: 289, 18: 324, 19: 361, 20: 400, 21: 441, 22: 484, 23: 529, 24: 576, 25: 625, 26: 676, 27: 729, 28: 784, 29: 841, 30: 900, 31: 961, 32: 1024, 33: 1089, 34: 1156, 35: 1225, 36: 1296, 37: 1369, 38: 1444, 39: 1521, 40: 1600, 41: 1681, 42: 1764, 43: 1849, 44: 1936, 45: 2025, 46: 2116, 47: 2209, 48: 2304, 49: 2401, 50: 2500, 51: 2601, 52: 2704, 53: 2809, 54: 2916, 55: 3025, 56: 3136, 57: 3249, 58: 3364, 59: 3481, 60: 3600, 61: 3721, 62: 3844, 63: 3969, 64: 4096, 65: 4225, 66: 4356, 67: 4489, 68: 4624, 69: 4761, 70: 4900, 71: 5041, 72: 5184, 73: 5329, 74: 5476, 75: 5625, 76: 5776, 77: 5929, 78: 6084, 79: 6241, 80: 6400, 81: 6561, 82: 6724, 83: 6889, 84: 7056, 85: 7225, 86: 7396, 87: 7569, 88: 7744, 89: 7921, 90: 8100, 91: 8281, 92: 8464, 93: 8649, 94: 8836, 95: 9025, 96: 9216, 97: 9409, 98: 9604, 99: 9801, 100: 10000, 101: 10201, 102: 10404, 103: 10609, 104: 10816, 1

7. Необходимо создать словарь, в котором хранится информацию о студентах. Например, студента зовут "Вася", ему 19 лет, он учится на направлении "Прикладные математики и информатика" и в работе использует языки программирования Python и JavaScript. Сохраните всю эту информацию в словаре. Затем выведите эту информацию из словаря на экран. В решении необходимо использовать словари, должны быть все указанные поля.

In [15]:
d = {'name' : 'Вася', 'age': 19, 'direction': 'Прикладные математики и информатика', 'langs': ['Python', 'JavaScript']}
print(f"Cтудента зовут {d['name']}, ему {d['age']} лет, он учится на направлении {d['direction']} и в работе использует языки программирования {', '.join(d['langs'][:-1])} и {d['langs'][-1]}")

студента зовут Вася, ему 19 лет, он учится на направлении Прикладные математики и информатика и в работе использует языки программирования Python и JavaScript


8. В настольной игре Скрабл (Scrabble) каждая буква имеет определенную ценность. В случае с английским алфавитом очки распределяются так:

`A, E, I, O, U, L, N, S, T, R – 1 очко;
D, G – 2 очка;
B, C, M, P – 3 очка;
F, H, V, W, Y – 4 очка;
K – 5 очков;
J, X – 8 очков;
Q, Z – 10 очков.`

А русские буквы оцениваются так:

`А, В, Е, И, Н, О, Р, С, Т – 1 очко;
Д, К, Л, М, П, У – 2 очка;
Б, Г, Ё, Ь, Я – 3 очка;
Й, Ы – 4 очка;
Ж, З, Х, Ц, Ч – 5 очков;
Ш, Э, Ю – 8 очков;
Ф, Щ, Ъ – 10 очков.`

Напишите программу, которая вычисляет стоимость введенного пользователем слова. Будем считать, что на вход подается только одно слово, которое содержит либо только английские, либо только русские буквы.

Пример ввода:

ноутбук

Пример вывода:

12


In [17]:
data = {'AEIOULNSTR': 1, 'DG': 2, 'BCMP': 3, 'FHVWY': 4, 'K': 5, 'JX': 8, 'QZ': 10, 'АВЕИНОРСТ': 1, 'ДКЛМПУ': 2, 'БГЁЬЯ': 3, 'ЙЫ': 4, 'ЖЗХЦЧ': 5, 'ШЭЮ': 8, 'ФЩЪ': 10}
d = dict()
for pair in data.items():
    for smb in pair[0]:
        d[smb] = pair[1]
print(sum(map(lambda x: d[x], input().upper())))

12


9. В Python предусмотрено объединение словарей:

merged_dict = {**dict1, **dict2}

Однако если в словарях есть одинаковые ключи, ключу в объединенном словаре будет присвоено значение из второго словаря. Напишите программу, которая объединяет два словаря и суммирует значения одинаковых ключей.

In [None]:
def union(dict1: dict, dict2: dict) -> dict:
    result = dict1.copy()
    for elem in dict2:
        if elem in result:
            result[elem] += dict2[elem]
        else:
            result[elem] = dict2[elem]
    return result

10. Напишите программу, которая принимает на вход строку, и выводит слово, которое встречается во фразе реже всего. Если редких слов несколько, нужно вывести то, которое меньше в лексикографическом порядке. Регистр слов не учитывается, знаки препинания в предложениях игнорируются.

In [19]:
from collections import Counter

d = Counter(input().split())
print(min(d, key=lambda x: (d[x], x)))

aa
