# Словари (dict)

Структура данных, позволяющая идентифицировать ее элементы не по числовому индексу, а по произвольному, называется **словарем** или **ассоциативным массивом**.

```python
{<ключ1>: <значение1>, <ключ2>: <значение2>, ...}

In [2]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

print(capitals)

print(capitals['USA'])

{'USA': 'Washington DC', 'India': 'New Delhi', 'China': 'Beijing', 'Russia': 'Moscow'}
Washington DC


In [4]:
capitals = dict()

capitals['USA'] = 'Washington DC'
capitals['India'] = 'New Delhi'
capitals['China'] = 'Beijing'
capitals['Russia'] = 'Moscow'

print(capitals)

{'USA': 'Washington DC', 'India': 'New Delhi', 'China': 'Beijing', 'Russia': 'Moscow'}


* Подсчет значений (частотный анализ). Ключи - сами значения, значения - количество повторений.
* Хранение связанных данных. Ключи - сами значения, значения - другие значения. Например, название месяца и порядковы номер месяца.
* Установка соответствия между объектами (родитель-потомок)
* Замена обычного списка, если значение максимального индекса велико, но не все индексы будут использоваться. 

In [6]:
capitals = dict(
    [
        ("USA", "Washington DC"),
        ("India", "New Delhi"),
        ("China", "Beijing"),
        ("Russia", "Moscow"),
    ]
)

In [9]:
dict(zip(
    ["USA", "India", "China", "Russia"],
    ["Washington DC", "New Delhi", "Beijing", "Moscow"],
))

{'USA': 'Washington DC',
 'India': 'New Delhi',
 'China': 'Beijing',
 'Russia': 'Moscow'}

In [10]:
dict(zip(
    ["USA", "India", "China", "Russia", "USA"],
    ["Washington DC", "New Delhi", "Beijing", "Moscow", "Washington"],
))

{'USA': 'Washington',
 'India': 'New Delhi',
 'China': 'Beijing',
 'Russia': 'Moscow'}

In [11]:
dict(USA="Washington DC", India="New Delhi", China="Beijing", Russia="Moscow")

{'USA': 'Washington DC',
 'India': 'New Delhi',
 'China': 'Beijing',
 'Russia': 'Moscow'}

## Работа с элементами словаря

In [12]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

capitals['Russia']

'Moscow'

In [13]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

capitals['UK']

KeyError: 'UK'

In [15]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

capitals['Russia'] = 'Petersburg'
capitals['Russia']

'Petersburg'

In [16]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

capitals['UK'] = 'London'
capitals['UK']

'London'

In [18]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

capitals.get("USA")

'Washington DC'

In [19]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

capitals.get("UK")

In [23]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

capitals.get("UK", -1)

-1

In [29]:
s = "dghklakjfhklal;kdlfjoihfkl;dajjkfslkdfbjhjkdls;jsdhokahdsjfmknjkdabvjfhioapkdnfjbdioalskjnfdkjbhdojalkxncbhkjdlkanebjduioscljxkz,.s"

d = dict()
for i in s:
    d[i] = d.get(i, 0) + 1

max(d.items(), key=lambda x: x[1])

('k', 18)

In [31]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

del capitals['USA']
capitals

{'India': 'New Delhi', 'China': 'Beijing', 'Russia': 'Moscow'}

In [32]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

del capitals['UK']
capitals

KeyError: 'UK'

In [34]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

capitals.pop('USA'), capitals

('Washington DC',
 {'India': 'New Delhi', 'China': 'Beijing', 'Russia': 'Moscow'})

In [37]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

capitals.pop('UK', None), capitals

(None,
 {'USA': 'Washington DC',
  'India': 'New Delhi',
  'China': 'Beijing',
  'Russia': 'Moscow'})

## Перебор элементов словаря

In [39]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

for country in capitals:
    print(country, capitals[country])

USA Washington DC
India New Delhi
China Beijing
Russia Moscow


In [41]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

print(capitals.keys())
for country in capitals.keys():
    print(country, capitals[country])

dict_keys(['USA', 'India', 'China', 'Russia'])
USA Washington DC
India New Delhi
China Beijing
Russia Moscow


In [42]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

print(capitals.values())
for capital in capitals.values():
    print(capital)

dict_values(['Washington DC', 'New Delhi', 'Beijing', 'Moscow'])
Washington DC
New Delhi
Beijing
Moscow


In [46]:
capitals = {
    'USA': 'Washington DC',
    'India': 'New Delhi',
    'China': 'Beijing',
    'Russia': 'Moscow'
}

print(capitals.items())
for k, v in capitals.items():
    print(k, v)

dict_items([('USA', 'Washington DC'), ('India', 'New Delhi'), ('China', 'Beijing'), ('Russia', 'Moscow')])
USA Washington DC
India New Delhi
China Beijing
Russia Moscow


In [47]:
list(capitals.items())

[('USA', 'Washington DC'),
 ('India', 'New Delhi'),
 ('China', 'Beijing'),
 ('Russia', 'Moscow')]

In [51]:
capitals[21] = "London"
capitals[(1, 2, 3)] = "Moscow"

capitals

{'USA': 'Washington DC',
 'India': 'New Delhi',
 'China': 'Beijing',
 'Russia': 'Moscow',
 21: 'London',
 (1, 2, 3): 'Moscow'}

## Задачи

Дана строка в виде случайной последовательности чисел от `0` до `9`. 

Требуется создать словарь, который в качестве ключей будет принимать данные числа (т. е. ключи будут типом `int`), а в качестве значений – количество этих чисел в имеющейся последовательности. Для построения словаря создайте функцию `count_it(sequence)`, принимающую строку из цифр. Функция должна возвратить словарь из 3-х самых часто встречаемых чисел.

In [69]:
from random import randint


s = " ".join(str(randint(0, 99_999)) for _ in range(100000))
# s

11

In [76]:
def count_it(sequence):
    sequence = list(map(int, sequence.split()))
    print(len(set(sequence)))
    # print(sequence)

    freq = dict()
    # freq = [0] * 100_000
    for i in sequence:
        freq[i] = freq.get(i, 0) + 1
        # freq[i] += 1

    # print(freq)
    items = list(freq.items())
    items.sort(key=lambda x: x[1])
    # print(items)
    return dict(items[-3:])


count_it(s)

63274


{13416: 7, 294: 7, 49559: 8}

Имеется ряд словарей с пересекающимися ключами (значения - положительные числа). Напишите 2 функции, которые делают с массивом словарей следующие операции:
1-ая функция `max_dct(*dicts)` формирует новый словарь по правилу:

> Если в исходных словарях есть повторяющиеся ключи, выбираем среди их значений максимальное и присваиваем этому ключу (например, в словаре_1 есть ключ “а” со значением 5, и в словаре_2 есть ключ “а”, но со значением 9. Выбираем максимальное значение, т. е. 9, и присваиваем ключу “а” в уже новом словаре).  
>
> Если ключ не повторяется, то он просто переносится со своим значением в новый словарь (например, ключ “с” встретился только у одного словаря, а у других его нет. Следовательно, переносим в новый словарь этот ключ вместе с его значением). Сформированный словарь возвращаем.

2-ая функция `sum_dct(*dicts)` суммирует значения повторяющихся ключей. Значения остальных ключей остаются исходными. (Проводятся операции по аналогу первой функции, но берутся не максимумы, а суммы значений одноименных ключей). Функция возвращает сформированный словарь.

In [78]:
def max_dct(*dicts):
    keys = set()
    for d in dicts:
        keys.update(set(d.keys()))
    print(keys)
    



dict_1 = {1: 12, 2: 33, 3: 10, 4: 10, 5: 2, 6: 90}
dict_2 = {1: 12, 3: 7, 4: 1, 5: 2, 7: 112}
dict_3 = {2: 3, 3: 3, 4: 60, 6: 8, 7: 25, 8: 71}
dict_4 = {3: 1, 4: 13, 5: 31, 9: 9, 10: 556}
max_dct(dict_1, dict_2, dict_3, dict_4)

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
